疯子和天才只一步之差,奋起直追,提升自我,坚持不懈,永不言弃!
· [置顶] 欢迎到我开设的论坛:http://bbs.thinksoar.com
· Lucene的Highlighter实现文件摘要的自动提取
· Ubuntu 8.04 Linux + Apache2 + MySQL5 + PHP + Tomcat5.5 整合安装
2008-8-15 23:35:06 阅读(186) 评论(0)
欢迎访问我开设的论坛:http://bbs.thinksoar.com,里面应该有你需要的技术、管理方面的资料。包括技术文章、源码下载、电子书下载、视频教程下载,也欢迎参与我们的开源项目:myblog和TSForum论坛程序,程序均采用Spring 2.5.5+hibernate 3.2.2+Freemarker+Spring MVC 以及使用spring security 2.0.3进行开发,欢迎参与项目的开发,谢谢!详细的安排请到论坛查看。这里顺便截下图,更多的原创源码与视频,文章会发布,敬请关注,谢谢!!!
2008-7-23 9:51:01 阅读(391) 评论(1)
使用Lucene自带的Highlighter就可以实现对原始文件摘要的提取工作。Highlighter类有一个getBestFragment方法,这个方法有多个重载的方法,其中,使用:
public final String getBestFragment(Analyzer analyzer, String fieldName,String text)
就可以提取摘要,它实现了从指定的原始文件中,提取检索关键字出现频率最高的一段文字作为摘要,默认情况下提取100个字符,同时加上自定义的高亮显示代码,又可实现关键字高亮显示。
测试程序如下所示:
package org.shirdrn.lucene.learn.digest;
import java.io.IOException;
import net.teamhot.lucene.ThesaurusAnalyzer;
2008-7-23 9:47:45 阅读(514) 评论(1)
2008-7-23 9:46:51 阅读(1113) 评论(0)
当执行Hits htis = search(query);这一行代码的时候,到底中间经过了怎样的过程,最终使得我们获取到了含有检索结果的集合Hits hits呢?
这里,以最简单的检索为例,追踪并理解Lucene(2.2.0版本)获取到检索结果的过程。
1、IndexSearcher继承自Searcher类的最简单的search方法,如下所示:
public final Hits search(Query query) throws IOException {
return search(query, (Filter)null);
}
2008-6-27 15:07:27 阅读(127) 评论(0)
2008-6-3 15:10:12 阅读(756) 评论(2)
总结如下:
安装环境:
JDK 1.5.05
tomcat-5.5.17
mysql-5.0.27
apache-roller-4.0
安装使用的是 msyql 数据库,现建立数据库和用户
mysql> create database rollerdb default charset utf8 collate utf8_general_ci;
2008-5-28 10:17:54 阅读(82) 评论(0)
安德森认为,免费经济学带来的新商业模式,林林总总,不一而足,但目前来看,无外乎以下六个大类——
“Freemium”
免费:网络软件和服务
面向:初级版用户
最常见的互联网商业模式:软件、服务或内容分为几类,既有免费的(free)
2008-5-27 22:19:03 阅读(122) 评论(0)
原文(英文)地址: http://www.mnot.net/cache_docs/ 版权声明:署名-非商业性使用-禁止演绎 2.0
这是一篇知识性的文档,主要目的是为了让Web缓存相关概念更容易被开发者理解并应用于实际的应用环境中。为了简要起见,某些实现方面的细节被简化或省略了。如果你更关心细节实现则完全不必耐心看完本文,后面参考文档和更多深入阅读部分可能是你更需要的内容。
2008-5-26 23:49:50 阅读(458) 评论(1)
2008-5-23 14:06:55 阅读(110) 评论(0)