新的project需要做全文检索,老板提示用Lucene,down来先研究了一番,发现不支持中文,于是搜到webLucene,一个在lucene基础上扩展的开源项目。
花了一个下午,把webLucene环境搭好了,看看我需要的功能:中文分词、数据库为数据源、按类别搜索、以web展示结果 都有了,唯一需要解决的就是服务器cluster时index的更新问题了。这个目前的想法比较简单,每个instance用自己的index file,在数据库里做标志位,每个instance都定期来查一遍,如果需要更新则更新自己的index。对我们这个实时性要求并不是那么高的search来说,已经够了
ps 不知道是不是chedong同志一个人更新精力不够的原因,webLucene文档——指install——似乎跟实际的东西还有些差别,不过,基本上自己也能找到原因小改一点就好了,开源的东东总不能要求像商务软件那样事无巨细的手把手教你。。。还有,如果用最新版的lucene(1.4)会有问题,有一个方法跟老版本的lucene不太一样,必须使用webLucene包里lib下面那个lucene.jar。回头等俺改的时候瞅瞅这个~~~
昨天还满头的雾水的俺开始有点头绪了,虽然对lucene的机制还不是很清楚,但是就weblucene这个架子已经够俺用了,先在他基础上修改再来定制俺的东西看起来还是比较容易di,hoho,还是站在前人的肩膀上做事比较轻松~~~前途还是光明di,俺做个几天前对搜索还是一无所知的yin要做完这个全文检索还是有可能di~~ ha ha ha,大笑三声
posted on 2005-12-07 18:50
绿芽 阅读(849)
评论(5) 编辑 收藏