青菜猫(孙宇博客),青菜猫(孙宇博客),青菜猫(孙宇博客)http://www.javasdc.cn/
posts - 29,  comments - 63,  trackbacks - 0
前几个月Lucene2.3发布,最大的变化是使用了新的索引算法,使用新的in-memory模型来大幅提升速度。我已经全部的换成Lucene2.3,感觉比以前是快多了,也提供了一些更好的方法:
1.建索引更快,使用新的in-memory模型.
2.已经有了更新索引的方法,例:     doc.add( .....); Term term = new Term("ID", id);writer.updateDocument(term, doc);   这样如果你的索引里有这记录,它会更新操作,如果没有,它会执行增加操作.

3、Object Pool(对象池),Document、Field、Token的instance可以在Indexing过程中reuse,因此大幅提升了分析速度,减少了内存分配次数。说明:类似于java中的Database Connection Pool,可重用,降低数据库连接次数。

4、Reopen IndexReader(重新打开IndexReader),IndexReader类的reopen方法只捕捉索引中变更过的细小Index Segment,而不是重新加载完整的索引。

5、IndexWriter 调整,原来的setMaxBufferedDocs被setRAMBufferSizeMb所取代。

这是lucene2.3更改说明,大家有时间看看吧..





                                                                                                                                                                                                                                   青菜猫(孙宇)
posted on 2008-06-16 22:59 青菜猫(孙宇) 阅读(865) 评论(0)  编辑  收藏 所属分类: 搜索

只有注册用户登录后才能发表评论。


网站导航:
博客园   IT新闻   Chat2DB   C++博客   博问  
 
<2008年6月>
25262728293031
1234567
891011121314
15161718192021
22232425262728
293012345

青菜猫(孙宇)结交天下朋友,在网上吸取知识..

常用链接

留言簿(16)

随笔分类

随笔档案

文章分类

搜索

  •  

最新评论

阅读排行榜

评论排行榜

青菜猫(孙宇博客),青菜猫(孙宇博客),青菜猫(孙宇博客)http://www.javasdc.cn/