关于用lucene做网站后台搜索的一点点设想

最近一直在搞lucene和quartz的自动调度。
自己的想法是，
lucene构建index的数据来自数据库中，建立2个索引，一个是正式的索引，还有一个是临时索引，临时索引在每天的凌晨进行索引还有一个合并临时索引和正式索引的类，也在其建立完成之后进行运行。
或者可以在数据量在原有基础上增加了多少的时候进行，临时索引和合并索引，只不过这种方式，首要条件是你的服务器必须强大，因为在建立临时索引和合并索引的时候会很卡。
还有一种方法是比较浙中一点的，首先考虑数据量增加了多少，当达到这个值的时候再在第二天的凌晨进行临时索引和合并索引的工作。
相比之下，第一个在每天数据量增加值不是很大变化的情况下，而第二种方法则偏重于数据量增加不能确定的情况下，也就是浮动很大。
第三种方案，数据增加量也是一个浮动的情况下，第三种方案相比第二种方案，用户在建立临时索引和合并索引的时候可能感觉不到。但是都有一个缺陷，也就是如果在这个增加量的范围内进入的数据不能得到索引，所以最终方案还是采用第一种方法比较合适。

posted on 2009-03-15 13:34 duduli 阅读(328) 评论(0) 编辑收藏所属分类: java

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: android版本二维码名片管理器1.0 版本发布很久没更新了。 java基础方法（九）--数字变成汉字 Java基础方法（八）---图片验证中的图片的产生 java基础方法（七）--Java自己的自动运行（二），当前时间秒钟是否为0 java基础方法（六）--Java自己的自动运行（一） Java基础方法（五）Java中的扩展（二）截取到某个字符串的第n个到第m个 java基础方法（四）java中的截取扩展（一），到第几个你需要查询的字 java基础方法（三）java验证（二）数字相加 java基础类（二）随机插入数字，并对用户的输入进行校验

2009年3月

日

一

二

三

四

五

六

统计

随笔 - 140
文章 - 0
评论 - 211
引用 - 0

公告

welcome to my place.

常用链接

留言簿(5)

我参与的团队

深圳Java俱乐部(0/0)

随笔分类

随笔档案

新闻分类

flex先放一下，struts2重新复习一下 (rss)

石头JAVA摆地摊儿

石头JAVA摆地摊儿
专注于java和设计模式研究

搜索

积分与排名

积分 - 255717
排名 - 220

阅读排行榜

评论排行榜

@duduli