尽量保证每一篇文章都是我自己写的,希望每一文章都不浪费大家的时间。

搜索的前提:建立索引

Posted on 2007-01-30 14:10 王睿 阅读(450) 评论(0)  编辑  收藏 所属分类: 搜索技术



建立索引的三大步
index1.1.JPG

1.       数据转换

Lucene 只支持text格式,所以要想对其他非text格式的文档建立索引,首先的进行转换。转换后生成Document对象。

2.       Document 分析

Document 分析的过程是一个规范化,去糟粕取精华的过程。比如:全部转为小写(Wangwang),转为原型(runningrun),去除连接词(aan、的)等等。

3.       写索引文件

以反向索引的数据结构存储。


只有注册用户登录后才能发表评论。


网站导航: