经过大半个月的努力,终于完成了Lucene.Net 2.1版本的改造。经测试可以完全兼容Java版,生成的索引文件与Java版的完全一样,查询效率很高,不过建立索引的效率相对很低。当然,下一步我会针对相关问题进行改进。
segment:代表一个完整的索引段
.fnm:Document中所有Field的信息,在FieldInfos中写入
.fdt:存储具有Store.YES属性的Field的数据,包括:数量,编号和长度
.fdx:存储Document在.fdt中的位置
.tis:存储分词后的词条(Term)
.tii:tis文件的索引文件,表明了每个tis文件中的词条的位置
.cfs:复合索引文件。建立索引时假如采取符合模式,则以上所有文件都回存储在.cfs文件中
posted on 2007-06-08 08:07
Terry Liang 阅读(2081)
评论(2) 编辑 收藏 所属分类:
Lucene 2.1研究