Lucene中Field的类型

Posted on 2007-01-26 17:36 王睿阅读(1311) 评论(0) 编辑收藏所属分类: 搜索技术

1. 2.0 以前的版本

2. 2.0 版本
用几个内部类的组合来区分Field的具体类型。

² COMPRESS: 压缩保存。用于长文本或二进制数据

² YES ：保存

² NO ：不保存

² NO ：不建索引

² TOKENIZED ：分词， 建索引

² UN_TOKENIZED ：不分词， 建索引

² NO_NORMS ：不分词， 建索引。但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间

² NO ：不保存term vectors

² YES ：保存term vectors。

² WITH_POSITIONS ：保存term vectors。（保存值和token位置信息）

² WITH_OFFSETS ：保存term vectors。（保存值和Token的offset）WITH_POSITIONS_OFFSETS：保存term vectors。（保存值和token位置信息和Token的offset）


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: Lucene索引性能调整测试结果提高Lucene索引性能搜索的前提：建立索引 Lucene中Field的类型

2007年1月

日

一

二

三

四

五

六

尽量保证每一篇文章都是我自己写的，希望每一文章都不浪费大家的时间。

JAVA开源与搜索技术