Posted on 2007-01-26 17:36
王睿 阅读(1311)
评论(0) 编辑 收藏 所属分类:
搜索技术
1.
2.0
以前的版本
-
Keyword: Field
的值将被保存到索引文件,为Field的值建立索引,建立索引时不需要分词。
-
UnIndexed: Field
的值将被保存到索引文件,不为Field的值建立索引,因此不能通过该Field搜索文档。
-
UnStored: Field
的值不被保存到索引文件,将Field的值分词后建立索引
-
Text: Field
的值分词后建立索引。如果参数为String值将被保存,为Reader值不被保存
2.
2.0
版本
用几个内部类的组合来区分Field的具体类型。
²
COMPRESS:
压缩保存。用于长文本或二进制数据
²
YES
:保存
²
NO
:不保存
²
NO
:不
建索引
²
TOKENIZED
:分词,
建索引
²
UN_TOKENIZED
:不分词,
建索引
²
NO_NORMS
:不分词,
建索引。但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
²
NO
:
不保存term vectors
²
YES
:
保存term vectors。
²
WITH_POSITIONS
:
保存term vectors。(保存值和token位置信息)
²
WITH_OFFSETS
:
保存term vectors。(保存值和Token的offset)WITH_POSITIONS_OFFSETS:保存term vectors。(保存值和token位置信息和Token的offset)