下面阐述Compass的一些名词:
1:Resource,Compass对Lucene的Document的抽象,与Alias联系在一起。
2:Property,Compass对Lucene的Field的抽象。通过Compass Converter framework将不是String类型的对象转换为可以索引的Property。
3:RSEM:Resource/Search Engine Mapping,资源搜索引擎影射。
4:Lucene采用IndexReader、Searcher、IndexWriter三个类完成索引搜索的功能。而Compass只有一个简单的接口,能够通过该接口实现所有的操作。
5:事务索引和集成:lucene是非事务性的。无法和事务型的系统进行结合。Compass提供两种提交事务:read_committed 和 serializable。
6:快速更新:lucene中,执行更新必须先删除旧的Document,然后再新建一个Document。由于Compass支持事务索引,因此每个要保存的Resource都必须有一个唯一标识。这样更新的效率会更高。
7:All 支持:在lucene中,没有办法对一个Document的所有的字段进行搜索,要对所有字段进行搜索,必须创建一个包含所有field的一个"all"field。compass默认地建立一个"all"属性,并且该"all"属性充当默认的搜索Field,当然,"all"property可以设置成enabled或disabled、重命名或者不充当默认的搜索Property,也可以排除all中的某些属性。
8:索引分块,Lucene基于性能的考虑,索引实际上是一些索引作成。而Compass通过可配置的散列功能自动将索引分块成子索引。可以参考Compass的索引结构。
posted on 2006-09-19 12:47
不做浮躁的人 阅读(2016)
评论(3) 编辑 收藏