各种检索系统介绍
|
Smart
|
免费,开源(基于向量空间模型的文本信息检索系统,文档支持不佳,500m以下)
|
|
Okapi系统
|
不免费,不提供源码,
基于概率检索模型
|
|
Lemur Toolkit系统
|
Free,开源,c/c++,
完整的检索系统,也是toolkit,加入语言模型,文档,代码支持良好
|
|
Lucene/nutch
|
索引/这里解释很详细
|
编码和索引结构
|
Delta编码
Vint等
|
|
技术热点
|
自然语言
|
|
概念/LSI
|
|
用户模型
|
|
|
[各种技术的混合]
|
|
索引
|
各种建立索引的数据结构HASH,B+树,R树。。。。。
|
|
这一部分,重点介绍了现成的几个应用系统,特别是luence,还有建立索引的各种数据结构。其中,关于热点部分,可以重点关注下,对自己的研究方向有些指导作用。
/Files/fullfocus/03.pdf
posted on 2008-06-16 23:47
fullfocus 阅读(1470)
评论(1) 编辑 收藏 所属分类:
聚类算法研究