一路拾遗
Collect By Finding All The Way ......
posts - 81,comments - 41,trackbacks - 0
文本聚类是搜索引擎和语义web的基本技术,本文简单的文本聚类算法,对于想学搜索技术的初学者有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。
posted on 2008-08-23 16:54 胖胖泡泡 阅读(132) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航: