聚类算法研究 - 专注创造价值

北大ppt 文本挖掘技术系列之五--TextMining05-聚类

posted @ 2008-06-18 22:13 fullfocus 阅读(1830) | 评论 (0) 编辑

北大ppt 文本挖掘技术系列之四---TextMining04-分类

posted @ 2008-06-18 10:47 fullfocus 阅读(1715) | 评论 (0) 编辑

北大ppt 文本挖掘技术系列之三---TextMining03-检索part2

posted @ 2008-06-16 23:47 fullfocus 阅读(1472) | 评论 (1) 编辑

北大ppt 文本挖掘技术系列之二---TextMining03-检索part1 摘要: 文本检索技术摘要阅读全文

posted @ 2008-06-12 23:12 fullfocus 阅读(2573) | 评论 (4) 编辑

北大ppt 文本挖掘技术系列之一---TextMining02-特征提取---(附：海明距离)

posted @ 2008-06-09 20:38 fullfocus 阅读(1639) | 评论 (0) 编辑

focus聚类研究系列一-----熟悉现有项目基础（站在巨人的肩膀上）摘要: 从现在开始，开始我真正的研究计划：聚类获取有价值的信息。
今天开始详细了解了已有的资源和项目代码，包含中文分词，文档向量化，现有的KA+K-MEANS聚类算法。但是据观察，聚类效果上不是很满意，主要是类簇的关键字抽取不够准确，特征选择尚未考虑，聚类精度需要提高。
以下是现有系统的流程图：明天开始到下周末，研究
1.ka+k-means，其他k-means方法，找出系统不足点
2.研究特征选择方法，提高聚类前数据的质量阅读全文

posted @ 2008-05-09 22:22 fullfocus 阅读(635) | 评论 (2) 编辑

K-MEANS,AHC, single path直观演示---Clustering Web Search Results 摘要: K-MEANS,AHC, single path直观演示---Clustering Web Search Results 阅读全文

posted @ 2008-05-08 15:21 fullfocus 阅读(631) | 评论 (0) 编辑

TF-IDF解释摘要: google的数学之美系列九 -- 如何确定网页和查询的相关性
主要讲解TF-IDF技术，与判断查询相关性。阅读全文

posted @ 2008-05-07 15:38 fullfocus 阅读(2604) | 评论 (0) 编辑

召回率与精度摘要: 一直搞不清搜索引擎的查全率和查准率是什么意思,只知道这两个是衡量一个搜索引擎性能的. 今个看一篇南大的学士论文的时候, 又碰到这个问题. 所以决定把他搞清楚, 上百度搜了一下, 所获很多. 阅读全文

posted @ 2008-05-07 14:35 fullfocus 阅读(2372) | 评论 (4) 编辑

常用链接

留言簿(2)

随笔分类

随笔档案

文章档案

他山之石

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜