统计

留言簿(1)

DB

Others

QA

Tech Website

阅读排行榜

评论排行榜

K-Menas算法


一、算法简介
 k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。


二、伪码

算法:K-means。
输入:
    K:聚类的数目
    D:包含n个对象的数据集
输出:K个聚类的集合
方法:
1)    从D中任意选择K个对象作为初始聚类中心;
2)    repeat
         根据聚类中对象的均值,将每个对象(再)指派到最相似的聚类;
          更新聚类均值,即计算每个聚类中对象的均值;
3)    until聚类不再发生变化

算法复杂度为: O(nkt).其中t为迭代次数

三、准确性评价



四、应用和扩展

posted on 2011-01-04 11:05 XXXXXX 阅读(470) 评论(0)  编辑  收藏 所属分类: Algorithm


只有注册用户登录后才能发表评论。


网站导航: