K-Menas算法

一、算法简介
　k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。

二、伪码

算法：K-means。

输入：

K：聚类的数目

D：包含n个对象的数据集

输出：K个聚类的集合

方法：

（1）从D中任意选择K个对象作为初始聚类中心；

（2） repeat

根据聚类中对象的均值，将每个对象（再）指派到最相似的聚类；

更新聚类均值，即计算每个聚类中对象的均值；

（3） until聚类不再发生变化

算法复杂度为: O(nkt).其中t为迭代次数

三、准确性评价

四、应用和扩展

posted on 2011-01-04 11:05 XXXXXX 阅读(508) 评论(0) 编辑收藏所属分类: Algorithm


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: Trie Tree Bloom Filter 【编程珠现】-算法设计技术【编程珠玑】-啊哈！算法【编程珠玑】-开篇 K-Menas算法打印全排列