机器学习之K-邻近算法

这是最基础的入门算法，属于有监督学习，主要用途进行分类

流程
1：获取样本数据集(包括分类标签和特征属性值)
2：获取待预测数据集的特征值，通过与样本数据集的特征进行比较
3：然后算法提取样本集中特征最相似数据的分类标签
4：一般只提取样本数据集中前K个最相似的数据分类标签，这就是k-邻近算法的出处，通常k是不大于20的整数
5：最后从K数据里面提取出现次数最多的分类标签，作为待预测数据集的分类标签，即完成实际分类业务

通俗说法
1：拿一堆水果
2：拿一个未知水果
3：根据未知水果的特征与每一种水果的特征进行比较
4：取出最相似的前K个水果，这个K通常是不大于20的整数
5：从这K个水果里面，提取出出现次数最多的水果A
6：把这个未知水果归结为水果A
7：完成分类

posted on 2017-08-01 12:02 朔望魔刃阅读(144) 评论(0) 编辑收藏所属分类: python

常用链接

留言簿

随笔分类

随笔档案

文章分类

文章档案

收藏夹

娱乐博客

牛博

搜索

最新评论

阅读排行榜

评论排行榜


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: 机器学习之K-邻近算法机器学习流程-入门 eclipse+pyDev+Django