随笔-95  评论-31  文章-10  trackbacks-0
这是最基础的入门算法,属于有监督学习,主要用途进行分类

流程
1:获取样本数据集(包括分类标签和特征属性值)
2:获取待预测数据集的特征值,通过与样本数据集的特征进行比较
3:然后算法提取样本集中特征最相似数据的分类标签
4:一般只提取样本数据集中前K个最相似的数据分类标签,这就是k-邻近算法的出处,通常k是不大于20的整数
5:最后从K数据里面提取出现次数最多的分类标签,作为待预测数据集的分类标签,即完成实际分类业务

通俗说法
1:拿一堆水果
2:拿一个未知水果
3:根据未知水果的特征与每一种水果的特征进行比较
4:取出最相似的前K个水果,这个K通常是不大于20的整数
5:从这K个水果里面,提取出出现次数最多的水果A
6:把这个未知水果归结为水果A
7:完成分类
posted on 2017-08-01 12:02 朔望魔刃 阅读(144) 评论(0)  编辑  收藏 所属分类: python

只有注册用户登录后才能发表评论。


网站导航: