这是最基础的入门算法,属于有监督学习,主要用途进行分类
流程
1:获取样本数据集(包括分类标签和特征属性值)
2:获取待预测数据集的特征值,通过与样本数据集的特征进行比较
3:然后算法提取样本集中特征最相似数据的分类标签
4:一般只提取样本数据集中前K个最相似的数据分类标签,这就是k-邻近算法的出处,通常k是不大于20的整数
5:最后从K数据里面提取出现次数最多的分类标签,作为待预测数据集的分类标签,即完成实际分类业务
通俗说法
1:拿一堆水果
2:拿一个未知水果
3:根据未知水果的特征与每一种水果的特征进行比较
4:取出最相似的前K个水果,这个K通常是不大于20的整数
5:从这K个水果里面,提取出出现次数最多的水果A
6:把这个未知水果归结为水果A
7:完成分类
posted on 2017-08-01 12:02
朔望魔刃 阅读(141)
评论(0) 编辑 收藏 所属分类:
python