K近邻算法
1.K近邻算法(KNN)的思想
存在一个数据样本集合,也称做训练样本集合,样本集里面每个数据都有自己的标签(标签可以看做是分类信息),输入没有标签的新数据后,我们需要知道这个新数据是属于哪一类的,可以将新数据的特征与原来样本数据中的特征进行比较,样本中提取特征最相似的数据,然后算法提取样本集中最相似的数据的标签,一般来说,我们只选择样本集中前k个数据(比如距离未知数据距离最近的前k个数据),看看这前k个数据中,哪种分类最多,最多的分类便是未知数据的分类 存在一个数据样
存在一个数据样本集合,也称做训练样本集合,样本集里面每个数据都有自己的标签(标签可以看做是分类信息),输入没有标签的新数据后,我们需要知道这个新数据是属于哪一类的,可以将新数据的特征与原来样本数据中的特征进行比较,样本中提取特征最相似的数据,然后算法提取样本集中最相似的数据的标签,一般来说,我们只选择样本集中前k个数据(比如距离未知数据距离最近的前k个数据),看看这前k个数据中,哪种分类最多,最多的分类便是未知数据的分类 存在一个数据样