k-近邻算法(k-Nearest Neighbors,kNN)
工作原理:
knn算法属于监督类型算法。首先我们有样本训练集,知道每一条数据的分类。继而,我们输入没有分类的新数据,将新数据的每个特征与样本集中的对应项进行比较,提取样本集中最相思的数据,这样我们可以获得该数据的分类。一般来说,我们只选择样本集中前k个最相似的数据,通常k不大于20.最后,选择k个相似数据中出现最多的分类,作为新数据的分类,此为k近邻算法。knn算法
k-近邻算法(k-Nearest Neighbors,kNN)
knn算法属于监督类型算法。首先我们有样本训练集,知道每一条数据的分类。继而,我们输入没有分类的新数据,将新数据的每个特征与样本集中的对应项进行比较,提取样本集中最相思的数据,这样我们可以获得该数据的分类。一般来说,我们只选择样本集中前k个最相似的数据,通常k不大于20.最后,选择k个相似数据中出现最多的分类,作为新数据的分类,此为k近邻算法。knn算法