提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

提示:这里可以添加本文要记录的大概内容:

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容,。


一、KNN算法是什么?

KNN 的全称是 K Nearest Neighbors,意思是 K 个最近的邻居。从这个名字我们就能看出一些 KNN 算法的蛛丝马迹了。K 个最近邻居,毫无疑问,K 的取值肯定是至关重要的,那么最近的邻居又是怎么回事呢?其实,KNN 的原理就是当预测一个新的值 x 的时候,根据它距离最近的 K 个点是什么类别来判断 x 属于哪个类别

二、使用步骤

1.引入库

代码如下(示例):

from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
import pandas as pd

2.读入数据

代码如下(示例):

方法一
#导入水果数据并查看数据特征
fruit = pd.read_csv('fruit_data.txt','\t')
fruit1=pd.read_csv('测试集.txt','\t',header=None)# 获取属性
X = fruit.iloc[:,1:]
# 获取类别
Y = fruit.iloc[:,0].T
#训练集
fruit_train_X=X
fruit_train_y=Y
#分类器初始化
knn = KNeighborsClassifier()
#对训练集进行训练
knn.fit(fruit_train_X, fruit_train_y)
#测试集
W=fruit1.iloc[:,1:5]
Z = fruit1.iloc[:,0].T
fruit1_test_X=W
fruit1_test_y=Z
predict_result1 = knn.predict(fruit1_test_X)
#对测试集数据的水果类型进行预测
predict_result = knn.predict(fruit1_test_X)
print('水果测试集大小:',fruit1_test_X.shape)
print('水果真实结果:',fruit1_test_y)
print('水果预测结果:',predict_result1)

方法二

#导入水果数据并查看数据特征

fruit = pd.read_csv('fruit_data.txt','\t')

# 获取属性

X = fruit.iloc[:,1:]

# 获取类别

Y = fruit.iloc[:,0].T

# 划分成测试集和训练集

fruit_train_X,fruit_test_X,fruit_train_y,fruit_test_y=train_test_split(X,Y,test_size=0.2, random_state=0)

#分类器初始化

knn = KNeighborsClassifier()

#对训练集进行训练

knn.fit(fruit_train_X, fruit_train_y)

#对测试集数据的水果类型进行预测

predict_result = knn.predict(fruit_test_X)

print('测试集大小:',fruit_test_X.shape)

print('真实结果:',fruit_test_y)

print('预测结果:',predict_result)

#显示预测精确率

print('预测精确率:',knn.score(fruit_test_X,fruit_test_y))

数据集

http://链接:https://pan.baidu.com/s/1gxL7lJD35E_bq--eyHXzkw
提取码:aabb

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐