经典案例——利用 KNN算法对鸢尾花进行分类

这篇具有很好参考价值的文章主要介绍了经典案例——利用 KNN算法对鸢尾花进行分类。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

经典案例——利用 KNN算法对鸢尾花进行分类,算法,人工智能,机器学习

实现流程：

1、获取数据集

2、数据基本处理

3、数据集预处理-数据标准化

4、机器学习（模型训练）

5、模型评估

6、模型预测

具体API：

1、获取数据集

# 1、加载数据集
from sklearn.datasets import load_iris
iris = load_iris()

查看各项属性

# 查看目标值
iris.target

# 查看目标值名
print(iris.target_names)

# 查看特征名
iris.feature_names

# 查看数据
iris.data

# 查看数据集描述
iris.DESCR

# 数据文件路径
iris.filename

2、数据基本处理

# 2、对数据做简单的可视化
# 2.1 导包
import seaborn as sns
import pandas as pd

# 2.2 将数据转成 DF格式，设置data, columns属性、目标值名称
iris_df = pd.DataFrame(iris.data,columns=iris.feature_names)
iris_df['label'] = iris.target
iris_df

# 2.3 用lmplot做可视化
sns.lmplot(data=iris_df,x='sepal length (cm)',y='petal width (cm)', hue='label', fit_reg=False) # fit_reg=默认会拟合一个回归直线

经典案例——利用 KNN算法对鸢尾花进行分类,算法,人工智能,机器学习

# 查看数据详情
iris_df.describe()

# 3、划分训练集、测试集
# 3.1 导包
from sklearn.model_selection import train_test_split

# 3.2 实现划分
X_train,X_test,y_train,y_test = train_test_split(iris.data, iris.target,test_size=0.2,random_state=21)

3、数据集预处理-数据标准化

# 4、特征工程
# 4.1 导包
from sklearn.preprocessing import StandardScaler

# 4.2 数据集预处理-数据标准化
scaler = StandardScaler()  

scaler.fit(X_train)  # 计算均值、方差

X_train_scaled = scaler.transform(X_train)

# 4.3 让测试集的均值和方法, 转换测试集数据
X_test_scaled = scaler.transform(X_test)   # 做标准化计算

4、机器学习（模型训练）

# 5、模型训练
# KNN导包
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)

# 使用标准化之后的特征值，进行模型训练
knn.fit(X_train_scaled, y_train)

5、模型评估及预测文章来源地址https://www.toymoban.com/news/detail-783488.html

# 6、模型评价
# 导包
from sklearn.metrics import accuracy_score

# 用训练好的模型，对训练集进行分类预测
y_train_pred = knn.predict(X_train_scaled)

# 用训练好的模型，对测试集进行分类预测
y_test_pred = knn.predict(X_test_scaled)

# 利用模型输出的结果 和真实标签进行比较，两者一致，则模型分类正确
accuracy_score(y_train,y_train_pred)

accuracy_score(y_test,y_test_pred)

到了这里，关于经典案例——利用 KNN算法对鸢尾花进行分类的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！