经典案例——利用 KNN算法 对鸢尾花进行分类

这篇具有很好参考价值的文章主要介绍了经典案例——利用 KNN算法 对鸢尾花进行分类。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

经典案例——利用 KNN算法 对鸢尾花进行分类,算法,人工智能,机器学习

实现流程:

        1、获取数据集

        2、数据基本处理

        3、数据集预处理-数据标准化

        4、机器学习(模型训练)

        5、模型评估

        6、模型预测

具体API:

1、获取数据集

# 1、加载数据集
from sklearn.datasets import load_iris
iris = load_iris()

 查看各项属性

# 查看目标值
iris.target

# 查看目标值名
print(iris.target_names)

# 查看特征名
iris.feature_names

# 查看数据
iris.data

# 查看数据集描述
iris.DESCR

# 数据文件路径
iris.filename

 2、数据基本处理

# 2、对数据做简单的可视化
# 2.1 导包
import seaborn as sns
import pandas as pd
# 2.2 将数据转成 DF格式,设置data, columns属性、目标值名称
iris_df = pd.DataFrame(iris.data,columns=iris.feature_names)
iris_df['label'] = iris.target
iris_df

# 2.3 用lmplot做可视化
sns.lmplot(data=iris_df,x='sepal length (cm)',y='petal width (cm)', hue='label', fit_reg=False) # fit_reg=默认会拟合一个回归直线

经典案例——利用 KNN算法 对鸢尾花进行分类,算法,人工智能,机器学习

 

# 查看数据详情
iris_df.describe()
# 3、划分训练集、测试集
# 3.1 导包
from sklearn.model_selection import train_test_split

# 3.2 实现划分
X_train,X_test,y_train,y_test = train_test_split(iris.data, iris.target,test_size=0.2,random_state=21)

3、数据集预处理-数据标准化 

# 4、特征工程
# 4.1 导包
from sklearn.preprocessing import StandardScaler

# 4.2 数据集预处理-数据标准化
scaler = StandardScaler()  

scaler.fit(X_train)  # 计算均值、方差

X_train_scaled = scaler.transform(X_train)

# 4.3 让测试集的均值和方法, 转换测试集数据
X_test_scaled = scaler.transform(X_test)   # 做标准化计算

4、机器学习(模型训练) 

# 5、模型训练
# KNN导包
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)

# 使用标准化之后的特征值,进行模型训练
knn.fit(X_train_scaled, y_train)

5、模型评估 及 预测文章来源地址https://www.toymoban.com/news/detail-783488.html

# 6、模型评价
# 导包
from sklearn.metrics import accuracy_score

# 用训练好的模型,对训练集进行分类预测
y_train_pred = knn.predict(X_train_scaled)

# 用训练好的模型,对测试集进行分类预测
y_test_pred = knn.predict(X_test_scaled)

# 利用模型输出的结果 和真实标签进行比较,两者一致,则模型分类正确
accuracy_score(y_train,y_train_pred)

accuracy_score(y_test,y_test_pred)

到了这里,关于经典案例——利用 KNN算法 对鸢尾花进行分类的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MapReduce实现KNN算法分类推测鸢尾花种类

    https://gitcode.net/m0_56745306/knn_classifier.git 该部分内容参考自:https://zhuanlan.zhihu.com/p/45453761 KNN(K-Nearest Neighbor) 算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类,也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。 KNN算法的思想非常简单:对于任

    2024年02月08日
    浏览(47)
  • 机器学习之Python使用KNN算法对鸢尾花进行分类

    要求: (1)数据集划分为测试集占20%; (2)n_neighbors=5; (3)评价模型的准确率; (4)使用模型预测未知种类的鸢尾花。 (待预测数据:X1=[[1.5 , 3 , 5.8 , 2.2], [6.2 , 2.9 , 4.3 , 1.3]]) iris数据集有150组,每组4个数据。 第一步:引入所需库 第二步:划分测试集占20% test_size为

    2024年02月08日
    浏览(40)
  • 机器学习与深度学习——通过knn算法分类鸢尾花数据集iris求出错误率并进行可视化

    什么是knn算法? KNN算法是一种基于实例的机器学习算法,其全称为K-最近邻算法(K-Nearest Neighbors Algorithm)。它是一种简单但非常有效的分类和回归算法。 该算法的基本思想是:对于一个新的输入样本,通过计算它与训练集中所有样本的距离,找到与它距离最近的K个训练集样

    2024年02月03日
    浏览(41)
  • 【机器学习】决策树案例二:利用决策树进行鸢尾花数据集分类预测

    手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/article/details/122045161(CSDN博主:Be_melting) 在进行逻辑回归分类的过程中已经有使用过iris数据集,这里直接加载数据,并进行字段名称的修改。 输出结果如下。 通过info()方法查看各个字段的基本详情,输出结果如下。

    2024年02月08日
    浏览(46)
  • 【机器学习案例】不同的模型算法对鸢尾花数据集进行分类

    经典机器学习入门项目,使用逻辑回归、线性判别分析、KNN、分类与回归树、朴素贝叶斯、向量机、随机森林、梯度提升决策树对不同占比的训练集进行分类 数据源 :Iris Species | Kaggle 150行,5列,分三种鸢尾花类型,每种类型50个样本,每行数据包含花萼长度、花萼宽度、花

    2024年02月04日
    浏览(34)
  • 【数据结构与算法】三个经典案例带你了解动态规划

    从表中我们可以看到,最大的公共子串长度为2,一共有两个长度为2的公共子串,分别是第一个字符串的第2个字符到第3个字符和第一个字符串的第3个字符到第4个字符,即 ba 和 ac 根据上面的方法,我们来用代码封装一下求取最大公共子串的函数 function publicStr(s1, s2) { // 创建

    2024年04月09日
    浏览(95)
  • [Python从零到壹] 七十三.图像识别及经典案例篇之图像去雾ACE算法和暗通道先验去雾算法实现

    十月太忙,还是写一篇吧!祝大家1024节日快乐O(∩_∩)O 欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解,真心想把自己近十年的编程经验分享给大家

    2024年01月17日
    浏览(49)
  • K-Means算法实现鸢尾花数据集聚类

    张勇,男,西安工程大学电子信息学院,2022级研究生 研究方向:智能信息处理与信息系统研究 电子邮件:17605542959@163.com 陈梦丹,女,西安工程大学电子信息学院,2022级硕士研究生,张宏伟人工智能课题组 研究方向:机器视觉与人工智能 电子邮件:1169738496@qq.com K-Means聚类

    2024年02月07日
    浏览(43)
  • python机器学习(三)特征预处理、鸢尾花案例--分类、线性回归、代价函数、梯度下降法、使用numpy、sklearn实现一元线性回归

    数据预处理的过程。数据存在不同的量纲、数据中存在离群值,需要稳定的转换数据,处理好的数据才能更好的去训练模型,减少误差的出现。 标准化 数据集的标准化对scikit-learn中实现的大多数机器学习算法来说是常见的要求,很多案例都需要标准化。如果个别特征或多或

    2024年02月16日
    浏览(46)
  • 多线程四大经典案例

    本节内容很重要, 希 望 大 家 可 以 好 好 看 看 , 一 起 加 油~ 1.单线模式 1.1饿汉模式 1.2懒汉模式 2.阻塞式队列 2.1阻塞队列是什么 2.2生产者消费者模型 2.3标准库中的阻塞队列 2.4阻塞队列的实现 3.定时器 3.1定时器是什么 3.2标准库中的定时器 3.3实现定时器 4.线程池 4.1什么

    2023年04月27日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包