机器学习基础之《分类算法(1)—sklearn转换器和估计器》

这篇具有很好参考价值的文章主要介绍了机器学习基础之《分类算法(1)—sklearn转换器和估计器》。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、转换器

1、什么是转换器
之前做特征工程的步骤:
(1)第一步就是实例化了一个转换器类(Transformer)
(2)第二步就是调用fit_transform,进行数据的转换

2、我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform()
fit()
transform()

3、例子
我们以标准化为例:(x - mean) / std
要进行转化的特征x减去这一列的平均值mean再除以标准差
第一步会执行fit(),计算每一列的平均值、标准差
第二步会执行transform(),用第一步计算出的结果,带入公式,进行最终的转换

二、估计器

1、什么是估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
所有的机器学习算法都被封装到估计器当中

2、用于分类的估计器
(1)sklearn.neighbors:k-邻近算法
(2)sklearn.naive_bayes:朴素贝叶斯
(3)sklearn.linear_model.LogisticRegression:逻辑回归
(4)sklearn.tree:决策树与随机森林

3、用于回归的估计器
(1)sklearn.linear_model.LinearRegression:线性回归
(2)sklearn.linear_model.Ridge:岭回归

4、用于无监督学习的估计器
(1)sklearn.cluster.KMeans:聚类

三、估计器工作流程

1、实例化一个estimator

2、调用estimator.fit(x_train, y_train)  计算
在fit方法中,将训练集的特征值和目标值传进来
调用完毕,意味着模型生成

3、模型评估
(1)直接比对真实值和预测值
说明:x_test测试集、y_predict预测的结果、y_test测试集中的目标值
y_predict = estimator.predict(x_test)
比对  y_test == y_predict

(2)计算准确率
说明:accuracy准确率
accuracy = estimator.score(x_test, y_test)
机器学习基础之《分类算法(1)—sklearn转换器和估计器》,机器学习,机器学习文章来源地址https://www.toymoban.com/news/detail-650178.html

到了这里,关于机器学习基础之《分类算法(1)—sklearn转换器和估计器》的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python机器学习】sklearn.datasets分类任务数据集

    如何选择合适的数据集进行机器学习的分类任务? 选择合适的数据集是进行任何机器学习项目的第一步,特别是分类任务。数据集是机器学习任务成功的基础。没有数据,最先进的算法也无从谈起。 本文将专注于 sklearn.datasets 模块中用于分类任务的数据集。这些数据集覆盖

    2024年02月07日
    浏览(27)
  • 机器学习基础之《分类算法(6)—决策树》

    一、决策树 1、认识决策树 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 2、一个对话的例子 想一想这个女生为什么把年龄放在最上面判断!!! 如何高效的进行决策?特征的先后顺序

    2024年02月09日
    浏览(37)
  • 机器学习基础之《分类算法(3)—模型选择与调优》

    作用是如何选择出最好的K值 一、什么是交叉验证(cross validation) 1、定义 交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成5份,其中一份作为验证集。然后经过5次(组)的测试,每次都更换不同的验证集。即得到5组模型的结果,取平均值作为最终

    2024年02月12日
    浏览(30)
  • 机器学习基础之《分类算法(4)—案例:预测facebook签到位置》

    一、背景 1、说明 2、数据集 row_id:签到行为的编码 x y:坐标系,人所在的位置 accuracy:定位的准确率 time:时间戳 place_id:预测用户将要签到的位置 3、数据集下载 https://www.kaggle.com/navoshta/grid-knn/data 国内下不了,无法收验证码,还是在csdn用积分下一个别人上传的 二、流程

    2024年02月11日
    浏览(22)
  • 文献学习-22-Surgical-VQLA:具有门控视觉语言嵌入的转换器,用于机器人手术中的视觉问题本地化回答

    Authors: Long Bai1† , Mobarakol Islam2† , Lalithkumar Seenivasan3 and Hongliang Ren1,3,4∗ , Senior Member, IEEE Source:  2023 IEEE International Conference on Robotics and Automation (ICRA 2023) May 29 - June 2, 2023. London, UK Abstract: 尽管有计算机辅助模拟器和录制的外科手术视频,但初级住院医师仍然严重依赖专家来回

    2024年03月27日
    浏览(35)
  • 机器学习基础之《回归与聚类算法(4)—逻辑回归与二分类(分类算法)》

    一、什么是逻辑回归 1、逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛 2、叫回归,但是它是一个分类算法 二、逻辑回归的应用场

    2024年02月07日
    浏览(33)
  • 机器学习基础08-模型选择02-分类算法矩阵(基于Pima 数据集)

    算法评估矩阵(Algorithm Evaluation Metrics)用于评估机器学习算法在特定任务上的 性能 。不同的任务可能会使用不同的评估矩阵,因为每个任务的优劣衡量标准都不同。 分类问题或许是最常见的机器学习问题,并且有多种评估矩阵来评估 分类算法。以下几种用来评估分类算法

    2024年02月14日
    浏览(31)
  • 【机器学习基础 3】 sklearn库

    目录 一、sklearn库简介 二、sklearn库安装 三、关于机器学习 四、sklearn库在机器学习中的应用 1、数据预处理 2、特征提取 3、模型选择与评估 五、常用的sklearn函数 1、数据集划分 2、特征选择 3、特征缩放 4、模型训练 5、模型预测         Scikit-learn(简称sklearn)是一个用于

    2024年02月07日
    浏览(132)
  • 【超详细】机器学习sklearn之分类模型评估 混淆矩阵、ROC曲线、召回率与精度、F1分数

    机器学习之分类模型的评估 学习分类模型评估的方法: 1、混淆矩阵 2、分类结果汇总 3、ROC曲线 4、召回率与精度 5、F1分数 一、评估分类器性能的度量 1、真正(true positive, TP)或f++,对应的是被分类模型正确预测的正样本数。 2、假负(false negative, FN)或f±对应的是被分类模型错

    2023年04月08日
    浏览(78)
  • 机器学习基础09-审查分类算法(基于印第安糖尿病Pima Indians数据集)

    算法审查是选择合适的机器学习算法的主要方法之一。审查算法前并 不知道哪个算法对问题最有效,必须设计一定的实验进行验证,以找到对问题最有效的算法。本章将学习通过 scikit-learn来审查六种机器学习的分类算法,通过比较算法评估矩阵的结果,选择合适的算法。 审

    2024年02月11日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包