【机器学习入门】决策树算法(三):C5.0算法

这篇具有很好参考价值的文章主要介绍了【机器学习入门】决策树算法(三):C5.0算法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

简介:

C5.0算法是昆兰在C4.5算法的基础上提出的商用改进版本,目的是对含有大量数据的数据集进行分析。

计算过程:

C5.0算法的训练过程大致如下。

假设训练的样本集S共有n个样本,训练决策树模型的次数为T,用Ct表示t次训练产生的决策树模型,经过T次训练后最终构建的复合决策树模型表示为C*。

【机器学习入门】决策树算法(三):C5.0算法表示第i个样本在第t次模型训练中的权重(i=1,2,3,…,n;t=1,2,3,…,T);

【机器学习入门】决策树算法(三):C5.0算法表示【机器学习入门】决策树算法(三):C5.0算法归一化因子,再用βt表示权重值的调整因子,并定义0-1函数:

【机器学习入门】决策树算法(三):C5.0算法

表示第i个第t次训练的分类结果,最后进行如下步骤样本训练。

① 初始化参数:设定训练决策树模型次数T(T一般默认为10),并赋予每个训练样本相同的权重值【机器学习入门】决策树算法(三):C5.0算法=1/n,令t=1开始第一次训练。

② 计算每个样本的归一化因子值

【机器学习入门】决策树算法(三):C5.0算法

并且,使其满足

【机器学习入门】决策树算法(三):C5.0算法

③ 为每个样本赋予归一化的权重值【机器学习入门】决策树算法(三):C5.0算法,构建当前的决策树模型Ct。

④ 计算第t次训练分类错误率

【机器学习入门】决策树算法(三):C5.0算法

⑤ 分支:如果εt>0.5,修改训练次数T=T−1,返回步骤①重新训练;

如果εt=0,结束整个训练,令t=T转入步骤⑧;

如果0<εt≤0.5,转入步骤⑥。

⑥ 计算调整因子:用错误率计算本次训练调整因子βt=εt/(1-εt),错误率高,调整因子高

⑦ 更新样本权重值

【机器学习入门】决策树算法(三):C5.0算法

,调低被正确分类样本的权重值。

⑧ 结束判断:如果t=T,结束训练过程转入⑨,否则令t=t+1,返回步骤②。

⑨ 复合模型:最终根据

【机器学习入门】决策树算法(三):C5.0算法

计算求得复合决策树模型。

C5.0算法的优缺点:

优点:

  • 构建决策树的时间更快,生成的决策树规模更小;

  • 可以处理数据遗漏和输入字段很多的问题;

  • 可以自动修剪决策树,提高分类精度;

缺点:

  • 对于连续型变量,需要进行离散化处理;

  • 对于噪声数据和异常值敏感。

C5.0算法相较于C4.5算法的提升:

  • 执行效率更高,内存使用更少

  • 生成的决策树更小,拥有更少的叶子结点

  • 支持Boosting技术,提高分类精度

  • 支持加权和成本敏感学习


借鉴:《机器学习》

吴恩达 机器学习课程文章来源地址https://www.toymoban.com/news/detail-478725.html

到了这里,关于【机器学习入门】决策树算法(三):C5.0算法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 机器学习算法 决策树

    决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据。 决策树算法的本质是一种图结构,我们只需要问一系列问题就

    2023年04月23日
    浏览(48)
  • ML:机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等

    ML:机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等) 目录

    2024年02月09日
    浏览(64)
  • 【机器学习】十大算法之一 “决策树”

    作者主页: 爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主 爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域. https://blog.csdn.net/Code_and516?type=blog 个人简介:打工人。 持续分享

    2024年02月11日
    浏览(43)
  • 机器学习算法系列(四)-- 决策树

    最经典的机器学习模型之一,成树型结构,决策树的目的是为了产生一颗泛化能力强,处理未见实例能力强的树,通过特征判断不断分类,基本流程遵循“分而治之”的递归分类策略。 关键 就是选取对训练数据具有分类能力的特征,可提高决策树学习的效率。通常特征选择

    2023年04月23日
    浏览(40)
  • 《机器学习核心技术》分类算法 - 决策树

    「作者主页」: 士别三日wyx 「作者简介」: CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」: 小白零基础《Python入门到精通》 决策树是一种 「二叉树形式」 的预测模型,每个 「节点」 对应一个 「判断条件」 , 「满足」 上一个条件才

    2024年02月11日
    浏览(57)
  • 传统机器学习(五)决策树算法(一)

    ​ 可以参考:机器学习实战(二)决策树-分类树(海洋生物数据集案例) 分类树参数如下 回归树DecisionTreeRegressor的入参与分类树基本相同,不同之处在于: criterion可选值:mse:默认,均方差,mae:平均绝对差,friedman_mse 没有class_weight 用sklearn建好决策树后,可以打印出树的

    2023年04月22日
    浏览(45)
  • 机器学习——决策树1(三种算法)

    要开始了…内心还是有些复杂的 因为涉及到熵…单纯的熵,可以单纯 复杂的熵,如何能通俗理解呢… 我也没有底气,且写且思考吧 首先,决策树的思想,有点儿像KNN里的KD树。 KNN里的KD树,是每次都根据某个特征,来将所有数据进行分类。 决策树也是,每次都根据某个特征

    2024年02月12日
    浏览(43)
  • 机器学习实战3-利用决策树算法根据天气数据集做出决策

    大家好,我是微学AI,今天给大家介绍一下机器学习实战3-利用决策树算法根据天气数据集做出决策,决策树是一种广泛使用的机器学习算法,用于分类和回归问题。它的基本思想是通过对数据进行分而治之,把复杂的问题转化为简单的决策序列。 一、决策树的介绍 对于决策

    2024年02月08日
    浏览(44)
  • 机器学习基础之《分类算法(6)—决策树》

    一、决策树 1、认识决策树 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 2、一个对话的例子 想一想这个女生为什么把年龄放在最上面判断!!! 如何高效的进行决策?特征的先后顺序

    2024年02月09日
    浏览(50)
  • 决策树:理解机器学习中的关键算法

    决策树是一种流行而强大的机器学习算法,它从数据中学习并模拟决策过程,以便对新的未知数据做出预测。由于其直观性和易理解性,决策树成为了分类和回归任务中的首选算法之一。在本文中,我们将深入探讨决策树的工作原理、如何构建决策树、它们的优缺点,以及在

    2024年01月18日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包