【机器学习入门】决策树算法（三）：C5.0算法

1年前作者：学不死的狗分类：Toy博客阅读(9)违法举报

这篇具有很好参考价值的文章主要介绍了【机器学习入门】决策树算法（三）：C5.0算法。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

简介：

C5.0算法是昆兰在C4.5算法的基础上提出的商用改进版本，目的是对含有大量数据的数据集进行分析。

计算过程：

C5.0算法的训练过程大致如下。

假设训练的样本集S共有n个样本，训练决策树模型的次数为T，用Ct表示t次训练产生的决策树模型，经过T次训练后最终构建的复合决策树模型表示为C*。

用【机器学习入门】决策树算法（三）：C5.0算法表示第i个样本在第t次模型训练中的权重（i=1，2，3，…，n；t=1，2，3，…，T）;

用【机器学习入门】决策树算法（三）：C5.0算法表示的归一化因子，再用βt表示权重值的调整因子，并定义0-1函数：

【机器学习入门】决策树算法（三）：C5.0算法

表示第i个第t次训练的分类结果，最后进行如下步骤样本训练。

① 初始化参数：设定训练决策树模型次数T（T一般默认为10），并赋予每个训练样本相同的权重值【机器学习入门】决策树算法（三）：C5.0算法 =1/n，令t=1开始第一次训练。

② 计算每个样本的归一化因子值

【机器学习入门】决策树算法（三）：C5.0算法

并且，使其满足

【机器学习入门】决策树算法（三）：C5.0算法

③ 为每个样本赋予归一化的权重值【机器学习入门】决策树算法（三）：C5.0算法，构建当前的决策树模型Ct。

④ 计算第t次训练分类错误率

【机器学习入门】决策树算法（三）：C5.0算法

⑤ 分支：如果εt>0.5，修改训练次数T=T−1，返回步骤①重新训练；

如果εt=0，结束整个训练，令t=T转入步骤⑧；

如果0<εt≤0.5，转入步骤⑥。

⑥ 计算调整因子：用错误率计算本次训练调整因子βt=εt/(1-εt)，错误率高，调整因子高。

⑦ 更新样本权重值

【机器学习入门】决策树算法（三）：C5.0算法

，调低被正确分类样本的权重值。

⑧ 结束判断：如果t=T，结束训练过程转入⑨，否则令t=t+1，返回步骤②。

⑨ 复合模型：最终根据

【机器学习入门】决策树算法（三）：C5.0算法

计算求得复合决策树模型。

C5.0算法的优缺点：

优点：

构建决策树的时间更快，生成的决策树规模更小；

可以处理数据遗漏和输入字段很多的问题；

可以自动修剪决策树，提高分类精度；

缺点：

对于连续型变量，需要进行离散化处理；

对于噪声数据和异常值敏感。

C5.0算法相较于C4.5算法的提升：

执行效率更高，内存使用更少

生成的决策树更小，拥有更少的叶子结点

支持Boosting技术，提高分类精度

支持加权和成本敏感学习

借鉴：《机器学习》

吴恩达机器学习课程文章来源地址https://www.toymoban.com/news/detail-478725.html

到了这里，关于【机器学习入门】决策树算法（三）：C5.0算法的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

经典机器学习算法——决策树
优质博文：IT-BLOG-CN 树模型是机器学习中最常用的一类模型，包括随机森林、AdaBoost、GBDT（XGBoost和Lightgbm）等，基本原理都是通过集成弱学习器的即式来进一步提升准确度。这里的弱学习器包括线性模型和决策树模型，本期介绍的就是决策树模型（DecisionTree）。决策树属于有
2024年04月29日
浏览(8)
ML：机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等
ML：机器学习中有监督学习算法的四种最基础模型的简介(基于概率的模型、线性模型、树模型-树类模型、神经网络模型)、【线性模型/非线性模型、树类模型/基于样本距离的模型】多种对比(假设/特点/决策形式等) 目录
2024年02月09日
浏览(40)
【机器学习】十大算法之一 “决策树”
作者主页：爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域. https://blog.csdn.net/Code_and516?type=blog 个人简介：打工人。持续分享
2024年02月11日
浏览(8)
机器学习算法系列（四）-- 决策树
最经典的机器学习模型之一，成树型结构，决策树的目的是为了产生一颗泛化能力强，处理未见实例能力强的树，通过特征判断不断分类，基本流程遵循“分而治之”的递归分类策略。关键就是选取对训练数据具有分类能力的特征，可提高决策树学习的效率。通常特征选择
2023年04月23日
浏览(11)
机器学习——决策树1（三种算法）
要开始了…内心还是有些复杂的因为涉及到熵…单纯的熵，可以单纯复杂的熵，如何能通俗理解呢… 我也没有底气，且写且思考吧首先，决策树的思想，有点儿像KNN里的KD树。 KNN里的KD树，是每次都根据某个特征，来将所有数据进行分类。决策树也是，每次都根据某个特征
2024年02月12日
浏览(8)
传统机器学习(五)决策树算法(一)
可以参考：机器学习实战（二）决策树-分类树（海洋生物数据集案例）分类树参数如下回归树DecisionTreeRegressor的入参与分类树基本相同，不同之处在于： criterion可选值：mse:默认，均方差，mae：平均绝对差，friedman_mse 没有class_weight 用sklearn建好决策树后，可以打印出树的
2023年04月22日
浏览(10)
《机器学习核心技术》分类算法 - 决策树
「作者主页」：士别三日wyx 「作者简介」： CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者「推荐专栏」：小白零基础《Python入门到精通》决策树是一种「二叉树形式」的预测模型，每个「节点」对应一个「判断条件」，「满足」上一个条件才
2024年02月11日
浏览(16)
机器学习实战3-利用决策树算法根据天气数据集做出决策
大家好，我是微学AI，今天给大家介绍一下机器学习实战3-利用决策树算法根据天气数据集做出决策，决策树是一种广泛使用的机器学习算法，用于分类和回归问题。它的基本思想是通过对数据进行分而治之，把复杂的问题转化为简单的决策序列。一、决策树的介绍对于决策
2024年02月08日
浏览(19)
机器学习基础之《分类算法（6）—决策树》
一、决策树 1、认识决策树决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-else结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法 2、一个对话的例子想一想这个女生为什么把年龄放在最上面判断！！！如何高效的进行决策？特征的先后顺序
2024年02月09日
浏览(9)
机器学习算法之决策树（decision tree）
决策树(Decision Tree,又称为判定树)算法是机器学习中常见的一类算法，是一种以树结构形式表达的预测分析模型。决策树属于监督学习（Supervised learning），根据处理数据类型的不同，决策树又为分类决策树与回归决策树。最早的的决策树算法是由Hunt等人于1966年提出，Hunt算法
2024年02月13日
浏览(8)