机器学习——boosting之GBDT-Toy模板网

这篇具有很好参考价值的文章主要介绍了机器学习——boosting之GBDT。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

现在要开始重点关注名字了，名字透漏了很多信息！名字暗藏线索！

GBDT，Gradient Boosting Decision Tree: 梯度提升决策树

果然信息很丰富

梯度：意味着计算有迭代递进关系，但还不明确是怎么迭代递进的
提升：意味着前向分布式+加法模型，并且分类器之间是有相关提升的
决策树：CART决策树、C4.5、忘记名字了…

em…还是要再深挖深挖，小小的boosting，挖呀挖呀挖呀挖。。。
经过推导。。。发现，我的GBDT回归，实际就是上一篇提升树的二叉回归树…
看来可以省点儿功夫，不写代码，但可以稍微推导一下

首先，明确回归问题采用平方损失函数: $Loss(y,f(x)) =(y-f(x))^2$

其中，f(x) 是强分类器，且当前强分类器 $f_m = f_{m-1}+T_m(x,θ_m)$

问题来了，我们现在要求Loss最小，原本是可以直接使Loss对x求导，进而求出θ，得到强分类器的

但书上说了，有时候Loss对x求导，是无法实现的，说实话，我不知道为什么

不过，不妨碍我对GBDT进行推导

首先，梯度，是想要Loss成梯度逐步下降，那就采用让Loss在 $f(x)=f_{m-1}(x)$ 处进行一阶泰勒展开

则有 $Loss(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f(x)-f_{m-1}(x)]$

令 $f(x) = f_m(x)$ ，则有

$L(y,f_m(x)) = L(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)]$

$L(y,f_m(x)) - L(y,f_{m-1}(x))=\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)]$

其中 $f_m(x)-f_{m-1}(x)] = T(x,θ_m)$

要使下一次迭代时，Loss降低，则需要ΔLoss<0，那么对应的 $\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m)$ <0

那么，当 $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}$ 时，就可以保证 $\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m)$ <0

因此， $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}}$

为了求解简洁美观，可以 $令Loss为\frac{1}{2}(y-f(x))^2$

这样 $T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{\frac{1}{2}ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}}=y-f_{m-1}(x)$

哦！这不就是残差嘛 $r = y-f_{m-1}(x)$ ,相当于每个新的弱分类器（准确来说，应该是基函数）都应该尽可能地去拟合残差

所以啊！！！！实际上一轮的提升树，本质上就是GBDT

不管，就先这么确定，以后打脸再说…好困文章来源地址https://www.toymoban.com/news/detail-699200.html

到了这里，关于机器学习——boosting之GBDT的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

机器学习——boosting之GBDT