[笔记]GBDT理论知识总结

为什么要把平方差和指数形式 Loss 函数单独拿出来说呢?这是因为对这两个损失函数来说，按照 Forward Stagewise Additive Modeling 的思路构造弱分类器时比较方便。如果是平方差损失函数，就在残差上做平方差拟合构造弱分类器; 如果是指数形式的损失函数，就在带权重的样本上构造弱分类器。但损失函数如果不是这两种，问题就没那么简单，比如绝对差值函数，虽然构造弱分类器也可以表示成在残差上做绝对差值拟合，但这个子问题本身也不容易解，因为我们是要构造多个弱分类器的，所以我们当然希望构造弱分类器这个子问题比较好解。因此 FSAM 思路无法推广到其他一些实用的损失函数上。相比而言，Gradient Boosting Modeling (GBM) 有什么优势呢?GBM 每次迭代时，只需要计算当前的梯度，并在平方差损失函数的基础上拟合梯度。虽然梯度的计算依赖原始问题的损失函数形式，但这不是问题，只要损失函数是连续可微的，梯度就可以计算。至于拟合梯度这个子问题，我们总是可以选择平方差函数作为这个子问题的损失函数，因为这个子问题是一个独立的回归问题。

因此 FSAM 和 GBM 得到的模型虽然从形式上是一样的，都是若干弱模型相加，但是他们求解弱分类器的思路和方法有很大的差别。只有当选择平方差函数为损失函数时，这两种方法等同。

来源: http://www.cnblogs.com/bentuwuying/p/6667267.html

与本文相关文章

暂无,快来抢沙发吧！