当前位置: 首页 > news >正文

网站建设公司新闻上海短视频推广公司

网站建设公司新闻,上海短视频推广公司,浦东新区网站开发,沈阳网站建设优化企业现在要开始重点关注名字了,名字透漏了很多信息!名字暗藏线索! GBDT,Gradient Boosting Decision Tree: 梯度提升决策树 果然信息很丰富 梯度:意味着计算有迭代递进关系,但还不明确是怎么迭代递进的 提升&…

现在要开始重点关注名字了,名字透漏了很多信息!名字暗藏线索!

GBDT,Gradient Boosting Decision Tree: 梯度提升决策树

果然信息很丰富

梯度:意味着计算有迭代递进关系,但还不明确是怎么迭代递进的
提升:意味着前向分布式+加法模型,并且分类器之间是有相关提升的
决策树:CART决策树、C4.5、忘记名字了…

em…还是要再深挖深挖,小小的boosting,挖呀挖呀挖呀挖。。。
经过推导。。。发现,我的GBDT回归,实际就是上一篇提升树的二叉回归树…
看来可以省点儿功夫,不写代码,但可以稍微推导一下

首先,明确回归问题采用平方损失函数: L o s s ( y , f ( x ) ) = ( y − f ( x ) ) 2 Loss(y,f(x)) =(y-f(x))^2 Loss(y,f(x))=(yf(x))2

其中,f(x) 是强分类器,且当前强分类器 f m = f m − 1 + T m ( x , θ m ) f_m = f_{m-1}+T_m(x,θ_m) fm=fm1+Tm(x,θm)

问题来了,我们现在要求Loss最小,原本是可以直接使Loss对x求导,进而求出θ,得到强分类器的

但书上说了,有时候Loss对x求导,是无法实现的,说实话,我不知道为什么

不过,不妨碍我对GBDT进行推导

首先,梯度,是想要Loss成梯度逐步下降,那就采用让Loss在 f ( x ) = f m − 1 ( x ) f(x)=f_{m-1}(x) f(x)=fm1(x)处进行一阶泰勒展开

则有 L o s s ( y , f ( x ) ) = L o s s ( y , f m − 1 ( x ) ) + ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) ∗ [ f ( x ) − f m − 1 ( x ) ] Loss(y,f(x)) = Loss(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f(x)-f_{m-1}(x)] Loss(y,f(x))=Loss(y,fm1(x))+əfm1(x)əL(y,fm1(x))[f(x)fm1(x)]

f ( x ) = f m ( x ) f(x) = f_m(x) f(x)=fm(x),则有

L ( y , f m ( x ) ) = L ( y , f m − 1 ( x ) ) + ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) ∗ [ f m ( x ) − f m − 1 ( x ) ] L(y,f_m(x)) = L(y,f_{m-1}(x))+\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)] L(y,fm(x))=L(y,fm1(x))+əfm1(x)əL(y,fm1(x))[fm(x)fm1(x)]

Δ L o s s = L ( y , f m ( x ) ) − L ( y , f m − 1 ( x ) ) = ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) ∗ [ f m ( x ) − f m − 1 ( x ) ] ΔLoss = L(y,f_m(x)) - L(y,f_{m-1}(x))=\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*[f_m(x)-f_{m-1}(x)] ΔLoss=L(y,fm(x))L(y,fm1(x))=əfm1(x)əL(y,fm1(x))[fm(x)fm1(x)]

其中 [ f m ( x ) − f m − 1 ( x ) ] = T ( x , θ m ) [f_m(x)-f_{m-1}(x)] = T(x,θ_m) [fm(x)fm1(x)]=T(x,θm)

要使下一次迭代时,Loss降低,则需要ΔLoss<0,那么对应的 ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) ∗ T ( x , θ m ) \frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m) əfm1(x)əL(y,fm1(x))T(x,θm)<0

那么,当 T ( x , θ m ) = − ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}} T(x,θm)=əfm1(x)əL(y,fm1(x))时,就可以保证 ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) ∗ T ( x , θ m ) \frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}*T(x,θ_m) əfm1(x)əL(y,fm1(x))T(x,θm)<0

因此, T ( x , θ m ) = − ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) = ə ( y − f m − 1 ( x ) ) 2 ə f m − 1 ( x ) T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}} T(x,θm)=əfm1(x)əL(y,fm1(x))=əfm1(x)ə(yfm1(x))2

为了求解简洁美观,可以 令 L o s s 为 1 2 ( y − f ( x ) ) 2 令Loss为\frac{1}{2}(y-f(x))^2 Loss21(yf(x))2

这样 T ( x , θ m ) = − ə L ( y , f m − 1 ( x ) ) ə f m − 1 ( x ) = 1 2 ə ( y − f m − 1 ( x ) ) 2 ə f m − 1 ( x ) = y − f m − 1 ( x ) T(x,θ_m)=-\frac{ə_{L(y,f_{m-1}(x))}}{ə_{f_{m-1}(x)}}=\frac{\frac{1}{2}ə_{(y-f_{m-1}(x))^2}}{ə_{f_{m-1}(x)}}=y-f_{m-1}(x) T(x,θm)=əfm1(x)əL(y,fm1(x))=əfm1(x)21ə(yfm1(x))2=yfm1(x)

哦!这不就是残差嘛 r = y − f m − 1 ( x ) r = y-f_{m-1}(x) r=yfm1(x) ,相当于每个新的弱分类器(准确来说,应该是基函数)都应该尽可能地去拟合残差

所以啊!!!!实际上一轮的提升树,本质上就是GBDT

不管,就先这么确定,以后打脸再说…好困

http://www.yayakq.cn/news/543366/

相关文章:

  • 建设银行征信中心个人信用查询官方网站kindeditor代码高亮 wordpress
  • 多个网站能否统一做等保如何对产品进行推广
  • 个人网站的订单网站建设那个好
  • 网站建设广金手指六六十四东莞网站建设it s
  • 什么样的网站可以做外链做网站生成二维码
  • 河北省住房城乡建设局网站首页网站门户
  • 如何做垂直门户网站个人网站名称怎么写
  • 百度收录正常网站流量下降网站资源建设方案
  • 什么网站可以做图赚钱吗关于电商运营的知识点
  • 手机导航网站模板网站用的什么字体
  • 做境外的网站网站违法么网站的建设与管理的心得体会
  • 网站投票链接怎么做的推广平台有哪些适用于广告
  • 怎么网站怎么建设框架买了一台配置强悍的电脑怎么做网站服务器
  • 网站建设方案 filetype doc国内国际时事写实记录50字配图片
  • 知名营销类网站做兽药网站用什么图片好
  • 微网站开发北京建设局网站漠河
  • windows7建设网站大学生app开发经费预算
  • 网站怎么做动态切图常用网站开发语言优缺点
  • 视频网站用什么做的好处上海专业的网站建设公司排名
  • 好用的cms网站做响应式网站的框架
  • 南宁企业网站建站模板网站开发毕设文献
  • 红酒集团网站建设网站建设可用性的五个方面
  • 用jsp做的网站有哪些网页制造与网站建设论文
  • 带数据库网站设计房地产平面设计网站
  • 太原站建设有多长时间网站建设的主要工作内容
  • 合肥建设学校官网网站网站建设用途
  • 做网站怎么切图建设厅网站注册后多长时间开通
  • 关键词密度查询站长工具wordpress是主流cms系统
  • 手机app网站制作公司网站建设 做账
  • 做网站好还是做程序员好wordpress会员查看