落园 » 随机森林|专注经济视角下的互联网

≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(十六)

第十五章 随机森林(Random Forest)

终于讲到这个神奇的算法了...若是百年前的算命术士们知道有此等高深之术,怕是要写成一本《随机真经》作为武林宝典世代相传了吧?猜得准才是王道嘛。

p.s. 以前没看过的童鞋不要急,这节课只是从boosting直接跳讲到十五章,并不是已经快结课啦。

---------------

1.定义和算法

算法:

  • 1. For b = 1 to B
    • 生成一个自生样本D_{b}(via bootstrap)
    • D_{b}生成树T_{b}:
      • 随机选取m(\leq p)个变量(相应的[......]

Read more


满载而归——记第五届R会议(北京)

今天在回来的高铁上,在已经不知道多少次从虹桥站踏出火车的时候,突然有种时空错乱的感觉。照理说,我这么一个整天游荡在各个城市的人,应该习惯了不同地方才是。可是,不知道为什么,这次在北京呆了两天,却好像两个月那么久。太多美好,太多记忆,让人割舍的时候才体验到心痛的味道。

R会议开到第五届,COS长到6岁,一切居然都这么快。上次去北京虽说只是两个月前的事儿,但是上次在北京开R会、一下子见到这么多好朋友,还是不得不追溯到2009年了。岁月如梭?一下子,大家都长大了许多。长江后浪推前浪,总在被年轻学子的朝气蓬勃所影响着、激励着。心态,一下子就变得好年轻。

先说一下最俗的、物质上的斩获。真的是满载而归[......]

Read more