落园 » 最优化|专注经济视角下的互联网

那些埋伏在互联网公司的经济学家....

嗯啊,自从著名的微观经济学家Varian跑到google兼职之后(话说Varian这厮最著名的八卦,就是自己在买新彩电之前,各种搜集数据建立模型,然后经过各种最优化选择了最佳时点入手...不就是买个电视嘛,至于这么学以致用嘛~),经济学帝国主义展露出其雄心勃勃的志向——无底线的渗透到各个行业各个环节。有的披着数量分析的外衣,有的带着策略决策的高帽,总之就是各种高端各种名正言顺。然后看看他们发出的paper嘛,什么呀,还是economists这群人自己的逻辑规则。哎呀呀~

最近看AEA系列的文章,发现了两位埋伏在互联网公司的大神,Justin M.RaoDavid H. Reiley,貌似原[......]

Read more


[RAAT]第一话:微博的数据该怎么玩呢?

引言(即废话):每当要准备presentation的时候,就会开始想一些问题。去年写的是【社会实验的特殊性】,然后有一系列的文字和最终的slides。现在,想多少从自己这大半年的工作经历出发,写一系列文章,就叫做 R as an analytical tool吧,简称RAAT。第一话,从微博入手好了;第二话,将由Joke童鞋过年时候问的一个问题引出;第三话,会是更偏向流程和实践的东西。这些我会一点点写,也可能有所改变,看到时候具体的想法了。

新浪微博也火了这么久了,但是对于吾等数据源控来说,这等数据简直不能被暴殄天物啊。怎么用来分析为好呢?

links类数据

微博有两大类links:

  • 粉[......]

Read more


LoveR!

我终于对Stata忍无可忍了。这种软件我真的不知道为什么有这么多大牛们在用着。我始终难以忍受它奇怪的语法,实在想不出发明它的人到底是怎么一个程序员背景可以想得出这么诡异的命令模式。相比而言,R的血统多正啊~

R, you are my loveR! 这么经典的东西,怎么会没有人用呢?R很难学吗?我不觉得。相反,这是我学了这么多统计/数学软件中学的最快的了。看看package的说明和例子马上就可以用了,那些高级的用不到的技巧也不用去理会。所以现在用R用的我真的是很舒服,很舒服……飘飘欲仙。

好吧,那些对计量里面一堆堆矩阵望而却步、却又不得不写论文的可怜孩子们,转投R的怀抱吧!当你发觉那些看似高深的模型只是一行R命令的时候,会觉得真是扬眉吐气。

当然,我这么说不是希望大家都不去关注计量理论,相反我最痛恨的就是遍布各大垃圾期刊的滥用计量经济学做分析的文章。但是直接学那些计量理论多枯燥啊,还是先拿数据来把玩把玩,然后咱边对着数据寻找经济直觉,边结合计量理论,正所谓理论联系实践,嘿嘿。

好了,不废话了,其实我只是剧透一下,我们COS项目组的一系列普及R的文档都会陆续的在网上发布了,包括运筹学里面常用的最优化的方法、数据挖掘和计量等等等等。是不是看起来很高深呢?怎么会嘛,我们的目标是普及嘛!所以这些文档大都是“问题导向”型的,专注于各种问题的处理而不是理论的推导。所以会让你觉得R原来不是那么神秘,不是一个打开之后只能让你对着界面发呆的黑盒子,它实际上是非常强大而且友好的。嘿嘿,是不是越来越期待了呢?

吊足了大家胃口,我也该拿出一点实际的东西来了。首先是我们这个项目组的一些情况。目前大概是在COS(统计之都)论坛的几位版主亲历/倾力而作,除了我之外都是非常资深的R用户,却有着把复杂变简单的神奇魔力。更难得的是,我们大家奉承的理念都是“知识是拿来共享的”,所以这次发布的文档都将是免费的,我们意在挑战传统的出版模式。传统不意味着不好,但是它流通的速度确实比较慢。以我负责的关于计量的小册子来说,因为我是边写边发布的,所以不可能等到全部写完再出版。我们希望这样的一种模式可以扩大统计之都论坛的影响力,同时让大家真正节约时间和成本去了解R这么一个优秀的软件。

其次呢,我就放出来一个目录让大家看看,是我现在完成的部分的目录。我们目前正在加紧施工,希望尽快的做好发布页面。

最后呢,我连序言都一并贴出来好了……请点入文章查看。
[......]

Read more