引言(即废话):每当要准备presentation的时候,就会开始想一些问题。去年写的是【社会实验的特殊性】,然后有一系列的文字和最终的slides。现在,想多少从自己这大半年的工作经历出发,写一系列文章,就叫做 R as an analytical tool吧,简称RAAT。第一话,从微博入手好了;第二话,将由Joke童鞋过年时候问的一个问题引出;第三话,会是更偏向流程和实践的东西。这些我会一点点写,也可能有所改变,看到时候具体的想法了。 新浪微博也火了这么久了,但是对于吾等数据源控来说,这等数据简直不能被暴殄天物啊。怎么用来分析为好呢? links类数据 微博有两大类links: 粉丝关系 评论与转发关系 然后呢然后呢? 首先很多人感兴趣的是信息传递吧?那么决定信息传递的就是,第一呢,每个用户的信息源(主要来自于他关注的其他微博用户);第二呢,他关注的人的发布及转发行为。用粉丝关系来计算影响力(influential rank)自然是没有问题,但是多少有点损失的感觉——我们总关心一个人在接受信息之后的response是不是?所以,一个简单可行的思路是,这里不妨用其转发行为来加权,判断每个他关注的用户对于他的影响程度的不同~如是,则每个有向的link上就附加了一个权重,成为了一个加权的有向图。 嗯,这样一个基...
在重温 Competition Policy: Theory and Practice 这本书。我不得不承认,anti-trust一直是一个很有意思的领域,最直接的和业界、经济政策相联。看看这些故事,看看背后的各种出于“市场效率”的考量,真的觉得世界是很美妙的。 没想到这个月会有这么多代码可以写。或许,像我这么一个极度讨厌“重复劳动”和copy、paste的人,思维永远会是,“这东西怎么写代码啊”……可惜啊,当年没好好学C,现在被R惯坏了,什么都用R来做,也越来越懒了。很多问题,一时R解决不了,就只能郁郁的手动处理掉。然后心里在想,“真心的,我会成为一个非常好的research assistant的”……呃,这是不是一个意外的“收获”呢? 有的时候在想,应该如何定义“工作”一词?不断的、重复性的劳动,不厌其烦么?很显然,这不是我喜欢的,虽然明知道很符合亚当·斯密眼中的“分工”。很不喜欢浪费自己的时间,尤其是在做一些让我觉得本科研究生都白读的事情上。这个时候,“完美癖”就显得非常不合适了,看着很多东西就这么流出去了,最后索性任其自由…… 哎,很多时候,连别人对自己的误解,都懒的解释了,这么的“顺其自然”好了。或许很多东西,一不值得挽回、二不值得留恋。因此,又何必浪费自己的时间与口舌……有时间,还...
或许我总是慢半拍,但是看到这个人和他的传奇故事,确实不得不让人稍稍惊诧。从百度搜搜“陈军昌”就可知此人的事迹,当然我是在经济教育科研网上看到的。先转贴一些很有震撼力的句子。 黄有光:“这篇博士论文拿到任何国际上一流的大学:哈佛、普林斯顿,都是最优秀的论文……这是我所见过的最好的两篇博士论文之一,另一篇是杨小凯的。” 怪不得军昌君读到后来,连一些老师和研究生们都难以理解了,关门读书研究的他甚至成为了学校的一个传说――有传说说他的导师建议学校将他的宿舍由4楼调换到1楼,以防止自杀;还有硕士生们专门去拜访他,看看脱产攻读博士居然达8年之久的是什么样的人…… 正如黄有光教授对他期望的“如果有一个较好的研究环境,继续钻研的结果,陈军昌很可能会成为一只大狐狸(对于“狐狸”的解释看这里http://bbs.cenet.org.cn/dispbbs.asp?boardID=92510&ID=73519)。 首先我不得不说,这件事开始很容易被认为是炒作。但很快的,我发现这不是那种夸大了的新闻而已,因为我确切的在中国知网(CNKI)找到了他的博士论文(直接在博士论文数据库里搜作者即可),而在600多页的论文打开之后,首页赫然写着:答辩委员会主席:黄有光。 看来这不是一个玩笑。 看了看他的摘要,写...