一方面是现在工作的性质,会关注很多跟数据打交道的人和公司;另一方面也是自己直觉上体会到信息化浪潮之下对于数据分析人员的渴望。所以刚刚看到了微博上面的一个infograph,颇有感觉,在这里转一下并多嘴几句。 我最感兴趣的自然是背景这块儿,怎么计算机背景的为多啊?统计的倒是不怎么多。难道是计算性能是现在最大的瓶颈么?我是觉得,没有统计的直觉,也没有经济(好吧,带上商科)的思维方式,再多的数据分析出来也无感啊,不知道怎么应用的。数值结果不见得重要,重要的是怎么interpret和apply嘛。 我始终觉得,数据分析人才一定要有除了计算机和统计/数学之外某个学科的背景,最好是理工科的,最好再有一些实际工作经验,这样才明白什么样子的数据是高质量的,怎么分析是契合常识和逻辑的,得出来的结果又怎么能指导下一步工作。也许是工作中接触了太多纯IT男吧,普遍只对code有感,哈哈。 ---------- 生活要优雅:宁愿高傲的活着,不愿卑微的享受。
...原来学计量的时候,喜欢嘲笑计量自以为是的“因果关系”,一致性毕竟只是数据上表达出来的统计标准,到底是不是因果关心还有待考量。可见,对于科学,多少还是心存敬畏的。 工作之后,先是感慨底线一而再、再而三的降低,后则是各种无奈。比如想回答一个问题,是不是“X导致了Y”,明明有很好的计量方法可以去用,结果无奈的只能一次次的按照一种“普通青年能理解的思路”用最简单的分类统计去做,然后什么“显著性检验”之类的都算作浮云了。这个时候再自嘲,自己都不愿意看着自己算出来的结果说事儿了。唉,更加怀念当年手动推的日子咯。 有的时候,真的不知道应该怎么办才好。原来也是比较喜欢画图的,后来觉得很多时候画图是一种不负责任的在误导,就越来越少的画图了。久而久之,对于图形的直觉就越来越差了。很多时候,也不知道怎么办好,就那么安静的坐在那里,看窗外云卷云舒…… 有的时候,或许不知道,心情会更好一点吧。曾经沧海,才知道难为水有多么的难! 抑或许,我犯的最大错误,就是太顺从、太软了。或许,以后应该更多的stand out,亮出自己的声音!
...貌似最近“通识教育”这个词儿蛮热的,很多大学一进去都不分专业了,先来一段什么“通识教育”再说。好吧,我这个已经毕业的人了,也没什么被教育的机会了,只能自我教育一下,故而改称之“自我通识教育”。 今天在读一篇paper,呃,大概久违的非econ的paper了吧。 Zhou T, Kuscsik Z, Liu JG, Medo M, Wakeling JR, Zhang YC. Solving the apparent diversity-accuracy dilemma of recommender systems. Proc Natl Acad Sci U S A. 2010 Mar 9;107(10):4511-5. Epub 2010 Feb 22. 嗯我知道各位会依旧容忍我的引用不规范的。先这样吧。然后按图索骥,很快就找到一篇博文论及此文,巧的是这篇博文正来自COS的一位特约作者阿稳,豆瓣的算法工程师。当时顿感,嗯啊,世界一向很小的是不是。稀里糊涂的看了半天,终于明白这东西大概在鼓捣些什么。不过,我的角度肯定不是从算法本身的角度,更多的是关注一下这种idea背后的逻辑吧。嗯啊,比如我可能会关心一下“为什么”,从数学或统计的角度来说就有一点寻求“一致性”的味道。现在越来越不敢用“隔行如隔山”来宽慰自己,看看我这些年做过的事事儿,就知道天下没有什么绝对的某一领域之说。那天写完那篇关于高维数据降维的文章之后(参见:小窥“高维数据降维”),过两天正好跟一学计算机的朋友吃饭,顿时...
刚从一学公共健康的同学那里听来的冷笑话。她说她们做生物/医学统计的老师们也都用R,我还为之小小惊讶了一下。然后她话锋一转,说 其实我们也总用stata 然后我就很不理解,这两者不是互为替代品么?只等她一语道破天机: 我们是用stata来处理数据,产生结果,然后用R画图,因为stata画出来的图没那么漂亮,没那么自由…… 我瞬间明白,为什么当年刚接触R的时候,就有人不停的提及R强大的作图功能了……呃,看来果然是被现实中承认的啊。不过我还是很好奇,这是哪个R包的贡献呢? 话说,今晚巴萨刚刚赢了曼联,捧得了欧冠杯。哇……整个城市那叫个沸腾啊!我们随便去社区的一个Bar里面,就能体会到这种狂欢的气氛。记得前几个星期赢了皇马拿到国王杯的时候(胡诌了,拿联赛冠军的时候,国王杯输了),整个城市也曾沸腾来着……我其实挺好奇去年西班牙捧得世界杯的时候,这个国家得有多狂欢啊。巴萨今年真的是好强悍的说……看来今夜这个城市要无眠咯!(话说今早去吃的churros真的是好棒啊,类似于西班牙版的油条吧,据wiki说还是当年源于中国的。还有Boqueria那个大市场,简直就是没有天理的新鲜便宜!这个城市总是能让人发觉惊喜……)
...