落园 » 代码|专注经济视角下的互联网

关于R的若干SQL等价问题

以前总是觉得不同的计算机语言之间只是语法问题,思路其实还是差不多的--后来才知道不尽然如此。比如用惯了R作分析,切换到其他语言顿时觉得效率降低了好多,尤其是很多一行命令在R里面就可以搞定的时候-思维习惯了一定程度的跳跃,常用的操作(尤其是数据整理!)封装成函数之后工作效率那叫一个倍增啊!结合knitr,原来的时候生成定期报告的效率极其之高,基本属于10倍以上的时间节省。

现在公司的数据平台是teradata,典型的SQL结构,各种join。在这么大的数据量下,不可能直接取数据到本机来分析,只能借助SQL进行一定程度的降维。而后剩下的收尾分析工作,可以由R完成。至于两者之间分工的界限在哪里[......]

Read more


七月的上海

7月7日,上海,已然盛夏。标志:烦躁的鸣个不停的蝉,30摄氏度的早晨八点。

DSC03993

第一个在上海度过的夏天。措不及防。每天坚持着来往12KM之外的公司,只是越来越迷恋五角场的生活气息。

读书,读很多书。清一色的发现自己读过的80%~90%的书籍都跟经济学有关的时候,有点落寞。桌子上摆了好久的《中国哲学史》,连打开的勇气都没有。旁边的一本本数学书却被翻了许多次。悲哀。

写无尽的代码,感慨那曾经用来发散思维的右脑居然慢慢的形成了程序化思维。悲哀。

只是暂时的代价吧。至少,还能维持一种简单的美好的生活姿态。一杯冰饮,几瓣西柚。对付着火烧火燎的喉咙。应景一下,哼一句:

七月七日长生殿,半夜无人私[......]

Read more


读书、写代码

在重温 Competition Policy: Theory and Practice 这本书。我不得不承认,anti-trust一直是一个很有意思的领域,最直接的和业界、经济政策相联。看看这些故事,看看背后的各种出于“市场效率”的考量,真的觉得世界是很美妙的。

没想到这个月会有这么多代码可以写。或许,像我这么一个极度讨厌“重复劳动”和copy、paste的人,思维永远会是,“这东西怎么写代码啊”……可惜啊,当年没好好学C,现在被R惯坏了,什么都用R来做,也越来越懒了。很多问题,一时R解决不了,就只能郁郁的手动处理掉。然后心里在想,“真心的,我会成为一个非常好的research assist[......]

Read more


多久没变化了?

刚在才琢磨,已经多久没有改变这几个blog的面目了? 虽然从某种程度上说,这一切都只是表面文章,但是表面文章太久不做,未免让人觉得这家伙有点慵懒。嗯啊,其实我确实是挺慵懒的。最近在写作业不得不做simulation的时候才意识到自己已经多久没有正儿八经的码过代码了……上一次打开notepad++仿佛都是十几年前的事情了,没有感觉也没有记忆了……

最近发现其实数值模拟也挺好玩的,尤其是为某个变态的公式磨得焦头烂额的时候。恩啊,几行代码可以搞定很多东西,生活会变的稍微简单一点点 ,至少这个世界会清静一点是不是? 原来一直觉得我的R玩得挺差的,只有用到的时候才会临阵抱佛脚看看到底该怎么玩,后来发现[......]

Read more


许大仙新开blog,撒花撒花~

在这个时代,独立博客是一种意志、一种美好的信念,同时也是一张用来标榜的通行证——就如同我(们)始终看不懂的专属90后的火星文一样。许大仙作为一代IT人,自然不可免俗的要转到独立博客的行列。说个小秘密,许大仙是我犯懒不想写代码时候的秘密武器,一般交给他的代码没有写不出来的,联想起被我逼着装上R的情景还历历在目(这段子貌似在哪儿讲过?他事后还问我R为什么卸不干净,莫不是流氓软件?我曰“从未卸过”,嘿嘿~),为了帮我写代码还临时上路折腾起R语言的语法来了,哈哈。

说到许大仙开独立博客,嘿嘿,一下子就想到一开始他凄凄惨惨的被我(们)逼着用gtalk的时候,孤零零的面对里面只有两个联系人的窘境。要说这[......]

Read more


12