被标记为R的文章

读书、写代码

在重温 Competition Policy: Theory and Practice 这本书。我不得不承认,anti-trust一直是一个很有意思的领域,最直接的和业界、经济政策相联。看看这些故事,看看背后的各种出于“市场效率”的考量,真的觉得世界是很美妙的。 没想到这个月会有这么多代码可以写。或许,像我这么一个极度讨厌“重复劳动”和copy、paste的人,思维永远会是,“这东西怎么写代码啊”……可惜啊,当年没好好学C,现在被R惯坏了,什么都用R来做,也越来越懒了。很多问题,一时R解决不了,就只能郁郁的手动处理掉。然后心里在想,“真心的,我会成为一个非常好的research assistant的”……呃,这是不是一个意外的“收获”呢? 有的时候在想,应该如何定义“工作”一词?不断的、重复性的劳动,不厌其烦么?很显然,这不是我喜欢的,虽然明知道很符合亚当·斯密眼中的“分工”。很不喜欢浪费自己的时间,尤其是在做一些让我觉得本科研究生都白读的事情上。这个时候,“完美癖”就显得非常不合适了,看着很多东西就这么流出去了,最后索性任其自由…… 哎,很多时候,连别人对自己的误解,都懒的解释了,这么的“顺其自然”好了。或许很多东西,一不值得挽回、二不值得留恋。因此,又何必浪费自己的时间与口舌……有时间,还...

查看全文

面试二三感想

若是算一下,是自己接受的面试多还是面过的人多,我想还是面过的人会稍稍多一点吧,谁让我是这么一个懒得投简历的人呢?嗯…… 原来在学校里面的时候,无非是帮各种社团面试,简单的很,偶尔摧残一下刚刚进入大学校园的花朵们。后来,帮一些单位面试,害得我只能借身衣服装成熟。再后来,就真的成了自己去招人而面试了。一路走过来,从开始面试的随意,到后来面试的忐忑,再到后来面试的随意,往往复复,也算是不断的在成长着吧。 平心而论,对我来说,面试别人比被别人面难的多、耗神的多。也可能是我太善良了?时间允许的话,我希望被面试的人尽力的放松并且能够尽可能多的让我知道他的能力和知识,以便我作出最正确的抉择。呃,这样下来,就比较费神了呢。而且很多时候,现在人才市场竞争激烈啊,看中的人不一定对你的offer感兴趣,还要费好多口舌去说服和引诱人家,不容易啊。招人的人才知道,找到合适的人比找到合适的工作难得多。劳动力市场的双方都不容易啊~这也是为什么有时候一个blog或者一个Github就能让人脱颖而出的缘故吧。 今天突然又写到这个主题,是因为昨天的时候面试了一个统计学的学生,深有感触。从我的角度,我是一直希望招一个统计学的,这样沟通起来比较...

查看全文

R会议纪要及演讲幻灯片共享

大家期待已久的R会议上海会场演讲的slides共享现已在COS主站上发布,请大家移步: http://cos.name/2011/11/4th-china-r-shanghai-summary/ 我的感觉就是,R现在真的是百花齐放了。今天早晨看到一条微博: 会上呈现了R,Stata, SAS, SPSS, S-Plus近年来的使用率的曲线图,除了R和Stata,其他的软件都是下降的趋势;但是R的上升是幂曲线,而Stata的上升几乎是一条斜率为0.5 的直线。 嗯,Stata的话,感觉还是经济金融里面用的多,看来最近几年政府和业界对于计量的认可和应用越来越多了。至于R,莫非是万流归一?哈哈。一个R解决了所有的事儿,干嘛不用,还是免费的。 另,R会议期间还有今天总有人在问 Play Econometrics with R (《在R中玩转计量》) 这个小册子还会不会更新……这个,一定会的,Yihui兄已经催了我若干回了,我只是实在是没有找到拾起笔来重新写的契机。接下来,我想在自己的工作中尽可能的进入R用作数据分析,并且更多的应用计量的方法,所以这本小册子也会随之更新起来的。算作一个简单的承诺吧。

...

查看全文

批量多个文件GB转UTF-8编码、批量合并多个文件

这里更多是一种记录了。 最近遇到两个小问题,批量把GB转成UTF-8,因为R里面就算用en.US-UTF8也是不能直接读GB编码的中文文本文件的。所以需要一个转换。由于手头几百个文件,不可能一一打开notepad++之类的文本编辑器然后另存为,于是就开始搜。果然,神奇的软件哪里都有,一搜救有华军软件园的一个小软件:http://www.onlinedown.net/soft/46844.htm。打开之后很方便~只可惜是windows下的,我还得切出ubuntu来回到windows。 同样的还有一件事儿要依赖windows,那就是在读入R之前,我需要批量合并多个文本文件。这个时候就要靠命令行了。键入CMD之后,一路cd进入需要操作的文件夹。然后一个神奇的命令: copy *.txt target.txt 就可以看到命令行华丽丽的搞定了!真速度啊,赞一个。 就在此记录一下,整理数据会有各种各样稀奇古怪的需求,能在R之外做的也有很多(本来我是在ubuntu下ls所有文件名,然后想用for循环在R里面依次读入并rbind的)。当然相比于命令行的原生操作,还是速度慢一些。所以,各种武器齐上马,就看哪个利索了。不同于以往在学校里接触好的数据,格式都弄好了,业界的数据格式千奇百怪。所以涉及到数据格式的修改,感觉真的离不开R里面的merge、reshape等基础命令。话说还发现一个R包,data.table,可以用来做分...

查看全文

Page 1 of 512345

达则兼济天下, 穷则独善其身。 …… 或曰,兼济则达,独善则穷。

我正在关注的:

社会网络,信息传递,实验经济学,小额贷款...

一点点声明

落园国内镜像已关闭。欢迎您直接google“落园”。

落园是我的非学术博客,只是为了娱乐大众。如果您对学术感兴趣,请移步我的英文博客或查看我的简历

此外,我对以下问题不太感冒:金融、时间序列、精算、房价等,偶有博文论及也并不深入,故请不要与我讨论此类问题,要不你会发现我基本上啥都不知道。