落园 » R|专注经济视角下的互联网

囧事一则

有个面试经历挺好玩的,记录一下。

面某家数据科学家...

面试官:你一般用什么语言?

我:r用的比较多,python也可以。

面试官:你写一下xx算法的实现(某个简单的计算机算法)

我:xxxxx()这个函数?

面试官:你自己写一遍。

我:我记不太住了,当年学过,考完四级就忘了(我还无聊到去考过计算机四级)...我不是学计算机专业的,不太写这种程序。r和python, c不一样,里面函数比较多,大部分可以直接调用(我想说:我很少操作指针这种东西)。我用统计方面的函数比较多。

面试官:所以你们写程序就是调用一下函数?

(结束)

我:....[......]

Read more


install R on Centos 6

following this thread: http://blogs.helsinki.fi/bioinformatics-viikki/documentation/getting-started-with-r-programming/installingrlatest/#CentOS

Installing the latest R on CentOS:

Add the latest EPEL repository which you can find from here. Don’t forget to add the 64 bit f you are using a 64 bit[......]

Read more


R vs Python: data frame和高速数据整理

由于种种的原因,我的feedly里面很多东西很久没看了...今儿抽时间看来一下,貌似是十一月份的热点是dplyr, data.table或者说,data.frame高速操作的各种办法。

http://www.r-bloggers.com/dplyr-and-a-very-basic-benchmark/

这里有有个蛮有意思的比较,抄过来:

base
dplyr-df
dplyr-dt
dplyr-dt-k
dt
dt-k

Filter筛选
2
1
1
1
1
1

Sort排序
30-60
20-30
1.5-[......]

Read more


据说是R 2014年最重要的发明...

今儿听Hadley大人做training,才第一次好好去看pipe这个东西...以前有点印象,主要是R会上有人讲过,当时只是记住了一个名词。今儿才有机会好好的去看看去想一想。(吐槽:R有的时候是不是太灵活了...)

pipe的广告语: the pipe operator is one (if not THE) most important innovation introduced, this year, to the R ecosystem. 听起来挺神奇的,好像是从F#那里搬过来的....R果然是耐揉。

短短的历史就是,随着Hadley大人搞定了dplyr,MAGRITTR 这[......]

Read more


从R到python散记(结束更新)

算是留条后路吧...anyway学门新语言总比学门新的课程简单一些。

1. 循环
Python 君貌似不是很喜欢操纵下标(不是C),循环比较直接:

而不是for index in range(len(forset)): i=forset(index)

While和R的用法基本一直。也可以直接break跳出。

[......]

Read more