落园 » Python|专注经济视角下的互联网

R vs Python: data frame和高速数据整理

由于种种的原因,我的feedly里面很多东西很久没看了...今儿抽时间看来一下,貌似是十一月份的热点是dplyr, data.table或者说,data.frame高速操作的各种办法。

http://www.r-bloggers.com/dplyr-and-a-very-basic-benchmark/

这里有有个蛮有意思的比较,抄过来:

base
dplyr-df
dplyr-dt
dplyr-dt-k
dt
dt-k

Filter筛选
2
1
1
1
1
1

Sort排序
30-60
20-30
1.5-[......]

Read more


从R到python散记(结束更新)

算是留条后路吧...anyway学门新语言总比学门新的课程简单一些。

1. 循环
Python 君貌似不是很喜欢操纵下标(不是C),循环比较直接:

而不是for index in range(len(forset)): i=forset(index)

While和R的用法基本一直。也可以直接break跳出。

[......]

Read more


读大学读什么?

最近一直在想这个问题:花费了那么多时间读书,究竟读了一些什么?

知识这东西,但凡肯花时间,大部分都是能学会的。应付考试什么的就更不是特别难的事情了。

可是成绩单上满满的,都是知识、知识。让人看起来都觉得疲倦。

除了知识,上学的时候还学会了什么?更多是培养性情?养成一颗好奇心,养成探索事物的兴趣,广泛的接纳各个领域的思维冲击。说起来工作了之后,太多东西都是可以现用现学的,没有什么那么困难的。

前段时间在看美国LAC(Liberal Arts College)的教育模式,培养精英的气质。因为有幸接触过一些top LAC出来的精英,确实气质上稍胜一筹。

A "liberal[......]

Read more


python小试

今天非常无聊的决定去试一下python。找了一个题,大意如下:

  • 给定一个输入字符串,找出最漂亮的无重复子字符串。
  • 子字符串:从原字符串中减掉某些字符可得到的。
  • 无重复字符串:没有重复的字符
  • 甲比乙漂亮:甲的长度>乙,或者甲的字典排序在乙之后。

因为都是无重复的,所以肯定不需要甲的长度大于乙,故而是所有长度一样的无重复子字符串中,找出字典排序最大的。

这个先用R写的,为的是写出一个有效的算法来。基本的思路就是强行的逐层递归。

后面用python重写了一遍。基本就是等价函数的替换...我是不[......]

Read more


协作关系与复杂网络

今天很兴奋的看到一篇博文:Mapping GitHub – a network of collaborative coders。而后又很兴致勃勃的去源链接看了看。这是利用GitHub的多人协作关系制作出来的复杂网络的图,涵盖了Ruby, JavaScript, Python, Perl, PHP等等语言。实在是太帅了!用GitHub也有一段日子了,总觉得挺孤单的……看了这个才知道原来开源社区有多么的壮大。本来不应该全转过来的,实在是忍不住了……就破例一次吧。
首先让人印象深刻的就是这张社区关系图。很震撼人心……

可以看出,中国人(至少是在中国的中国人)的贡献蛮少的……

上一张图的局部细节。
为了节省首页篇幅,请点入文章查看。

[......]

Read more