落园 » 计算|专注经济视角下的互联网

UC Berkeley的Data Scientist课程列表

无聊的时候顺手搜到的(原址)。虽然我依旧不喜欢Data Scientist这样的叫法,也无志向往这个方向前进,但是这个课程列表还是不错的。也貌似不仅仅是Berkeley的课。

基本上这么几个方面的课程吧:

Read more


Binning in Computational Methods: Gaussian Kernel Regularization, etc.

成天跟大数据打交道,最恨的就是out of memory这种错误。诚然,可以通过加大内存等方式来保证运行,但是随着数据量的增长,时间上的损耗也是很厉害的——比如时间复杂度为O(n^2)甚至更高。所以为了一劳永逸的保证计算的运行,需要在算法的改良上做一些文章。有了一个简单的类似于binning的idea,就去厚颜无耻的骚扰施老师了。

然后就顺利的套到了一篇paper,我能说我是瞎猫走狗屎运了么?居然还真问对人了,如获至宝的搞到一篇paper:

Yu, Bin, and Tao Shi. "Binning in Gaussian Kernel Regularization." (2005)[......]

Read more