落园 » 矩阵稀疏化|专注经济视角下的互联网

社会网络中的社群识别(Community Discovery)概述

最近一直在看Community Discovery这一块儿的论文,深深的感觉现在就是一个矿工,不断的想方设法挖出来更有价值的信息。而且不是一个点一个点的突破,而是需要寻找出一种脉络,串联起所有的信息来。头痛。

最近的情况是,有一个well-connected的网络,然后我想把它稀疏化、打散成一个个独立的community的感觉。这样就可以分别识别每个community的特征什么的。所以厚着脸皮找施老师讨了几篇papers。而主要的问题是,数据太大了...11M nodes, 20 M edges,还是directed weighted network...我直接放弃了把这些数据从SQL[......]

Read more


papers I read in eBay

只是罗列一些这一两年比较关注的具体领域。

  • 自然语言处理与分词:看了很多分词类的算法,从字符匹配、MMSeg、HMM,到条件随机场之类。主要是为了提取关键词作为regressors。当然做这个一方面是好玩(周围很多朋友都在玩),另一方面也是不想被专家忽悠...嗯。另外就是TD-IDF、余弦相似度这些纯粹是为了不被忽悠。
  • 稀疏矩阵:稀疏矩阵完全是从上面继承而来的,往往分词之后搞来一个很大很稀疏的矩阵,为了降低computational cost或者干脆就是考虑到computational capacity,这个不得不做,然后就可以开始奇异值分解了。后面恍然发现,这丫不就是adjancy[......]

Read more


满载而归——记第五届R会议(北京)

今天在回来的高铁上,在已经不知道多少次从虹桥站踏出火车的时候,突然有种时空错乱的感觉。照理说,我这么一个整天游荡在各个城市的人,应该习惯了不同地方才是。可是,不知道为什么,这次在北京呆了两天,却好像两个月那么久。太多美好,太多记忆,让人割舍的时候才体验到心痛的味道。

R会议开到第五届,COS长到6岁,一切居然都这么快。上次去北京虽说只是两个月前的事儿,但是上次在北京开R会、一下子见到这么多好朋友,还是不得不追溯到2009年了。岁月如梭?一下子,大家都长大了许多。长江后浪推前浪,总在被年轻学子的朝气蓬勃所影响着、激励着。心态,一下子就变得好年轻。

先说一下最俗的、物质上的斩获。真的是满载而归[......]

Read more