Categories
事儿关经济 互联网产业观察

复杂网络的几何模型?

有点时候觉得复杂网络之所以可爱,就是在一个特定的场合下或许可以几何化,变得很直观。当然,简单的几何化就是点与点之间的连线,不过那样我倒是觉得稍显纷杂,虽然有方程可以描述,但还是不够简洁。

前几天在校内无聊的看帖子,有个很恶俗的帖子中有句很经典的话,大意是:

想知道你的年收入是多少吗?把你周围的10个好朋友的年收入加起来,然后除以10得到的平均数就大概是你的年收入。

这句话的依据就是“物以类聚,人以群分”,所以你的社交圈往往也离自己的实际生活不会太远。姑且我们不去深挖那些细节上的陷阱,从一种很单纯的层面来看,假设每个人只与10个人有社会网络意义上的联系,而后整个社会(比如有1000人)以这种联系互相连接在一起,且满足每个结点(即每个人)上的数值等于周围结点平均值。那么这个模型会是什么样子呢?

当然这可能是个三维空间都承载不下的几何模型,我的第一反应是“球”。简而言之,这个“球”得是一个匀质的球。球有什么好的特性呢?下面细说。

不知道大家有没有一个比较奇怪的“习惯性动作”,反正我是经常会这样,那就是在看电视的时候没事干就折腾遥控器玩。我折腾遥控器的一大习惯就是在遥控器的所有键上找到一个键,可以用手指单点这个键的时候足以支撑整个遥控器的平衡。其实说白了,就是找一个近似的“重心”。

球最好的特性之一就是在球面任何一个点栓一根绳,然后垂直下落,那么通过该点的垂线一定通过球心。如果我们此时把球分层面来看,那该点也一定是这个层面上的“重心”。不知我这样的说法是不是有些难以理解,简而言之就是你用手指顶起球面上任意一个点,都可以举起球来,就像篮球运动员转球似的。这样的平衡,是不是可以视之为一个“不动点”?

在社会网络这个模型中,或许很难去定义一个“重力”或言之“外部物体的引力”,可能只有内部各个节点之间的“万有引力”。这样一来,是不是在某种意义下各个结点都可视为一个特定层面的“重心”,从而满足了“该点值等于周围结点的平均值”?当然这里对于每个点的赋值或许要稍稍复杂些,甚至不一定是静态赋值(即可能是某个其他值的函数),因为我们在转球的时候就重新切割了层面,所以原来的坐标轴实质上已经改变了。

当然,我喜欢球的另外一个因素,就是很容易从中分离出其他的简单模型,比如“正四面体”。正四面体的每个顶点都满足到其他三个点的距离相等,而且也可以视作重心在各个层面上的“投影”。这样一来,从逼近的角度,我感觉最后还是会成为一个近似的“球体”。

这样绕来绕去或许有些繁琐了,也离我们起初的议题有些远了。可惜我一时想不出来什么办法来检验一下上面那个“收入平均值”的命题,若是能有如此的数据或许真的可以建立起来一个比较好玩的社会网络模型,然后看看它到底长得什么样子。大家喜欢社会网络模型可能的原因是它可以很容易的嵌套入各个细微的领域,是研究从个人行为到群体行为聚集的一种模拟。或许这样一来,经济学和心理学关心的很多议题,比如储蓄行为、利他行为都可以找到一种新的解释。

最后推荐一篇报道吧,可能有点稍显陈旧,是Economist杂志一月底的一篇特别报道:A world of connections。大家自己去网上搜搜吧,反正我看的是Google缓存的PDF版,官网不知何故打不开。里面说了一些最近SNS社区网站发展的情况,有意思的一些部分包括Pro ting from friendship、A peach of an opportunity等等。Facebook等或许是信息时代最先实践着社会网络模型的代表,它很大程度上在从商业灵敏嗅觉的角度挖掘着、探究着社会网络的价值。感觉很快,各个学科都会给予进入这个领域来做一些研究,信息安全的需要研究新的加密和隐私对策,做硬件的或许需要定制一些新的架构。Twitter上现在的信息冗余已经略有泛滥的程度,所以是不是信息的筛选、甄别和评价机制也需要有相应的对策。有句很经典的话,“发明是为懒汉服务的”。从商业价值层面,这样的挖掘会有收益上的激励。而从经济学层面,是不是有着更多的探讨空间,来研究人类的行为?如果经济学的定位之一依旧是“研究人类行为的科学”。

或许每朵花恰可以代表一个人

我依旧秉承着这么一个观点,互联网是研究经济行为最好的实际中存在的模型和近似。因为信息的传递,对经济行为来说,实在是太重要了。

Categories
事儿关经济 经济、IT观察与思考

复杂网络和社会网络

在正式的写昨天列下的三个议题之前,我想先说一点关于复杂网络(complex network)和社会网络(social network)的东西。

第一次从学术意义上接触这两个词儿还是不久之前,也就是去年冬天的R会议上。已经记不得是谁的presentation里面有一幅很经典的复杂网络的图了(当时学到的东西太多了,很难一一拎清楚来源了。欢迎各位知情人士把图扒翻出来给我),而后大家的话题也多多少少牵扯到复杂网络。

先澄清一下这两个概念之间的区别:从我的理解来说,复杂网络更多的是一种数学工具,一种分析问题的方法。而社会网络则是一种概念和定义上的东西,是社会学研究的对象。现在社会学研究社会网络的时候会经常用到复杂网络的工具,这也是二者的结合点。简而言之,复杂网络>社会网络。

或许社会网络中最著名的就是“六度分割理论”:

美国著名社会心理学家米尔格伦(Stanley Milgram)于20世纪60年代最先提出。“你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生 人。”

还有一个著名的“150法则”:

从欧洲发源的“赫特兄弟会”是一个自给自足的农民自发组织,这些组织在维持民风上发挥了重要作用。有趣的是,他 们有一个不成文的严格规定:每当聚居人数超过150人的规模,他们就把它变成两个,再各自发展。“把 人群控制在150人以下似乎是管理人群的一个最佳和最有效的方式。”——150成为我们普遍公认的“我们可以与之保持社交关系的人数的最大值”。

我第一次对复杂网络有个感性的认识大概是大一的时候,当时雅虎中国出来一个很有趣儿的名人搜索(当然现在很多网站都有了),然后我就泡在上面折腾了个把小时。

复杂网络从数学的角度看自然离不开“图与网络分析”(插曲:我觉得运筹学是我学的最得心应手的数学课,几乎不用证明多好啊,直观的很容易理解,算法上的东西比定义上的容易搞定得多)。不过这里我们撇开数学不谈,看看复杂网络的应用(原文在此):

研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、 Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;所使用的主要方法是数学上的图论、物理学中的统计物理学方法和社会网络分析方法。

钱学森给出了复杂网络的一个较严格的定义:具有自组织自相似吸引子网络的内聚倾向)、小世界相互关系的数目可以很小但却能够连接世界的事实)、无标度中部分或全部性质的网络称为复杂网络。

看来看去,社会网络无疑是复杂网络应用中最好观测、最易直观理解的例子。

之所以提起来这个话题,主要是前几天无聊的时候翻了翻去年10月的一期《大众软件》,虽然其中《复杂网络——网络的科学》一文更多的是一种科普的角度来阐述复杂网络的概念,但是也并非没有分析上的启迪意义。复杂网络或许从数学工具的角度已经有比较成熟的框架和脉络,但是真正应用到社会学中,又是另外一番天地。经济学的研究现在特别讨厌弄个假设然后找个数学家来解题,毕竟我们研究的是人类的行为。

记得R会议之后Mr Liu曾发给我一篇沃顿商学院俩教授写的论文,原文载于Marketing Science,标题为New product diffusion with influences and imitators(谢谢tryshy订正)。可能从商业的角度看这篇文章有着自己的市场营销层面的价值,但是我感兴趣的则是里面利用的社会网络的分析方法。当时我是出于我理解中的微观经济学缺少一些人类行为层面的分析(我总觉得贝克尔在《人类行为的经济分析》里面只是分析了经济因素而非把行为本身作为一个决定模型的因素),也想多了解一些behavior economics方面的东西。从某种程度上来说,群体的行为必然是个人行为的加总,只是这个不能简简单单的是一个线性加法,而有着更多的决定因素和嵌套关系。

对于群体行为,心理学和社会学了解的要比经济学通透的多,他们的精华成果也颇为值得借鉴。我欲借复杂网络构建模型,却奈何对其理解不足,怕造成灾难性的错误,只得搁置。故而对于群体行为,即将撰写的博文中只会涉及正态分布和布朗运动,暂时放下复杂网络。或许有朝一日,对复杂网络的理解通透了之后,可以在两者之间构建一个桥梁,或许能看到一番新的景象。

Categories
Wordpress

对落园的一些例行调整

昨天更新了一下PageNavi这个插件,然后发现新版本自己带了一个CSS,导致我原来在模板中定义的样式失效,这也刺激了我去好好休整一下这个四处透风的Wordpress。

+改回来页面导航的样式

+调整了前台页面的文字,把所有不适应国情的英文字符都改为中文了(分家咯)。现在留下的大概只有RSS, Tag这些不好翻译也不用翻译的个别英文了。

+调整了个别位置英文字体的样式,排除了宋体显示英文。

+调整后台目录,使得wordpress可以实现自动升级(已升级至最新版)。由于支持widgets的话对CSS文件需进行较大调整,所以暂且搁置。

+顺手升级了后花园的TextCube,其实我仍然觉得这个是不错的blog系统,不过可能更适应韩国。

-调整模板,去掉自动将半角符号转换为全角符号的函数(可能仅有中文版有此毛病)。

+更新了表情包,由“洋葱头”换成了“胖兔子粥粥”。由于GIF动画图片不足,又加了一些静态的。。

+修正了评论页的一些错误,主要是被密码保护的文章评论页模板问题。

唯一不爽的就算在中文14PX的显示下,英文字体显得很粗糙(Firefox下,可能是没有cleartype支持的缘故)。正文中的英文只能继续这么忍受着了。

Categories
日常应用

打破语言坚冰,LyZ引用中文文献!

不久以前介绍过LyZ这个神奇的firefox插件,成功的沟通了Zotero和LyX,让工作效率又翻番了。可是最近在处理中文的时候发现它并不是那么完美,中文文献的引用还是存在问题的。所以我就跑到原作者Petr博客上去厚颜无耻的留言,问他能不能升级一下眷顾我们这些非拉丁语系的贫苦大众们。Petr很快的给我直接回了邮件,在我发过去一个测试的中文文件(UTF-8编码)之后仅仅两天,他就升级了LyZ。现在新版已经可以从Firefox插件网上下载了

在这个新版本中,主要加入的就是对UTF-8编码的支持,即可以通过Firefox的about:config里面改变extensions.lyz.use_utf8的值,从false到true,然后LyZ就不会过滤掉UTF-8编码的非拉丁语系的文字了。

有了对于UTF-8的支持,那么接下来对于中文的支持就水到渠成了。这个时候在Zotero里面可以直接引用中文文献,会按照作者姓氏第一个字符的编码引用到LyX里面。然后我们就可以在LyX里面顺顺利利的按照通常的方式改一下格式,比如改成“作者 年份”。

这个时候除了感动到无以复加,我还能说什么呢?万事俱备,只欠把Sweave和LyX配合好,就可以舒舒服服的开始敲键盘了。

Categories
日常应用

在Google Reader里查看新浪博客RSS中图片

新浪博客某种程度上挺烦人的,比如虽然相比于那些RSS只输出摘要的网站,他家的RSS输出的是全文,但是图片做了限制外链,所以导致Goolge Reader等在线RSS阅读器看不到文章里面的图片。其实这个对我来说本来不算是啥事儿,少一张两张的还省了加载时间,但是最近不行,我新近订阅了一大堆关于“美食”“厨艺”“烹饪”之类的博客,就是指着图片学习做饭呢,一个个点过去实在是太麻烦了。

好在,互联网是伟大的,搜了一下就看到了解决办法,在Firefox里面只需要:

  1. 安装 RefControl 扩展
  2. RefControl Options – Add Site:
    • Site: photo.sina.com.cn
    • Action: <Block> (send no referrer)

很简单的说~其实原理无非是屏蔽掉浏览器传给服务器的referer信息。其实同理,类似的操作可以解决一大片的限制图片外链的网站。只是,此方法只能用于本机(本浏览器、本账号 if applicable)。

至于IE浏览器……我就没有细细找相应的方法了,我总觉得在IE下用Google Reader的人不会太多……

刚发现的,再奉上搜狐博客图片外链破解:

  • site: img.pp.sohu.com.cn
  • Action: <Block> (send no referrer)