落园 » 讲座|专注经济视角下的互联网

「别让数字吓到你」续:神奇的字母

这个是我这次在R会议讲的《统计辟谣训练营》的一部分,也算是上次在松鼠会讲的《别让数字吓到你》的续篇。好吧,其实前者本身就是后者的续篇..不纠结这些关系了,重点是内容~

magic letters

--------------分割线,正文开始咯-------------

前段时间在微博上,有个段子很火:

5月20号快要到了 如果你在乎的那个人,名字里有W,H,Y,L,X,M,T,C,S,Z 的字母就默默转发。

然后就看到各种转发,还有好朋友感叹道“全中!”。呃,这些字母真的就这么神奇么?

当时我的第一反应是,taiyun、yihui和我自己的名字不都是全中么?那么看看cos到底有多少人会全中呢?从cos后台提取了一下驻站作者、编辑及管理员的数据,大致有这些人:

然后,百无聊赖,自然要算一下每个人名字中被这些字母默默击中的概率,结果如下:

也就是说,一共有15+4+1=20位全中?好吧,我样本中一共才41+8+4=53人,接近40%全中呀。这可不是一个小的比例了呢!好奇的看了一眼到底是谁全中,作者太多了就不列了,看看管理员和编辑,“幸运儿”名单如下:

默默中枪,果然被我一下子就想到仨,一点都不差...

然后呢,居然有四个全身而退的,到底是谁呢?

嗯啊,fan兄,哈哈...作为唯一的一个管理员,傲视群雄~牛。接下来,如果COS的其他人像我一样看到这条微博,会有啥反应呢?假设一下,COS的编辑管理员都相互认识,然后每个编辑/管理员都随机认识5位作者,作者之间也是随机相互认识3位。然后会出现什么景象呢?先看一下这样的朋友圈:

author_links
红色:管理员; 灰色:作者; 绿色:名字中"全中"的(不论管理员还是作者)

呃,发现什么了吗?没有任何一个人不与绿色的点相连!也就是说,随便一个人,基本上都认识COS里面“全中”的人这个是存在一定概率的,模拟结果显示,在现在的假设下,这样情况出现的概率约为33%,且该概率随着“随机认识人数”的增加而增加。呜啊。也就是说,大家都直接被瞄中了。这是为什么呢?

有人可能会说,词频不一样嘛,你看新华字典,每个字母对应的厚度都不一样滴~可是也不是所有字都会被用于名字啊,还有些在名字中出现的概率会远远高于其他,比如思喆大哥的“喆”。于是,需要一个现成的有大量名字的样本,恰好R会议有300名报名者,这个可是随机的样本了吧,于是先借用咯。让我选,我会选,Y、L、Z、H、X、C、W这7个,预计覆盖现场90%的听众。为啥呢?统计一下嘛,现场观众中,

看吧看吧,到了W之后,覆盖的名字就很少了。不过看到这个结果的瞬间,我就郁闷了。为啥捏,因为还有另外一个段子:

名字中带L或Y这个字母的人一生都会很顺利,因为这两个字母两头相遇后就再也没有分开过,如果你生命中遇到一个名字里面带L或Y的人那么就转发吧…

要知道我第一次看到的时候那个心领神会的笑开了花啊,L和Y啊,分别是我的名字嘛,还有落园也是LY啊(其实落园的名字就是这么来的)。但是,原来这俩一点都没有特殊性啊,大众名而已。哎,好伤心呢!

---------------分割线,源代码现身--------------
[......]

Read more


满载而归——记第五届R会议(北京)

今天在回来的高铁上,在已经不知道多少次从虹桥站踏出火车的时候,突然有种时空错乱的感觉。照理说,我这么一个整天游荡在各个城市的人,应该习惯了不同地方才是。可是,不知道为什么,这次在北京呆了两天,却好像两个月那么久。太多美好,太多记忆,让人割舍的时候才体验到心痛的味道。

R会议开到第五届,COS长到6岁,一切居然都这么快。上次去北京虽说只是两个月前的事儿,但是上次在北京开R会、一下子见到这么多好朋友,还是不得不追溯到2009年了。岁月如梭?一下子,大家都长大了许多。长江后浪推前浪,总在被年轻学子的朝气蓬勃所影响着、激励着。心态,一下子就变得好年轻。

先说一下最俗的、物质上的斩获。真的是满载而归[......]

Read more


触摸数字上的直觉(科学传播训练营第八期:别让数字吓到你回顾)

上周末,很开心的在魔都和很多听众分享了科学传播训练营第八期:别让数字吓到你。被到场听众的认真感动了,从两点到最后六点半结束,那么多人一直坚持着聚精会神的听讲,还有各种问题穿插其中,大家的热情和执着真的让我这个去传播知识的人由心底感动,演讲的激情自然而然的就被激发出来了。哈哈,话说演讲开始之前我还觉得挺困的,破例灌咖啡呢(话说,准备的时候是按照为记者们准备的,所以比较浅显;结果当天居然空降很多“专业人士”,比如某人一家三口全体出动,让我顿时鸭梨山大。早知如此,就准备几个“高级黑”的例子了嘛,比如RDD and causal inference,嘻嘻~)。不过,通篇我想说的“数字上的直觉”,无论是[......]

Read more


第一篇论文发表~甜蜜。

今天,接到了乔老师的确认电话,有生以来第一篇撰写的论文已经被接受,即将发表。感觉呢,惊喜+甜蜜 ^_^ 在此先容我回忆一些事,感性一下。

2009年,我21岁。
2009年,第一次全神贯注的做一件事情,废寝忘食:考GRE
2009年,第一次写一篇正式的论文,还每天在枯燥的撰写中乐得其所。
2009年,第一次跑到会议上去演讲,还是连着北京上海两个大城市。那次,第一次来到上海,第一次一个人去一个完全陌生的城市。
2009年,第一次下决心写一本书,单纯的没有太多想法。

然后,时到今日,已然三年过去。GRE单词忘的怕是差不多了,而留学已经回来了。R会议荣幸的由演讲者变成了组织者,还在越来越多的会议[......]

Read more


别样的风景

今天被某人"骗"去复旦听了一场讲座(还是物理系),话说这居然是我第一次进复旦,真是神奇。讲座的主角是大名鼎鼎的周涛周教授--传说中那个当年最年轻的正教授哦,亲,是正教授哦~

今天讲的是人类动力学,嗯,反正不是什么我熟悉的东西。还好,周教授大概是考虑到有我等无知听众在场,没有一上来就是扑天盖地的公式,而是一点一点由图形娓娓道来。虽说对这个领域不怎么了解,但是耳濡目染了几次讲座,还是对幂率什么的略知一二,大概也知道这群人感兴趣的问题是什么。简而言之,人类行为的时间和空间特性,这跟经济学家执着的纠缠于人类行为的成因思路不太一样,关注预测也和经济学关注因果不太一样,但有意思的是我觉得两者的ultim[......]

Read more