落园 » 数字|专注经济视角下的互联网

又来用数字挑逗民意

昨晚看到一篇广为流传的房奴文章,比如网易上转载的,实在是让我忍无可忍,决定抄起笔来对付一下这种用数字挑逗民意的行为。真受不了~~~

首先这类文章都会有一个很鲜亮的标题,比如这里的“三代房奴面面观:一代赚满 80后才是真正房奴”。房奴,80后,这两个词加起来就够吸引眼球了,还有“三代”,真的是三代通杀。其实我也没资格批评别人,前段时间写个SAS笔记还搞个“七天搞定SAS”这种噱头,明显动机不纯。

不过题目吸引人也就罢了,正文读下来八成要让人义愤填膺一番。感觉自从今年春天借给松鼠会做讲座的机会,看了一眼现在的新闻之后,就对各种挑逗的方法有了更强的免疫力。

挑逗民意最最典型手段就是[......]

Read more


「别让数字吓到你」续:神奇的字母

这个是我这次在R会议讲的《统计辟谣训练营》的一部分,也算是上次在松鼠会讲的《别让数字吓到你》的续篇。好吧,其实前者本身就是后者的续篇..不纠结这些关系了,重点是内容~

magic letters

--------------分割线,正文开始咯-------------

前段时间在微博上,有个段子很火:

5月20号快要到了 如果你在乎的那个人,名字里有W,H,Y,L,X,M,T,C,S,Z 的字母就默默转发。

然后就看到各种转发,还有好朋友感叹道“全中!”。呃,这些字母真的就这么神奇么?

当时我的第一反应是,taiyun、yihui和我自己的名字不都是全中么?那么看看cos到底有多少人会全中呢?从cos后台提取了一下驻站作者、编辑及管理员的数据,大致有这些人:

然后,百无聊赖,自然要算一下每个人名字中被这些字母默默击中的概率,结果如下:

也就是说,一共有15+4+1=20位全中?好吧,我样本中一共才41+8+4=53人,接近40%全中呀。这可不是一个小的比例了呢!好奇的看了一眼到底是谁全中,作者太多了就不列了,看看管理员和编辑,“幸运儿”名单如下:

默默中枪,果然被我一下子就想到仨,一点都不差...

然后呢,居然有四个全身而退的,到底是谁呢?

嗯啊,fan兄,哈哈...作为唯一的一个管理员,傲视群雄~牛。接下来,如果COS的其他人像我一样看到这条微博,会有啥反应呢?假设一下,COS的编辑管理员都相互认识,然后每个编辑/管理员都随机认识5位作者,作者之间也是随机相互认识3位。然后会出现什么景象呢?先看一下这样的朋友圈:

author_links
红色:管理员; 灰色:作者; 绿色:名字中"全中"的(不论管理员还是作者)

呃,发现什么了吗?没有任何一个人不与绿色的点相连!也就是说,随便一个人,基本上都认识COS里面“全中”的人这个是存在一定概率的,模拟结果显示,在现在的假设下,这样情况出现的概率约为33%,且该概率随着“随机认识人数”的增加而增加。呜啊。也就是说,大家都直接被瞄中了。这是为什么呢?

有人可能会说,词频不一样嘛,你看新华字典,每个字母对应的厚度都不一样滴~可是也不是所有字都会被用于名字啊,还有些在名字中出现的概率会远远高于其他,比如思喆大哥的“喆”。于是,需要一个现成的有大量名字的样本,恰好R会议有300名报名者,这个可是随机的样本了吧,于是先借用咯。让我选,我会选,Y、L、Z、H、X、C、W这7个,预计覆盖现场90%的听众。为啥呢?统计一下嘛,现场观众中,

看吧看吧,到了W之后,覆盖的名字就很少了。不过看到这个结果的瞬间,我就郁闷了。为啥捏,因为还有另外一个段子:

名字中带L或Y这个字母的人一生都会很顺利,因为这两个字母两头相遇后就再也没有分开过,如果你生命中遇到一个名字里面带L或Y的人那么就转发吧…

要知道我第一次看到的时候那个心领神会的笑开了花啊,L和Y啊,分别是我的名字嘛,还有落园也是LY啊(其实落园的名字就是这么来的)。但是,原来这俩一点都没有特殊性啊,大众名而已。哎,好伤心呢!

---------------分割线,源代码现身--------------
[......]

Read more


触摸数字上的直觉(科学传播训练营第八期:别让数字吓到你回顾)

上周末,很开心的在魔都和很多听众分享了科学传播训练营第八期:别让数字吓到你。被到场听众的认真感动了,从两点到最后六点半结束,那么多人一直坚持着聚精会神的听讲,还有各种问题穿插其中,大家的热情和执着真的让我这个去传播知识的人由心底感动,演讲的激情自然而然的就被激发出来了。哈哈,话说演讲开始之前我还觉得挺困的,破例灌咖啡呢(话说,准备的时候是按照为记者们准备的,所以比较浅显;结果当天居然空降很多“专业人士”,比如某人一家三口全体出动,让我顿时鸭梨山大。早知如此,就准备几个“高级黑”的例子了嘛,比如RDD and causal inference,嘻嘻~)。不过,通篇我想说的“数字上的直觉”,无论是[......]

Read more


这个周末,让我们与数字为舞~

这周日,在魔都,会有一个非常好玩的科普讲座——《科学报道工作坊第8期:别让数字吓到你2.0》。原谅我王婆卖瓜,这期会是我和李舰哥去讲,在此先谢过科学松鼠会的一众好朋友们的辛勤组织。其实挺遗憾的是,本来鸟兄也会一起去讲的,结果时间不给力,鸟兄最近在大陆的另一端飞翔呢,5555。

这一期中,我这部分主要是一些基本的统计知识和相关例子,为了避免太多数字什么的吓跑听众,整个讲座都会以有意思的小故事为主,通篇展现统计直觉而不是纠结概念和定义什么的。李舰哥会展示大量漂亮炫目的统计图形,然后娓娓道来我们应该如何读懂、解释这些图形,用一种“图画和艺术”的语言来传递数字信息。视觉盛宴啊!一言以蔽之:infor[......]

Read more