Categories
些许欢笑

闲扯玄学

如果说科学是可以被证伪的,那么玄学大概就是永远无法被证伪的。但也正因为无法证伪,玄学某些时候就变得格外有意思,比如星座。

最近有个玄学很火,叫MBTI性格测试。我总觉得很久以前就被测过这个了,不知为何最近又火了起来。既然又火了我就又去测了一遍,顺便研究了一下这个体系是怎么建立的。

基本上,这套体系是把人分为了2的4次方=16类,貌似比12星座多了一点。跟12星座不同的是,那套分类只基于出生年月,而其是一个先天的“外生”变量,并不随着我们主观意志而改变。MBTI则不同,它测量四个维度,又是使用问卷形式,所以很难讲这四个0-1变量是先天还是后天的。这就是玄学第一层。

第二层玄妙的地方是,在每个维度上,两种答案被设计成互斥的。比如第一个维度是外向还是内向,这个好理解,社交的时候是获得能量还是失去能量。像我这种社恐想都不用想肯定是内向啊。

第二个维度就有意思了,是感知还是直觉。刚看到这两个词的时候我完全懵了,后来研究了一下出题方式,我发现这个问题其实更偏重的是依靠经验还是逻辑,或者说,归纳还是演绎?抽象还是具体?这就有点意思了,这俩为何是互斥的?感觉它硬生生把两个选项加权平均到两者之和为1了。想到这个,就回忆起去年一桩有趣的对话。我和一个大佬讨论一个可能有新意的学术问题。具体问题不记得了,反正肯定逃不过“无偏-方差”的均衡。我在那里哼哧哼哧推了三五页公式,然后给出了一个猜想(因为数学不好证不出来了)。大佬听了听我的猜想,说,我都是先跑个数值模拟验证一下,然后才去写公式,哪有你这样先跟公式死磕的。当时我就震惊了,因为我一直觉得大佬是一个理论学家而我通过日常工作得到的实战经验稍多。万万没想到,理论学家靠的是数值结果来寻找理论,而我一个自诩实践者却天天在这里从理论找寻实践方向。讽刺吧?

第三个维度就更扯了。感觉还是思考。其实基本的意思就是,理性还是感性。比如在一段亲密关系中,是选你爱的还是爱你的人?前者感性,后者理性。但这个也是具体问题具体分析的啊。比如工作中,我会告诉自己不要感情用事,万事逃不过真香定律。正因为这样,我可以把情绪控制到最低限度,以至于很多人觉得我像机器般冷血。另一方面,我不敢看电影,因为莫名其妙我就可以共情然后泪如雨下。你说我是理性还是感性呢?我觉得我是要么极度理性要么极度感性,不存在中间状态。这就好比,一个方差很大的分布你非要讲均值又有什么代表性呢?密度函数是双峰的不可以嘛。

第四个也是让人百思不得其解。计划缜密还是见机行事。这难道不是取决于事情的风险吗?不知道有个词叫做calculated risk,翻译为计算过的风险吗?如果事情无关痛痒,谁会去闲的没事搞个万全之策?如果形势险峻,谁又能一直躺平无动于衷?兵来将挡水来土掩说的是舒适区里的情形啊。所以这个问题问的是,你的人生到底有多少舒适区?这不是都靠经验的么…经历的越多才有可能放松吧。比如我现在出门打包基本就是随便抓,带着证件钱包就够了,其他现买就是了。这种情况还发生在我特别小的时候根本不知道出门意味着什么。除了这两个极端,中间过程可是小心翼翼的,比如早些年会细细查询交通签证等等,现在就闭着眼睛无所谓了(以至于我在Kotzebue下了飞机没有网络的窘境)。总而言之,这是一个取决于其他因素的条件分布啊。

所以玄学嘛,看看就好了。你看我还试图去找个数理模型解释它,真是闲的发慌乱扯一通了。娱乐无妨,真有人靠这个找工作的话我只能说祝你好运了。

——-

既然我已经测了,还为了结果的稳健性测了不同家的,就无聊地分享一下结果。我测出来是INTP(内向、直觉、思考、见机行事)。据测试解释,这个类型的很喜欢研究玄学,然后我还特意来写了这么一篇,你说膝盖是不是立马中枪?不过如果是这样,那不就也证明了MBTI本身就是玄学吗?你看我这逻辑推理多完整,是不是又中了思考和直觉呢?等等,这难道不是循环论证(circular reasoning)吗?

Categories
读书有感

捉襟见肘补数学

前几天跟家父闲扯,说到我这辈子为数不多后悔的事情,就是本科选专业没选数学。我的性子基本上是不会多想过去已经发生的不可改变的事情的,所以人生中还真没多少后悔的事。这件事情是例外,是因为从毕业以来一直在为其还债,不得不怨念一下。当然,确实很难讲如果我当时学了数学,现在会不会过得更好。可能也不会。

假设过去未曾发生的事情没什么意义,不如讲讲为什么让我这么怨念。前几天在查一个模型,想知道一些大样本特性那边的结论,于是开始翻看相关的论文。结果论文读着读着就读不下去了,因为根本看不懂其中的引理。不仅仅是证明看不懂,而是根本不知道为什么要用到这些引理,这就很尴尬了是不?回头查了查,这些基础知识都是渐进理论那边的,属于概率论吧,确实没有学过,不知道就是不知道。

这种捉襟见肘的感觉实在是太熟悉了。去年看另外一个方向的论文,发现根本没学过concentration相关理论(这个名词不翻译了),然后现学现卖,抓紧去补那块儿的知识。然后看到Lipschitz 连续性,完全不记得实分析怎么讲的了,又得回头复习。为什么不记得呢,还是因为当年没理解,没有把数学融会贯通成自己的思维,自然考完试就忘了。不过至少因为学过,所以复习总是比重新学习容易一些,而且这次看到应用了也能加深对其本身的理解。数学虽说是个工具,但是如果不记得工具怎么来的可以怎么用,那要么就只能望洋兴叹,要么就闭着眼瞎用。鉴于后者着实不是我的风格,大部分时间我都只能止步之后扼腕叹息。

说到底,之所以数学让我这么痛苦,还是很多东西学的时候没有成体系,用到什么补什么。像微积分啊线性代数啊这种还好,宏微观计量各来一遍,到后面怎么也不会忘了。但是其他的不常用的就惨了, 只能两眼一抹黑,实在不行就死记硬背吧。我挺佩服那些随时可以从一个阶段捡起数学直接用的人,他们不需要知道下面的基础是怎么架构的,只需要往上盖就行。我受不了这样,对我来说数学一定是一以贯之的,若是我不曾理解基础那我就永远没法继续往下走。当然我可能不会一直记得每一个细节是怎么样子,但大体的脉络永远是清晰的。

可能事情并没有我想象的那么糟,我的数学知识也不是哪里都是窟窿永远填不完。但这种不知道我还有多少窟窿没填的状态,让我大部分时间都没有底气,特别惧怕又发现一个窟窿那种沮丧感。毕竟一直处于一种“追赶”的感觉会让人自信全无。若是曾经在本科阶段按部就班地训练过,或许就不会像现在这样不安了。比如看经济学我就不会不安,因为我知道自己的基础很牢,一切新生事物都是基于以往一些问题的拓展,这给了我很足的底气来辩证地学习新知识(以及看到胡说八道的理论知道他们是在胡说八道)。正是因为有这两者完全不一样的状态的对比,我才无法控制自己的怨念。

======

题外话,本科专业没选数学完全是当时的无知。按说我一个高中生无知就罢了,我得到的各种指导信息居然都是,“大学数学和高中数学不是一回事儿,高中数学再好大学数学都有可能让你失去兴趣。”之类。居然没有一个人告诉我数学本身对于其他基础科学是有多么重要。感觉数学教育出了很大问题,让前面学过数学的人并没有体会到数学的基础性和重要性,自然也就无法告知后来者。当然,从家父的角度,他觉得稳妥最重要,数学一看就是一个找不到工作的专业。我不否认,从现在来看确实很多数学专业学着学着就走进死胡同了。但更重要的是,我的性格决定我并不会安于现状,而除了数学之外,怕是少有一直能给我足够的智力挑战的东西了。那种从抽象层面理解事物的满足感,那种一脉相承融会贯通的舒畅感,至今不曾从别的事物上体验过。性格决定命运,所以虽然对于大多数人来说,本科学数学或许并不是一件好事,但对于我来说,却导致了十几年来的最大缺憾。

Categories
些许欢笑

神作呀!Oh My God!

无意中在豆瓣上看到了一部号称神片的电影《偶滴神啊》,原名好像正是 Oh My God。赶紧找到看了看,真的是神片呀!

最近一直很心水印度元素,跟印度裔的partner聊天的时候都会对他们各种敬仰羡慕。信仰缺失是个问题,但是如果把信仰全部寄托在一些有形无心的事物上,那才是更严重的问题。

这部片子以喜剧的形式,欢笑的探讨了信仰问题。豆瓣确实是神评论的出没地,摘录一段故事:

释迦牟尼佛晚年涅磐时,魔王波旬对他说:“到你末法时期,我叫我的徒子徒孙混入你的僧宝内,穿你的袈裟,破坏你的佛法。他们曲解你的经典,破坏你的戒律,以达到我今天武力不能达到的目的……”佛祖听了魔王的话,久久无语,不一会,两行热泪缓缓流了下来。魔王见此,率众狂笑而去。

联想到在巴塞罗那读书的时候,很多朋友跟我展示他们心中的宗教,跟我传达他们对于宗教和信仰的理解,才发觉原来在国内周围那些临时抱佛脚的根本算不上所谓信仰。某种程度上,我可以算是一个无神论者。我不信奉任何神袛,却也不信奉所谓的“科学教”。在中国,由于几十年教育的摧残,很多人把课本上学到的科学作为了一种信仰。而所谓科学,无非就是人们对于世界运行规律的一些认识而已。相信真理的人,某种程度上便也是一种信仰了。就像对于很多经济学家,“均衡”便是一种信仰一般。不能证有,不能证无。

世事嘛,或许从来都不是非黑即白。不同的情景下,就怕是神也会展现不同的形式吧。那些用神的名义来禁锢自己的,和用科学的名义禁锢自己的,都是自寻的烦恼。临渊羡鱼,不如退而结网。

Categories
事儿关经济

我(对于统计方法)的一些偏见

Yihui写篇文章居然链到了我那篇吐槽文,瞬间亚历山大...我就是随便说说而已,一定要文责自负么?

其实我经常会有些自我的偏见在那里,而且有时候明明知道这些偏见的存在不好,还是很难说服自己改变它们。

比如,最深的偏见就是我对于计量经济学,我实在无法从根本上接受计量经济学属于经济学的这个事实...我对于它从统计观点出发搞的“因果推断”始终加上一个引号。

再比如,计量经济学内,我偏见最深的就是时间序列分析,我实在无法从根本上接受时间序列分析居然可以做因果推断,这东西更多的是预测的意味嘛,和机器学习的观点很像...

再再比如,机器学习各种模型中,我最不能接受的就是那些完全没有假设检验的...这东西至少也得能算个方差什么的才让人觉得靠谱些吧?

再再再比如,没有假设简单的那些机器学习模型中,我最最最最无法认同的就是最粗暴的把各种模型结果混合起来,用类似bootstrap的方法求得置信区间之类...这简直是就毫无办法之下的粗暴猜测嘛。

然后最后一个问题,施老师说,这个某种程度上反映了“群体智慧”。呃,好吧,就算每个模型都提取了一定的信息量,然后这么混合起来就是万灵药了?怎么听怎么像中药一锅煮的感觉,而不是西药那么配方分明...

其实我还讨厌的是“数据科学家”这个说法...努力的把science的帽子往自己脑袋上套,是大家都要遵循“科学发展观”的缘故么?就像我原来特别讨厌有人争论“经济学是硬科学还是软科学”一样,一定要沾上科学的边么?是为了好申请经费么?

如果科学,定义为消除我们对于世界的不确定性,那么无论是经济学还是统计学,不用争议多少,自然都是科学。如果科学,定义为探寻事物发展的因果规律,那么怕不是建立在演绎法逻辑之上的方法,都算不上科学了。我想说的只是,定义可能并不重要,如果定义是狭隘的,那么必然排除了一些有用的方法;如果定义是广阔的,那么必然包容了一些没用的方法。这东西又不是非黑即白的...

我只能说,科学在我这里的定义相对狭隘,宁缺勿滥,所以我的偏见有这么多...偏见越多,观点越偏颇,经常有过两年自己都不知道自己当年为什么那么幼稚和狭隘的感觉。所以大家一来请见谅落园文章的局限性,二来欢迎帮我突破局限性,用鲜明的观点和生动的例子来说服我——不仅仅是一些口头上关于定义之类的争论。

------------

照例跑题:确实如yihui所说,我的blog文章太多了,找起来难免不方便。尤其是对于不是常年订阅的读者来说。所以我决定对自己的blog主题动动手术了,瀑布流什么的最近蛮流行的,挺好的打算学习一下。

Categories
事儿关经济

放不下的身段

今天在想一个问题,我们设计了那么多数据挖掘的算法,各种各样的、借鉴各个学科方法的,最终到底是想做什么?预测,从我的理解来说。那么这些算法都是想干什么呢?以我的角度,他们是在“准确信息未知”的情况下,通过一些其他的方法模拟一个可能的路径,然后给出相应的结果。这里,尤以“推荐算法”为甚。最简单的,“购买过此商品的顾客xx%还购买过”,就是一种基于群体行为来预测个体行为的思路,虽然不知道主导一个确定的个体选择的究竟是什么。这类思路下的算法还有一个好处,放诸四海而皆准,不用过度关心每个个体的特性,只知道一个群体的路径就好了。鲁迅先生说过,“世界上本没有路,走的人多了,便成了路”。

这里不禁引出来一个经典的问题:上帝到底掷不掷骰子呢?简单的说,就是一定有什么东西是最核心的、确定的在一件事物背后么?还是所有事情都是随机的?这个问题一下子就牵扯到科学的定义和渊源:uncertainty到底是当前情况下的未知还是必然的存在,牛顿晚年怕也是纠结于这个问题投奔神学。从两三年前彭实戈老师演讲中扔出这个问题的幻灯片开始,它就深深刻在我的脑海里了。很多时候,真的,面对这个问题,觉得人类真的很渺小……

说到身段,今天听闻一位和我“弱连接(weakly linked)”的男士已然放下身段投身“鸭子”行业,稍稍惊讶之下我真的很好奇到底生活对他有多么的艰辛、让他可以这么勇敢的作出这么一个决定,毅然决然的放下所有身段。不知是不是社会更宽容了,女大学生卖艺又卖身已经稀松平常了,现在男的也不可阻挡滔滔洪流啊。生活果然残酷。可惜,“隔行如隔山”,我也只能在此妄自揣测,不知其中真由。

说到“隔行如隔山”,这种感觉,尤其在科学界为甚。Science,或者说 scientific research,在当今,实在是分工细的不能再细了,各个领域之间几乎没有多少可以互通的语言。以经济学为例,宏微观的巨大鸿沟就不说了,搞理论的和搞实证的相互看不起也不是不常见。很少有人,愿意放下身段、拿出时间,用心的去学习和体会另一个领域的人为什么从另一个角度来看待同样的问题,为什么对科学研究有着截然不同的评判标准。比如同样是数据分析,计量经济学对于“一致性”的极致追求,和数据挖掘算法对于预测精度的追求,这样不同价值观又是否有一些互补的空间?可惜,我认识的两个领域中的人,几乎没有人可以放下身段去另一个领域从头开始。

同样的感觉深深的刻在social network、我自己的研究方向。研究一个社会网络,谈何容易!研究对象是人,自然逃不开 sociology;而研究角度是经济,自然又需要很多经济学的积淀;最后,研究工具是网络分析,自然离不开图论、complex network theories等等。更具体的,某一个研究的实际问题往往离不开一个具体的环境,比如epidemics 等等学科的渗透。然而,各个学科之间,往往互不通气……哎,可怜我看paper的时候,各种期刊的paper一下子都扔过来,然后各种痛苦,感叹为啥没人把这些研究成果都串起来呢?follow这些东西好费时费力啊。

或许,有的时候,放下身段,确实太过于痛苦了吧!牺牲那么多短期利益,长期还是那么的不确定,呃……现代科学的进步真的是对人的要求越来越高了~