社会实验的特殊性(一)

“实验经济学”这个名词儿可能很多人都觉得蛮耳熟的了，此外社会实验无论是在学术界还是业界都蛮热的。鼓捣出来个什么东西，总要做个实验有个对照才好说效果什么的是吧～

最近一直在想，社会实验这个东西到底有什么特殊性？可能和自然实验相比，最大的不同之处就是反馈回来的是依据人的决策而表现出来的行为，而不像自然实验那样是有既定的物理化学反应过程的。从这个角度而言，我们研究人们的行为的时候，便多了一些更高层次的考量——毕竟人是有思维能力的高等动物，简单的生物学上的“反射”行为可能并不足以完全的解释人们行为的多样性。这也是我为什么觉得economics特别有意思的缘故吧：从工具的角度，我们大量的应用数学、统计学、物理学乃至生物学的成果；从思想的角度，我们在将历史学、心理学、社会学、法学、地理学、人类学、政治学等等融会贯通。有的时候真的觉得越来越难以对economics下一个定义，很多的时候很多交叉的领域让什么定义都觉得没有立足之地。前面说的，大致可以对应为数理经济学、计量经济学、金融物理学、神经经济学、经济历史学、经济心理学、经济社会学(social economics)、法经济学、经济地理学、政治经济学（特指研究政治问题的经济学分支）等等。每一个领域都可以拎出来无数的论文，所以有的时候真的很难以说经济学是一门什么样的学科了。简而言之，研究人类的行为吧，毕竟我们还主要关注在“人”和“行为”上，虽然这个定义也难免让人觉得日渐模糊了。

正因为经济学的社会科学的本质，所以在借鉴自然科学的方法的时候自然也理应格外小心。比如做实验，怎么选取实验组和对照组就是一门很大的学问：人和人不可能完全相同，怎么选两个组之间还是会有一些差异是不可控的。生物学可以用（同卵）双胞胎来做实验，但是这个对于需要田野实验的经济学来说显然是可望而不可及了。此外，继承这个问题，当我们去检验社会实验的结果的时候，又应该有什么样的补救之策呢？

原来看经济学的论文很简单，大家一个“随机分组”就涵盖了所有的东西。反正是随机的嘛，什么都是外生的。但真正到自己手里做实验的时候，却还是有蛮多疑虑的。怎么随机、算是随机？从自然科学的角度，最理想的状况就是实验组和对照组在实验之前“一模一样”。比如我用同一块铁、同样的盐，当然这个总会有一点误差，但足够小以至于可以忽略不计了。可是，当我们在社会实验中，还可以这么天真的假设人和人之间的差异性不大，故而从大数定律来讲只要样本足够大、我们总会得到一个一致的ATE（average treatment effect）估计吗？我心中还是难免有一些疑虑。这种疑虑一是来自于对极端事件发生的担忧（比如随机抽取之后两组出现显著差别，并且可能会直接影响结果，这样结果就多含了一个我们难以剥离开来的分组因素），另一个则是对于ATE的不够细致的感觉。ATE固然好看，但是我们制定策略的时候还是更多的希望适用于每个个体，到底在个体层面这个treatment effect有什么样的差异呢？这个问题并不是毫没有意义，也不是完全没有办法回答的。

在这种种的疑虑中，就多少觉得这个社会实验还是要慎之又慎才能期待一个比较稳健的结果。所以，从我的角度，事先的分组要慎之又慎，事后的结果检验也要因情况选择最合适的方法。两者结合起来或许会控制的比较好一点吧。

刚刚发现手头没有 Mostly Harmless Econometrics 这本书，觉得还是有一本时常翻翻比较好，就从Amazon痛下血本买了……痛是痛在运费，倒不是书费，呵呵，买书总是不心疼的。后悔当年没有直接带回来。还有顺便买了Motta那本书～话说，上次kindle返修之后居然给我留下了25刀的gift card，不用白不用，意外的惊喜啊～amazon真是慷慨，相比而言国内的那个卓越亚马逊真是让人失望，先买的书架后买的书，书都到了书架还没发货！唉！

Tags ATE, 人类行为, 实验设计, 社会实验, 经济学, 自然实验, 行为, 随机性

7 replies on “社会实验的特殊性(一)”

所以说还是计算机科学简单! 搞个伪随机就能当真随机使用了! 😀

这个伪随机数当真的用我也蛮佩服的～哈哈……

懂得太少，只能飘过…

说不定就现在的认知水平，我们所触及认识到的变量不足以完全刻画一个个体的经济行为。更何况个体还要跟其他个体进行丰富的信息交换，修正自己的决策，反思并向其他个体交流经过自己加工的信息。个体对信息的加工以及信息对个体冲击的量化工作（显然不同个体，至少是不同群体都是不一样的）我自己觉得不可能完成。
除非是在极端条件下，出于动物本能的行为，比如求生交配什么的，这样的行为样本对于观测研究者来说，噪声少，发出的信号比较强。在极端条件下（当然针对不同的实验所谓的极端条件不一样）人就不会瞎寻思，大家的目的纯粹而又强烈，影响自己决策行为的变量就能少一点一致一些。如果给被观测者们对该实验相似的信息，这样得到的观测质量比较高。说不定运气好，就能提炼出关键变量建立合理模型。当然能不能合理量化也很关键。
不过，话又说回来，说不定就当前对人的行为认知，应用数理模型去刻画个体行为根本不靠谱。虽然我坚信一切数学化才是王道，但就现在的知识储备，根本没法用运用数学这个工具。等着哪天我们把大脑工作的原理彻底搞清楚，抓住了人行为反馈关键，明白了记忆、意识究竟是什么的时候，用数学就合理客观了。

哈哈，由于自己知识储备的匮乏，让我对行为刻画这件事太悲观了。我曾经想过做突发的不利信息（比如海南的橘子有病毒什么的）对一个群体影响的定量建模。我假设信息的扩散服从某个过程以及个体对信息的反应能抽象为某个函数等等。但后来发现，没地方下手，而且即使有结果，结果也只是意淫一堆假设后的产物，就放弃了…

打扰学姐了~见笑了…

今天落园抽风，见谅……希望留言系统接下来工作正常……

打了那么多，submit后直接出错了，NND…
1提炼一下就是，我觉得等我们对大脑这个庞大的系统的工作原理有个更进一步理解的时候，再用数学这个工具刻画行为也不迟。
当我们对行为决策这个（生理）过程认识不够深刻的时候，样本观测结果对于我们来说，包含的噪声太多，质量太低了，别说定量刻画，就连针对研究对象进行关键变量的提取，都是问题。当然可以选择用过量的假设去过度抽象一个人或者一个群体，就跟微观那个理性人假设一样。如果那样的话，所得的结果，仅仅只能是华丽的假设加逻辑推理的产物，它到底有没有用？
2随着微博这类新的信息传播工具的兴起，关于信息传播的模型怎么建立，不同群体对不同的信息传播工具显然具有不同程度的响应。
3可以随机选择足够庞大的样本来实验，来消除因为没有考虑的因素对模型的影响以及过滤个体差异影响。这样做成本高暂且不说，考虑到个体方方面面难以量化的差异，即使这样去选，选多少合理或者从哪类人类群体去选择，到底有没有合理性？

哈哈，由于知识储备实在不足，读的书太少，所以都是外行话，学姐见笑了~

你是不是留言在loyhome.com了？我刚才看了一下，貌似网站出了一些小问题。不过你的长长的留言我还是看到了～不用担心，现在已经好了～

[...] 利用微博作为新兴交互渠道的办法就更多了，背后依赖的数据分析知识也会相应有所调整。R作为一个开源、免费的工具，其已经提供的众多packages可以迅速的帮分析人员实现相应的想法，而不是把大量的时间用于无休止的编程以开发相应工具。这样，R便可以在一个想法探索阶段找到相应的数据支撑和信息。有了想法、去实现之后，很多时候还需要评估效果（这里可以参见去年写的关于社会实验的东西：一、二、三、演讲幻灯片），这方面简单的计量工具更是可以在R中迅速实现、并可以轻易实现可重复的评估和报告（简单的分析模型和结果重复可以利用已有的脚本，偏正式的报告可以借助当年的Sweave和进化版如knitr）。 [...]

Comments are closed.