上周末,很开心的在魔都和很多听众分享了科学传播训练营第八期:别让数字吓到你。被到场听众的认真感动了,从两点到最后六点半结束,那么多人一直坚持着聚精会神的听讲,还有各种问题穿插其中,大家的热情和执着真的让我这个去传播知识的人由心底感动,演讲的激情自然而然的就被激发出来了。哈哈,话说演讲开始之前我还觉得挺困的,破例灌咖啡呢(话说,准备的时候是按照为记者们准备的,所以比较浅显;结果当天居然空降很多“专业人士”,比如某人一家三口全体出动,让我顿时鸭梨山大。早知如此,就准备几个“高级黑”的例子了嘛,比如RDD and casual inference,嘻嘻~)。不过,通篇我想说的“数字上的直觉”,无论是印证还是违背,还是蛮清晰的传达了出来了吧。数字还是蛮有意思的东西。 演讲的材料事后进行了一些整理,比前几天发出来的文档大纲也有了很多调整。有兴趣看一下整理过的带文字版本的,还请移步松鼠会这里下载。演讲的文字记录、录音、视频什么的,可能也会稍后上传吧~ 比较有意思的是,我们现场的一个互动环节,调查在场60多位人士的生日,居然有13位有“同生缘”,哈哈...远远超出当时在场所有人的预期(最多的一位猜测为10),效果好的出奇。当然,我们事先准备好...
今天,接到了乔老师的确认电话,有生以来第一篇撰写的论文已经被接受,即将发表。感觉呢,惊喜+甜蜜 ^_^ 在此先容我回忆一些事,感性一下。 2009年,我21岁。 2009年,第一次全神贯注的做一件事情,废寝忘食:考GRE 2009年,第一次写一篇正式的论文,还每天在枯燥的撰写中乐得其所。 2009年,第一次跑到会议上去演讲,还是连着北京上海两个大城市。那次,第一次来到上海,第一次一个人去一个完全陌生的城市。 2009年,第一次下决心写一本书,单纯的没有太多想法。 然后,时到今日,已然三年过去。GRE单词忘的怕是差不多了,而留学已经回来了。R会议荣幸的由演讲者变成了组织者,还在越来越多的会议上出没。当年那本小册子还在写,最近应该也完工了,而开始给果壳写更多的东西,开始为松鼠会去讲公益讲座...而那篇论文,居然也即将发表了。人生,总有迟到的意外惊喜。当年做的时候没想太多,而一点点的付出都开始结果了。 其实这篇论文我已经不抱任何希望了,也没想发表。当年和乔老师一起写的时候(原谅我当年各种弱质问题吧,哈哈,谢谢乔老师的耐心和宽容,以及那些建设性的指导),只是觉得实在是喜欢那个话题,喜欢一点一点研究问题的感觉,后来也只是用于了申请出国读博。没想着可以...
这周日,在魔都,会有一个非常好玩的科普讲座——《科学报道工作坊第8期:别让数字吓到你2.0》。原谅我王婆卖瓜,这期会是我和李舰哥去讲,在此先谢过科学松鼠会的一众好朋友们的辛勤组织。其实挺遗憾的是,本来鸟兄也会一起去讲的,结果时间不给力,鸟兄最近在大陆的另一端飞翔呢,5555。 这一期中,我这部分主要是一些基本的统计知识和相关例子,为了避免太多数字什么的吓跑听众,整个讲座都会以有意思的小故事为主,通篇展现统计直觉而不是纠结概念和定义什么的。李舰哥会展示大量漂亮炫目的统计图形,然后娓娓道来我们应该如何读懂、解释这些图形,用一种“图画和艺术”的语言来传递数字信息。视觉盛宴啊!一言以蔽之:information is beautiful! 顺手转一下松鼠会在微博上卖萌的宣传语: 发改委专打飞机?天蝎座一统IT?统计陷阱,一起识破!数字图表化,让人很头大?一幅图,让“挑战号”航天飞机失事,让病人药物中毒? 我这里小小的“剧透”一下,大致说来,我这部分将会包括如下几个话题: 我们为什么需要数字? 哪些统计术语到底是用来干嘛的? 如何不被统计陷阱所欺骗?(想起来经典的一句话,改装一下:学习统计学就是为了不被统计学家所欺骗,哇咔咔!) 如何更好地利用数字...
一边是流浪的心,一边也是在思考一些现实中的问题。还是感谢昨天那位朋友耐心的跟我扯了一下午,说到了一个很有意思的话题,“我们为什么需要海量数据”?或者说, why and how does big data make a difference? 当时说的统计/计量分析的应用很简单,无非是做一些销量、价格弹性和资源投放的预测与优化罢了,典型的咨询业务。然后我就好奇的问了一句数据源,无非是nielsen或者iresearch的市场调查数据之类的,或者厂商自己的一些销量和价格数据。这些数据往往被aggregate到一定的程度,所以一般都是long panel(T>N),以城市为单位之类的。 这样的数据量,肯定没法跟互联网或者电商的individual records相比。百万或许都是小数目。当然咯,我们多少也会把这些原始数据做一个aggregate,比如以每人每日为单位(当然单位的选择取决于具体项目的关注点),但是大多数还是wide panel,N>>T。这两种panel data的(计量)模型显然就不一样了。一个会更多的沿袭time series的分析路子,什么auto-regression、unit root之类的;另外一个要沿袭的更多是cross-section的方法,关注大量个体的特性。 对计量的一个争议就是 ATE (average treatment effect),尤其是做data mining的那些人。明明individuals之间千差万别,计量怎么可以这么简单的取个平均呢?不过一个...
达则兼济天下, 穷则独善其身。 …… 或曰,兼济则达,独善则穷。
社会网络,信息传递,实验经济学,小额贷款...
怕下次找不到门?直接google“落园”呗。
落园是我的非学术博客,只是为了娱乐大众。如果您对学术感兴趣,请移步我的英文博客或查看我的简历。
最近寻找新工作中,欢迎推荐机会!我的介绍见这儿。
沪三角(上海、杭州等)、珠三角(珠海、深圳、香港等)、另加西安、成都。如有这些地方的朋友,欢迎提前邮件联系,一起聊聊相互学习 ^_^
You are currently browsing the archives for the 事儿关经济 category.