循因果之道,启智慧之旅

来源:《财经》杂志 2021-12-01 12:20:39

今年10月11日,《精通计量:因果之道》一书的作者约书亚·安格里斯特(Joshua Angrist),以及大卫·卡德(David Card)、吉多·因本斯(Guido Imbens)一同获得了2021年度诺贝尔经济学奖。他们对自然实验和因果识别方法的探索与推广,极大地改变了社会科学的实证研究范式,瑞典皇家科学院评价道,“自然实验可助我们回答社会的重大问题”。

如今,基于自然实验的因果识别方法已成为经济学者工具箱里的必备实证工具。如何学好用好这个工具,用来回答更多有趣有意义的社会问题,最好的路径就是从安格里斯特这位被中国经济学界称为“安神”的这本书开始学习。

约书亚·安格里斯特。图/法新

因果识别与社会科学的“可信度革命”

科学研究是一个不断从现象中寻找理论、验证理论,再用理论解释现象、指导实践的认知过程,因此,对理论的检验是至关重要的。科学大致分为自然科学和社会科学,自然科学的研究对象是自然界,主要是人类之外的主体。自然科学的理论相对来说更具有可被验证的条件,因为科学家们可以在实验室里做实验,可以控制诸多因素。而社会科学主要研究人,而对人很难做实验,因此社会科学研究有很大的限制。对人做实验起码有两方面的困难,一方面是伦理问题,举例来说,我们不能让社会中一半人接受教育,让另一半的人没有教育机会,然后来分析教育的效果如何,这显然不符合伦理道德,不符合公平的考虑。另一方面,哲学方法上也使得社会科学很难做实验。在自然科学里,可以把一块石头切成两半去分别做实验,因为切分不会改变石头的物理和化学性质,且切分后的对比观察有利于分析不同实验的效果。但在社会科学研究中,无论如何我们都无法找到两个行为模式完全一样的个体,人有主观能动性,即使双胞胎也会有别。这造成了社会科学中“因果推断的基本问题”:同一个个体要么在实验组里,要么不在实验组里,不可能同时“在”和“不在”。比如中国改革,我们现在处于“改革”的状态中,就看不到“不改革”的状态,从而无法同时直接比较“改革”和“不改革”的结果。时间之箭是不停流逝的,只有一条实现路径,数据上我们永远观察不到其他的可能路径,即所谓的“反事实”(Counterfactuals);所以,在社会科学中做因果推断是非常困难的。

那么,一个理想的实验是什么样的呢?举医学的双盲实验为例,如果我们要检验一种新冠的药有没有效果,可以把人群随机分成两组,一组使用新冠药物(处理组),另一组使用看似一样的安慰剂(控制组),过后观察这两组人的差别。实验室和随机实验是自然科学里的一个黄金规则。经济学也在越来越多地使用随机实验,两年前的诺奖得主阿比吉特·巴纳吉(Abhijit Banerjee)、埃丝特·迪弗洛(Esther Duflo)和迈克尔·克雷默(Michael Kremer)对此作出了很大贡献(有意思的是,安格里斯特是迪弗洛在MIT读博士时的导师)。但大规模地开展社会实验有困难,在回答许多重大社会问题时,随机实验方法有不小的局限。

由于因果识别技术的不足,经济学长期一直以理论研究为主。因为实证中用观测数据得出的结果,通常是相关关系,而非因果关系,对这些结果的解释尤其需要先有理论依据。值得庆幸的是,上世纪90年代后,经济学因果识别的“可信度革命”开始了。代表人物就是包括本书作者在内的今年三位诺奖经济学家。大卫·卡德和2019年不幸早逝的经济学家艾伦·克鲁格(Alan Krueger)开创性地借助自然实验研究最低工资、教育和移民等问题,约书亚·安格里斯特与吉多·因本斯系统地构建了识别“局部平均处理效应”(LATE)的框架。由此迎来的这一场“可信度革命”(Credibility Revolution)使经济学具备更高的科学性;从社会科学方法史的角度看,这场革命堪比自然科学领域的“哥白尼革命”。

因果识别之“巧”:以世界为“实验室”

因果识别方法的精巧,从几个具体的例子中可见一斑。第一个例子是大卫·卡德与艾伦·克鲁格关于最低工资法的著名研究。在美国,最低工资法是很重要的政治议题,民主党一般主张提高最低工资,保守派的共和党通常认为政府不应干预劳动市场,反对提高最低工资,他们认为尽管政府本意是好的,但提高最低工资反而会害了工人。在上世纪90年代之前,经济学理论大多认为提高最低工资会导致企业减少雇佣工人,最终增加失业,这似乎毋庸置疑。

但这两位学者开展了一个让所有人惊讶的研究。他们选择了美国两个相邻州:新泽西州和宾夕法尼亚州。其中,新泽西州在1992年4月把每小时最低工资从4.25美元提高到了5.05美元,宾州则没有变化。然后用问卷调查收集了两个州的快餐业劳动就业数据。由于两个州相邻,快餐店所处的经济和市场环境相似,主要区别在于这两个州的最低工资政策。因此对新泽西州快餐店在1992年4月前后的就业作差,差值来自提高最低工资的影响和其他的经济社会等因素,对宾州前后作差,差值则只来自与新泽西州相似的经济社会等因素,没有最低工资的影响。那么两个差值之间再作一次差,得到的就是提高最低工资对就业的影响了。这种奇妙的方法就是著名的双重差分法。卡德和克鲁格教授的这一研究有重要的社会意义。他们发现,与没有提高最低工资的宾州相比,新泽西提高最低工资之后,就业非但没有下降,还略有上升。这一发现颠覆了经济学家和政治家的成见,对经济学研究方法的发展和政策研究都产生了巨大的影响。

结合中国的情况再介绍一个双重差分法在中国的应用研究。该项研究的作者是西北大学教授钱楠筠(Nancy Qian),也是安格里斯特在MIT指导过的学生。她的问题是,性别失衡的原因是什么。男女性别失衡是一个很重要的社会现象,这个现象导致了一系列社会经济问题,如哥伦比亚大学魏尚进老师的一系列研究发现性别失衡是高房价、高储蓄和收入差距等问题的重要原因,所谓“丈母娘经济”。对性别失衡的成因有很多可能的理论假说,譬如认为中国儒家传统重男轻女,这是文化现象;譬如男女挣钱能力不一样,这是经济原因。其他的假说可能还有100种,但重要的是我们需要用因果关系识别出什么是最重要的原因。

钱教授用双重差分方法找到了答案。她运用中国的市场化改革作为自然实验。市场化改革之后,部分商品价格由物价局定价转变为市场定价。钱教授选择了两类农村地区,一类农村地区适合于种茶叶,如像浙江一些山区;另外一类地区适合种水果,如山东的平原地区。男性与女性在两种作物种植采摘中具备不同的比较优势:女性心细,往往更适合采茶;男性体力好且擅长攀爬,更适合果园的劳动。市场化改革由市场定价之后,在不同地区,男孩和女孩的经济重要性差别拉大。在茶叶种植区,由于茶叶价格市场化,女孩相对于男孩经济重要性提升,反之在果园地区男孩经济重要性强。结果她发现,市场化改革之后,产茶区性别失衡下降了,而果园区性别失衡加剧了。这一发现表明经济原因导致了性别失衡。

如今中国的很多问题都可以通过类似的方式来回答。例如中国当前债务违约问题比较严峻,健全法治制度是否能帮助解决?追溯到2007年前后,为了解决钢铁煤炭产能过剩、部分地区经济下行违约破产增多的问题,中国在部分地区实行了破产法庭试点,并在此后推广至多个城市。最近美国西北大学的查克伯·庞提切利(Jacopo Ponticelli)与中国清华大学的李波教授运用该事例,他们比较破产法庭试点地区与非试点地区的差别,发现引入破产法庭之后,地区破产案件执法效率大幅提高,时间大幅缩短。并且,由于破产程序效率的提高,破产对企业构成了更强的事后约束,借款人更敢于借钱给民营企业,降低民营企业融资成本。再者,破产效率提升使僵尸企业数量有所下降。

上述几项研究都是通过比较两类群体受某一外部政策冲击(自然实验)的影响差异,来研究这项冲击的影响。除此之外还有其他使用自然实验的方法,例如,劳动经济学里最重要的问题之一是研究教育对收入的影响。这个问题看似简单,却不易回答。笔者任教于复旦大学,如果我们看到复旦毕业生相对于一般学校毕业生收入更高,是否可以认为高收入来自高质量的复旦教育?答案不尽然,因为一些考进复旦的学生可能本来更聪明,我们看到的复旦毕业生的高收入,可能其实来自这些与复旦无关的个人特质。由安格里斯特等学者运用推广的“断点回归法”则很巧妙地回答了这类问题。举例来说,假如我们拥有所有人的高考分数数据库,当年复旦录取分数线是600分,那么我们选取600分上下的,如600-605区间内的学生(处理组)和595-599区间内的考生(控制组)做对比研究,前者刚刚好考入复旦,后者则因几分之憾没有考进。由于分数十分接近,平均意义上这两组人在其他维度上没什么差别,是否进入复旦基本上是运气使然。那么,比较两组人之后的收入差距(或者其他有意思的变量),得到的就是纯粹的复旦教育对收入或者其他方面的因果性影响。

还有一种十分重要的经典方法叫工具变量法,依然举例说明。收入怎么影响储蓄,这个问题其实不好研究,因为储蓄对收入很可能存在反向因果关系,即收入会影响储蓄,但储蓄反过来也会影响收入,好比“鸡生蛋、蛋生鸡”的关系。1989年诺奖得主特里夫·哈维默(Trygve Haavelmo)提出了工具变量的思想,这一思想是说,我们想研究x因素对y因素的影响,可以先找一个z,z只影响x,不直接影响y,那么z就是x的一个工具变量。通过z造成x的变化,进而研究引起的y的变化,这就构成一个因果链条。在上面的例子里,经济学家发现,可以用降雨量作为一些地区农民收入的工具变量。因为在很多地方农民是靠天吃饭的,干旱会导致农作物减产和收入下降,而天气相对于农业生产活动是外生变量,不会直接对储蓄行为产生影响。因此用天气变化引起的收入变化,可以得到收入对储蓄的因果影响。安格里斯特和因本斯将这一思想进一步正式化,给出了工具变量方法的一般框架(即LATE)。

借助自然实验的方法,经济学家可以在使用观测数据的情况下,回答很多重要的问题。从这个意义上说,整个世界就是经济学家的实验室,经济学的研究范围大大拓展了。

因果识别之“力”:见微可知著

什么因素造成了国家间的贫富差异?有的人说地理位置决定经济发展,如法国思想家孟德斯鸠。这种观点带有“宿命”的意味,位于热带的国家是否因为天气热、疾病多就不容易发展了?国家越靠近赤道越落后,这个是因果关系吗?第二种观点认为文化重要,如马克斯·韦伯,认为宗教影响到经济发展,新教伦理的国家经济发展比较快,天主教国家差一些,其他的更差;也有人说儒家思想很重要,中国、东亚四小龙的经验则是证据。还有一种观点认为,制度决定了经济发展,例如保护产权、法治等因素。众说纷纭,如何检验呢?

MIT的阿西莫格鲁(Acemoglu)教授跟他的同事约翰逊(Johnson)、罗宾逊(Robinson)用工具变量法给出了一种解释。他们用历史上殖民地的死亡率做制度的工具变量。背后的道理在于,非洲有些地区历史上因为疟疾、自然条件恶劣等因素,不适合居住,殖民者不愿意在此长期定居,而是建立掠夺性的殖民政府,把石油、金属等资源运回欧洲去。在生存环境比较好的地区,殖民者更愿意长治久安,因而也带去了欧洲的制度。作者用死亡率作为制度的工具变量,进而再研究制度对经济发展的长期影响,这样就得到了因果关系。他们发现,制度是影响经济发展的重要因素。历史不能假设,但是他们的研究告诉我们,在“逝者如斯夫”的历史长河中,也可以通过自然实验的方法打开历史的“黑匣子”,重构历史的反事实,找到其中的因果规律。

再举一则离我们较近的例子。2008年的全球金融危机造成美国经济大衰退。这次危机的原因是什么,为什么会导致如此剧烈的衰退,这是一个典型的宏观问题。2008年金融危机爆发前后,美国的房地产泡沫很大,可没人能说清楚原因是什么。国内关于房地产泡沫的解释可谓众说纷纭,有人说货币超发,有人认为刚需使然,城市化导致住房购买需求上升,也有人认为地方政府采取土地财政,导致地方政府有动机推高房价,挤牙膏式的供给土地。美国学者对此的解释同样莫衷一是,其中一种观点认为是信贷供给过多,创造了大量住房抵押贷款;另一种观点认为是人的非理性因素,市场参与者对房地产共同抱有乐观态度,越涨越买,水涨船高。问题是如何进行因果性检验来识别哪种机制在发挥作用呢?

来自芝加哥大学的印度裔教授苏菲(Sufi),和另一位来自普林斯顿大学的巴基斯坦裔教授米安(Mian)用双重差分的方法研究了这个问题。在联邦制的独特背景下,美国国内每个州都可以自己制定一些法律。在1980年之前,美国的银行是受管制的,法律规定一个州的本地银行不能在州外,或州内其他市设立分行,好比上海的银行不能在北京设分行。但自1980年起,银行管制逐渐放松,有的州开始允许别的州的银行来设分行,每个州放开的时间是不一样的。这两位学者利用这一自然实验,发现在早放开管制的州,银行信贷供给增多,居民融资更加容易,这个地方的房地产价格随之暴涨。他们还发现,在危机爆发前五年,家庭债务积累最多的那些州,在危机后几年里遭受的经济衰退也更严重。因此他们的研究既说明了信贷扩张带来房价上涨、家庭债的增加,还证明了家庭债务积累和地区衰退的关系,回答了为什么这次金融危机对实体经济冲击如此巨大的问题。此项著名研究对探究中国房地产问题非常有启发意义。

所以,我们可以用精巧微观的自然实验方法来研究一些非常宏大的问题,包括经济周期、经济衰退、金融危机,也包括历史上的重大问题,如制度如何决定经济发展,等等。

大卫·卡德、吉多·因本斯。图/法新

最佳的入门教材

对于希望了解因果识别的方法、认识现代实证经济学的研究范式和方法论的读者来说,本书绝对是不二之选。这既因为本书作者功力深厚、知识权威,也因为作者安格里斯特本人幽默风趣,使得本书的可读性非常之强。由于笔者的私人经历,可提供一二则安格里斯特教授的趣闻逸事以证此言不虚。笔者在哈佛大学做富布莱特访问学者时,去上过安格里斯特教授的课,他上课特别有趣,他在每个学生的桌子上放着学生的名字卡片,方便他随时叫出同学的名字来回答问题,目的就是要挑战同学们。他年轻时做过军人,所以走起路来昂首挺胸,非常有个性。他号称自己是Master,中文叫“大师”,他喜欢中国的功夫片,特别喜欢中国的文化。安格里斯特教授早年另一本关于计量方法的教科书,也是笔者最早介绍给格致出版社的。那是2008年,我在耶鲁大学做博士后,第一次看到他那本Mostly Harmless Econometrics尚未正式出版的PDF书稿,当时看到觉得特别神奇,既写得通俗易懂,又将因果关系的相关方法总结得非常清楚,语言也幽默诙谐,于是马上就推荐给格致出版社。后来那本书的中文版也很流行,叫《基本无害的计量经济学》。从事经济学研究的同学或老师们几乎人手一册。同样的,我相信这本更深入浅出的《精通计量:因果之道》也会为中国的读者们带来不一般的学习乐趣,也会人手一册。其实,自从这本书出版以来,我都将其推荐给每届新生。在我看来,如果不懂因果识别的思想,就很难进行科学思维,会影响到对世界的认识和思考;而本书则是最佳的入门教材。

站在当下的时点,中国问题需要更多更扎实的经济学实证研究。中国有很多重要的问题亟待回答:如中国房地产泡沫的原因到底是什么,中国2012年以后的经济增长减速的原因究竟是什么,老龄化的原因何在,中国收入差距大的原因何在,中国环境问题的原因何在,等等。对这些问题的回答,有利于推动中国的高质量发展。

从国际学术界来看,经济学研究愈发引人入胜,伴随着这场“可信度革命”,经济学研究的政策意义也愈加重要。好的实证研究可以帮助我们理解世界,厘清背后的因果关系,在此基础上制定出更加有效的政策,来应对当前中国和世界的诸多挑战。如果用医学类比,经济学者和政策制定者要首先找到“病因”,在此基础上提出“治疗方案”,然后可以检验“疗效”。自然实验的方法有助于我们解释这个世界,并使世界变得更好。

对于经济学和其他社会科学而言,这个大千世界就是我们的实验室,有待研究的重要问题比比皆是;为此,让我们来读“大师”之作,循因果之道,觅自然实验,启智慧之旅吧!

(作者为复旦大学经济学教授;编辑:苏琦)

王永钦/文