过去十多年里政治学实证研究经历了因果识别(causal identification)的革命。这种现象的出现,一方面是因为越来越多的经济学家开始尝试政治学议题,潜移默化地将经济学的研究范式引入了政治学,另一方面也是因为政治学的研究成果更为频繁地被作为政策决定的依据,研究人员不再满足于从数据中寻找相关性,而是希望发现因果关系。在此之前,政治学主流的研究方法是基于对观察数据(observational data)的分析。无论是通过个案比较,还是运用大样本统计分析,本质上都是通过案例间的比较排除干扰因素,以发现因变量与自变量之间的相关性。但是基于观察数据的因果关系分析具有较大的局限性。即使是非常稳健的相关性的结果,也可能会受到包括样本选择偏差、反向因果、遗漏变量等方面的质疑。 这种变化对政治学的研究范式和研究问题都产生了深远的影响。为了应对观察数据在因果关系识别上的挑战,政治学研究日益青睐基于设计的实验法。研究人员通过严谨的实验控制对照组设计,人为地改变实验组自变量的值,并比较其与控制组因变量的区别。因其研究设计的严谨性,实验法可以为研究者提供非常精准的因果效应的估计,其结果也往往更具有政策参考的价值。但是实验法同样具有局限性。首先并不是所有的研究议题都可以用实验法来检验,而且往往那些无法用实验法检验的话题,恰好具有重要的理论意义。例如,如果想要研究民主化对一国经济发展的影响,研究人员显然无法将威权国家随机分组,让一部分国家成为民主国家并观察其经济发展表现。有些问题虽然理论上可以通过实验的方法进行检验,但是研究设计受道德考量的制约也无法实现。例如,如果想要知道战乱经历对人的政治态度的影响,研究人员就需要让受访者去战场上亲身体验一下战争的残酷,并测量政治态度的变化。但这种可能伤害到受访者的研究设计显然无法在现实中执行。这些局限使得使用实验法的政治学研究者逐渐回避社会科学领域的传统经典理论问题(例如现代化理论、国家构建、民主化、冲突等),转而进行一些以政策为导向的微观研究,研究的话题和所涉及的理论文献向应用公共管理靠拢。长期看来,强调因果识别的研究导向和实验法的使用,使得政治学的研究出现以数据和研究方法为驱动(data and methods driven)的倾向,并且减少了与传统经典话题的真正有意义的对话。 本文认为,政治学的一些传统研究方法在以因果识别为研究导向的潮流中可以焕发新的活力。这里说的传统研究方法,特指比较政治学中以国别、区域为研究对象的研究,要求研究者对研究对象的历史进行深度了解和发掘,对所研究对象的社会背景知识(不仅限于自己所研究的特定话题)有广泛积累。本文认为,掌握研究对象的历史与细节知识,本身并不与因果识别相矛盾。相反,掌握丰富的关于研究对象的质性知识,为研究者通过“自然实验”(natural experiment)来识别因果关系打开了大门。与基于设计的实验相比,自然实验具有成本低廉、可操作性强、可以检验的理论话题更为广泛等优势。这种方法将历史事件所造成的长期冲击纳入因果识别的框架,来分析制度、观念等内生性较强,但同时又颇具理论意义的变量的影响,是一种综合了质性与定量方法、观察数据与实验设计优点的研究路径。同时,基于历史事件的自然实验法对学者提出了更高的学术训练要求。研究者不仅需要深入了解研究对象的背景历史知识,也需要熟练掌握计量分析技巧,并将研究设计与重要的理论问题相结合。可以说,这种研究方法对选题立意、证据收集以及数据分析这几个评价研究的重要维度均有强调,同时不以牺牲其中一方来成就另一方。当然任何研究方法都不是完美的,基于历史事件的因果识别同样具有其局限性。 本文首先简单介绍历史自然实验的概念,之后分别结合制度变迁和政治态度两类具体研究,对基于历史事件的因果识别设计进行阐释,最后对这种方法的局限性做简单的讨论。 一、历史自然实验与因果识别 使用观察数据并通过相关性分析得出结论的研究面临着两大挑战。第一个挑战是反向因果问题,即在分析中被认为是解释变量的因素也可能受到被解释变量的影响而发生改变。第二个挑战是遗漏变量的干扰,即解释变量和被解释变量可能本身不存在因果关系,而是受某个未观测到的变量影响而同时发生改变。①研究者尝试使用各种方法解决这些问题,包括在分析中使用解释变量的时间滞后项以及在回归中控制尽可能多的干扰因素。但是这种“事后补救”(ex post)的办法存在各种局限,无法真正解决问题。② 为了解决这些问题,计量经济学家提出了工具变量的方法。③简而言之,工具变量是一个与被解释变量不直接相关,而通过影响解释变量来改变被解释项的变量。工具变量需要满足排他性限制(exclusion restriction),即其只能通过改变解释变量这一个渠道,而非其他途径,来影响被解释变量。为了满足这一条件,研究者采用的工具变量大都基于偶发的事件、自然灾害,或者政策的人为断点等。其背后的逻辑与基于设计的实验法相近,即通过近似随机(as-if random)的干预,排除其他干扰因素对被解释变量的影响。 历史事件形成的冲击同样可以被用于构建工具变量。虽然事故或自然灾难造成的短期冲击也经常被用于因果识别,但其检验的对象往往较为简单,容易受外界影响发生变化,且易于测量(例如选举结果等)。④而很多研究者感兴趣的对象,例如制度等,则更为复杂且不易变化,所以使用此类外生冲击往往具有局限性。而重大的历史事件,则可以在更长的时间维度上积淀出更深远持久的影响,因此可以用来检验一些更为复杂且不容易改变的事物的因果效应。下面就以制度和政治态度的研究为例,探讨历史事件作为工具变量在因果识别设计中的运用。 二、基于历史的因果识别在制度研究中的应用 制度变迁的原因及其影响是政治学关注的一个核心话题。自从20世纪50年代现代化理论提出后,主流观点认为政治制度的发展是经济发展的结果。⑤20世纪70年代以后,随着新制度主义学派的兴起,人们对制度与经济发展间的因果关系又提出了新的问题。制度主义学派认为良好的制度是经济发展的前提而非结果,这与现代化理论的因果关系形成了直接的冲突。由于数据的局限,尽管经济学家和政治学家尝试采用各种高级的计量方法,但还是没有办法取得共识。⑥分析的难点集中在两处:第一,政治制度的决定因素可能是多种多样的(包括历史、文化、气候、资源、战争、宗教等),利用观察数据只能控制有限的干扰变量,无法穷尽所有可能影响制度的因素;第二,经济发展与制度变迁这两个核心变量在理论上可以互为因果,即经济发展既可以导致制度变迁,同时制度变迁也会对经济发展产生影响。因此即使在回归分析中发现两者具有非常稳健的相关性,也无法判定经济发展与制度变迁在现实中的因果关系。