一、引言 政治科学发展至今,始终伴随着对研究设计的科学性的探索和对研究方法的革新。进入21世纪以来,政治科学研究明显呈现出由相关性研究转向因果性研究的趋势。①政治学者们愈发不满足于仅对各种要素间的关系强弱进行确认,而逐渐投身于对变量间的因果效应以及机制的探讨之中。②诸如时间序列分析、断点回归、双重差分法等研究方法也得到快速传播和广泛应用。其中,实验法这一源于自然科学的因果推断方法,因其设计逻辑明确、科学性强,尤为引人注目。迄今为止,已有多本专著介绍和讨论实验方法在政治学领域的应用。在2016-2020年间,政治学三大国际顶刊《美国政治科学评论》(American Political Science Review)、《美国政治科学杂志》(The American Journal of Political Science)以及《政治学杂志》(Journal of Politics)上发表的研究和应用实验方法的文章也已多达268篇。③ 与此同时,中国国内研究者对实验方法也表现出了极大热情,国内期刊发表了许多引介和应用这一方法的文章。④但有趣的是,现有文章多集中于调查实验(survey experiment)和田野实验(field experiment)这两种从实验方法派生出来的模式;而对实验方法的根本模式——实验室实验(laboratory experiment)——的讨论和应用却并不多见。人们对实验室实验仍存在一些常见的认识谬误。特别是,很多教科书和研究设计者认为,实验室实验“虽然内部效度高,但外部效度低”,因而无法真实反映政治现实并得出对政治实践有借鉴意义的结论。⑤殊不知,实验室实验的外部效度并不一定低于其他方法,同样,也并不是所有实验都能保证内部效度高。 针对这些常见的谬误,本文系统讨论了实验室研究设计的基本逻辑和原则,以期展示其在政治实证研究领域的应用潜力。文章着重讨论了两个基本问题:第一,实验室政治研究是如何对政治现象或因素展开因果推断的?第二,研究者应如何正确理解实验室实验的效度优势并在设计中加以应用?本文提出,根据研究效度理论,那种认为实验室实验的效度“内高外低”的看法并不全面。虽然这种方法确有其局限性,但只要精心设计、妥善实施,仍能为因果推断研究提供强有力的支持,是值得在政治科学乃至整个社会科学领域进行推广的一种重要方法,在有关中国政治的实证研究中更是具有广泛的应用空间。同时,本文也提出,方法论学者也应在清楚认识实验室实验的优势和局限的基础上,不断与数据科学、大数据技术等前沿理论和方法相结合,以扩大实验室实验的应用领域,推动其为实际政治问题研究做出贡献。 二、实验逻辑与政治学实验室实验 实验是建立在遵循“反事实”(counterfactual)逻辑之上的因果推断方法。实验室实验则是依照该逻辑在特定范围(实验室)内构架反事实对照的一种研究设计模式。因此,理解实验逻辑是理解和应用实验方法以及实验室实验模式的重要前提和基础。 (一)实验逻辑 实验逻辑是在自然科学研究中常见的研究设计逻辑。耶日·内曼(Jerzy Splawa Neyman)和唐纳德·鲁宾(Donald Rubin)将其进行数学规范化,提出了因果推断的重要理论——内曼—鲁宾因果理论(Neyman-Rubin Causality Theory),也被称为鲁宾因果模型(Rubin Causality Model,RCM)。⑥这一模型被引入社会科学后,它很快就成为该领域进行因果关系研究的基础性理论。鲁宾因果模型将作用因素或干预因素(treatment variable)对个体i的因果效应定义为该因素存在时发生的结果
与它不存在时可能发生但实际并未发生的结果(即反事实结果)
之间的差异
,即
然而,这一定义在实证层面不是自足的,需要依靠特殊的假定才能成立。这是因为在实际观察中,干预因素要么存在,要么不存在,所以研究者不可能同时观察到
和
。在这种情况下,干预因素对单一个体的因果效应
是无法被直接观测到的。因此,研究者只能谋求在群体层次上对因果效应进行估测。而若想这种估测在统计学上可行,就需要引入一个关于个体的强假定——鲁宾称之为“个体处理稳定性假定”(Stable Unit Treatment Value Assumption,SUTVA)。⑦“个体处理稳定性假定”规定,干预因素对群体内个体的作用具有针对性和同质性。此假定之所以是一个强假定,在于它对观测因果效应的对象和环境都有严格的限制。⑧首先,它要求干预因素具有针对性,即干预因素只会改变单一个体,而与其他个体是否受到作用无关。其次,对单一个体的这种作用对于每个个体的影响又必须是同质的,差别仅是个体受影响的大小而已。唯有这样,我们才能合理运用统计学,通过对多个受干预个体的观察来估测效果,并将其与未受干预群体进行比较。再次,“个体处理稳定性假定”要求,干预因素发生作用的方式必须是严格一致的。譬如,在估测信息对选民决策的影响时,如果选民获得信息的方式存在差异性(比如,有的是道听途说听来的,有的是从报纸上获悉的),那么其结果则可能不是由同一种因果效应导致的,因而也就不能将它们放在一起来估测因果效应。复次,干预因素的存在与否也必须是可被观察到的。只有同时获得干预因素存在和不存在时的数据,才能对观察结果进行比较,进而推断该因素的因果效应存在与否以及其大小和方向。最后,干预因素的作用必须出现在实验对象(subjects,也称实验被试)作出决策和形成行为结果之前,而不能同时或在其之后发生。譬如,在测量信息对选民的投票意愿产生的效应时,如果选民在不断接受信息的过程中就已经决定了是否投票,而非等到获得所有信息后才作出决定,那么研究者则无法根据鲁宾因果模型来推断信息对选民的意愿产生的因果效应。⑨