中图分类号 D0 威慑理论是冷战时期占主导地位的一种国际安全理论,被一些学者誉为20世纪国际关系领域最重大、最深奥的学术创造。罗伯特·杰维斯(Robert Jervis)倡导的心理分析方法、亚历山大·乔治(Alexander George)倡导的个案分析方法和托马斯·谢林(Thomas Schelling)倡导的博弈论方法,是威慑理论研究的三种基本方法。由于威慑情景具有行为者数量有限、行为者之间互动明显以及所涉及的利益重大等特点,有些学者认为博弈论方法特别适合威慑等国际安全问题的研究。如果从决策科学角度来考察,博弈论方法是一种基于理性假设的规定性决策方法,规定理性行为者应该如何决策;而心理分析方法或个案分析方法则是基于有限理性假设的描述性决策方法,它研究现实中有限理性行为者实际上如何决策。由于现实中的威慑问题通常十分复杂,上述研究方法经常被结合起来使用,这里主要对博弈论方法在威慑理论研究中应用的历史、当前一些研究进展及其适用性与局限性进行综述。 一、博弈论方法在威慑理论研究中应用的历史 威慑理论与博弈论几乎是在同一时期创立的两种理论,国际安全问题特别是核威慑问题是最早采用博弈论方法进行研究的领域之一。博弈论方法在威慑理论研究中应用的历史大致可以划分为三个阶段。 第一个阶段是从20世纪40年代中期到20世纪60年代中期。这一阶段的最大特点是,核威慑研究对博弈论方法的强烈需求推动了早期博弈论的发展,并催生了后来非常有影响的“囚徒困境”和“斗鸡博弈”等经典博弈模型。核威慑研究的先驱者贝尔纳德·布罗迪(Bernard Brodie)曾在其早期提出的核威慑思想中试图运用冯·诺伊曼(Von Neumann)的两人零和博弈最小最大准则来强调“理性选择”的重要性:“当面临局势不可推测的紧要关头,决策者不可能完全获取最大限度的所得,因此,理性的选择便要求决策者分析出对对方最有利的策略,并据此作出相应的决策,这种选择尽管不能得到最大的所得,却能避免最大的所失。”由于核战争中没有胜利者的双输结局,无法套用两人零和博弈来解释,兰德公司的两位数学家便设计了后来称为“囚徒困境”的非零和博弈实验。虽然“囚徒困境”模型也适用于解释威慑现象,但严格意义上的第一个标准核威慑模型是“斗鸡博弈”模型。“斗鸡博弈”模型揭示了利益冲突的双方都有极力避免最坏结果的共同利益的一面,这与核战争中没有胜利者的核威慑思想十分吻合。谢林以及赫尔曼·康恩(Herman Kahn)、丹尼尔·艾尔斯伯格(Daniel Ellsberg)等许多学者对“斗鸡博弈”进行了深入研究,并试图用于解释1962年发生的古巴导弹危机。 第二个阶段是从20世纪60年代中期到20世纪80年代中期。这一阶段的最大特点是,在威慑与冲突研究中出现了一些独特的、非主流的博弈分析方法。一方面,研究者对2×2矩阵形式的博弈问题进行深入和系统的研究,如阿纳托尔·拉波波特(Anatol Rapoport)和迈尔文·盖尔(Melvin Guyer)对78种没有固定支付的2×2矩阵博弈进行了分类研究,格伦·斯奈德(Glenn Snyder)和保罗·迪辛(Paul Diesing)在此基础上建立了16种危机情景的2×2矩阵博弈。另一方面,采用2×2矩阵形式的静态博弈模型对古巴导弹危机所作的简单解释受到了普遍质疑,一些研究者提出了自己的博弈分析方法,其中较有影响的有奈杰尔·霍华德(Nigel Howard)的元博弈(metagames)方法、尼尔·弗雷泽(Niall Fraser)和基思·希佩尔(Keith Hipel)的基于超博弈(Hypergames)的冲突分析方法以及史蒂文·布拉姆斯(Steven Brams)的行动理论(theory of moves)。霍华德应用元博弈方法研究了古巴导弹危机和越南战争,布拉姆斯用行动理论研究了古巴导弹危机并比较了与元博弈方法的差异,弗雷泽和希佩尔用超博弈和冲突分析方法研究了苏伊士危机和古巴导弹危机。由于元博弈与重复博弈、超博弈与不完全信息博弈、行动理论与动态博弈分别类似,因此巴里·奥尼尔(Barry O' Neill)认为,上述这些分析方法是因错误的原因而反对主流博弈论。 第三个阶段是从20世纪80年代中期至今。这一阶段的最大特点是,威慑理论研究中所采用的博弈分析方法逐渐向主流博弈论回归,不完全信息动态博弈模型开始得到广泛应用。以罗伯特·鲍威尔(Robert Powell)、弗兰克·扎格尔(Frank Zagare)、詹姆斯·费伦(James Fearon)为代表的新一代研究者普遍采用主流博弈论中的均衡概念(如子博弈完美纳什均衡、贝叶斯完美纳什均衡等)来建立威慑理论模型。巴里·纳勒布福(Barry Nalebuff)最早采用主流博弈论方法来研究威慑问题,他在1986年建立了战争边缘策略与核威慑之间关系的模型。鲍威尔研究了双方不完全信息条件下的核威慑与战争边缘策略,得出了与传统威慑理论不同的结论。扎格尔和马克·基尔戈(Marc Kilgour)对威慑可信性进行了研究,认为威慑可信性与博弈论中的子博弈完美纳什均衡同义,此后他们进一步提出了完美威慑理论。20世纪90年代中期,费伦基于信号博弈研究了国内政治等因素对威慑的影响,此后他进一步对昂贵信号(costly signals)与延伸威慑关系进行了研究。安德鲁·基德(Andrew Kydd)用博弈论研究了威慑升级的螺旋模型, 阿维纳什·迪克西特(Dixit)和苏珊·斯克斯(Skeath )运用不完全信息动态博弈模型和完美贝叶斯均衡概念重新对古巴导弹危机进行了诠释。