中图分类号:G40-034 文献标识码:A 文章编号:1001-4519(2013)03-0029-12 一、引言 近十年来,随着国家“科学发展观”在教育政策制定领域的不断深化,随着教育领域可用于研究的数据库不断增加,我国教育政策评估类的定量研究从数量和质量上都在迅速提高。一个科学的、对纳税人负责的教育政策的制定和实施应该由以下几个环节构成:政策设计、论证、制定、实施、评估、改进。由于教育问题错综复杂、教育资源投入巨大,而且教育政策和改革直接影响到学生和家庭的前途命运、乃至国家人才培养的目标,因此,制定和实施有效的教育政策至关重要。而准确评估政策的效果则是实现这一目标的技术关键。 政策评估方法包括定量研究方法和质性研究方法。国际上整个社会科学的发展趋势越来越青睐定量研究方法,国内教育政策分析类研究也越来越偏爱实证研究。这一方面说明了不论是政策制定者还是教育研究者都希望用更加科学、严谨的方式制定和评估教育政策;但另一方面,现有的定量研究存在很多局限,部分定量研究类文章在研究设计、研究规范性以及定量研究的局限认识不足。本文尝试概括性地介绍国际主流教育政策定量研究方法,并探讨混合式教育政策评估方法的优势,希望对教育政策评估有一定借鉴意义。 本文将首先界定教育政策评估的概念以及本文所讨论的定量研究方法的范围,随后简要介绍美国近几十年教育政策定量研究方法的发展历程。文章的主体有两部分:(1)对定量研究方法中的因果推断模型的介绍;(2)对定量研究方法的局限的讨论以及对混合式教育政策评估方法的讨论。 二、讨论范围的界定和背景 教育政策和改革(下文统称为政策)的目标基本上都是为了提高教育质量和教育公平。教育政策评估包括对不同阶段(小学、中学、高等教育等)的教育政策实施效果的评估。每一项教育政策的出台,都有其期望实现的目标(即提高某项教育产出,比如学生某科成绩、某项能力、升学率、就业率,教师质量等)。政策评估的目的就是通过科学的研究设计,把某项政策的效果识别出来。其结论主要有两类:(1)该政策对相应的期望产出到底有没有显著影响?(2)如果有,那么这个影响是正向还是负向、影响大小如何?转换成定量研究的术语,就是某项教育政策的实施和目标教育产出的变化是否有因果关系(该项教育政策是否是导致目标教育产出变化的原因,还是另有他因)?这里需要强调的一点是,只有因果关系才能为教育政策制定和评估提供可靠的依据,相关关系则不能说明问题。因此,本文主要讨论教育政策评估定量研究方法中的因果推断模型。 因果推断模型不仅仅是国际主流教育政策评估的定量研究方法,也是公共财政、劳动力经济学等多个社会科学领域所主要采用的实证研究方法。因果推断法首先在实证经济学中发展,随着教育理论的发展和高质量教育研究数据的增加,因果推断法也逐渐被引入教育政策评估。以美国为例,自从1966年科尔曼报告①对美国教育现状敲响警钟以来,美国政府、学校以及学术界都在积极寻求提高教育质量和教育公平的方法。上至联邦政府,下至州政府、各学区纷纷开展各类教育实验、改革和资助项目。而且各项教育政策、改革项目等都要接受学术界的跟踪效果评估。这一方面是为了满足政府问责制的要求,另一方面也是为了根据实际效果改进下一步财政拨款的分配方案。例如美国的教育券,特许学校(Charter School),STAR②项目,大规模的大学生资助(例如Pell Grant,State Merit Aid),以及墨西哥的有条件的现金转移支付③(Conditional Cash Transfer)等。可以说,迫于国家人才培养的需要以及来自公众监督的压力,把教育财政拨款用于最有效果、有效率的改革和政策上,已经成为公认的价值取向和评判标准(当然,提高教育公平也是很重要的一条标准)。 然而,在我国的教育定量研究中,这些方法鲜被使用。其中一个重要因素是数据的不可获得。从文献中可以看到,很多国家从联邦政府到地方政府、甚至到学校都进行了很多由政府主导并资助的、由学者参与设计和评估的教育实验和教育改革,这些实验和改革在一开始就考虑了实验的研究设计,并注意在整个过程中跟踪搜集数据。有的实验会持续很多年,这也保证了研究者有足够的时间序列数据来识别干预效应。而且,这些数据是对大部分学术研究者开放的,并鼓励学者们应用这些数据去研究现实问题。但在中国,尽管我们有很多的教育改革和教育实验,但这些干预在设计和实施过程中没有考虑到后续评估所需要的研究设计和数据需求。即便有一部分管理数据,这些数据也不对学术界公开。因此,如果政府和相关机构作为公共服务的提供方,能够本着科学的精神,使得政策的执行过程中的数据搜集常态化,并鼓励广大定量研究者应用数据做出严谨的分析,则不仅教育研究的水平会得到大幅度提高,也为后续的政策和项目改进提供科学的依据。 三、因果推断模型 因果推断模型是基于传统的计量经济学(尤其是最小二乘法和工具变量法)发展起来的一套基于实验理念的定量研究方法。国际上已经有一系列系统总结因果推断模型的论文和著作④。因此本文的重点在于介绍,而非系统论述。