过去20多年,国际大规模教育评价不断升级,显著调动了各国(地区)政府、民众的热情,致使投入大量的资源,竞相追逐。新时期我国教育改革更加注意吸收世界上先进的办学经验,凭借之一正是国际大规模教育评价提供的数(证)据、排名以及政策评论。这项由少数科学家发起,旨在教育领域建立国际比较机制的创举,经国际组织的大力推动,已经从西向东、从北到南扩散,得到了全球绝大部分发达国家、发展中国家的响应,越来越成为一种不容忽视的教育文化现象。 一、文献综述 国际大规模教育评价源于西方。自20世纪90年代起,国际教育评价协会(以下简称IEA)、经济合作组织(以下简称OECD)、联合国教科文组织(以下简称UNESCO)、世界银行等国际组织开始大力实施国际教育评价项目,如国际数学和科学的学习趋势(Trends in International Mathematics and Science Study,TIMSS)、国际阅读素养进展研究(Progress in International Reading Literacy Study,PIRLS)、国际学生评估项目(Programme for International Student Assessment,PISA)、国际成人能力评估项目(Programme for the International Assessment of Adult Competencies,PIAAC)、全球教育监测(Global Education Monitoring,GEM)等。今天,国际大规模评价不仅在世界范围掀起了教育监测、评估的风潮,而且自身也成了一种复杂的教育文化现象,进入教育学研究视野。欧美学术界在这方面的研究较早。 研究集中在两个方面:一是测评技术和数据统计方法信效度,一般由心理学、统计学和数学等领域的研究者承担;二是某个项目的评估规则、数据解释与价值判断在文化、政治以及意识形态层面的意义。 第一方面的研究,核心是要论证说明国际大规模教育评价程序上科学,性质上是一项中性的教育调查,目的是要及时发现并修补测评漏洞。技术上,国际大规模教育评价经过近60年的发展,在测法、抽样、计分、试题转(翻)译,以及结果分析等方面,尽管还有提升空间,也已经相当先进了。这方面的研究,主要受到了两方面批评。一是以荷兰教育哲学家比斯塔(Biesta,G.)为代表的学者指出,测评了教育要素并不等于测评了关键的教育要素及其本质方面。[1]也就是说,教育是复杂的,可测的并非是最重要的,从而提出质疑国际大规模教育评价的合理性。二是美国学者梅耶(Meyer,H.D.)和本亚伦(Benavot,A.)等指出,测评虽然得出了高分和低分,但高分、低分是多种因素(教育因素和非教育因素、学校教育和校外影响)造成的结果,由此并不能推断出分高代表优质的学校系统,分低代表薄弱的学校系统。[2]也就是说,测评技术再严密,也不足以支撑国际组织利用测评结果对各国学校系统的质量作出判断、分出优劣。 第二方面的研究,集中从本体论和价值论上对国际大规模教育评价进行反思性批评。一般是以个别项目为对象展开,现以PISA项目研究为主。概括而言,具体包括四个方面。第一,探讨参与国际大规模教育评价的国家(地区)的主体多元化现象及影响。有研究者发现,从2000年起,原先只是高收入国家(地区)参加的游戏,一些中、低收入国家也开始加入,故造成测评项目的理念、定位、表现形式都多少发生了改变。[3]第二,揭示测评结果的解释由纯粹变复杂。国际组织越来越注重加强专业测评与教育政策的亲密性,利用国际大规模教育评价的结果生成一种“解释性权力”,指引全球教育发展动向。第三,力证国际测评充当国内教育决策、国际教育治理的凭借工具。澳大利亚学者林嘉德(Lingard,B.)指出,不同类型的政府、教育系统借由国际层面的大规模教育评价结成“全球化的教育问责网络”,利用它来服务于“用数据支撑政策”或“政策借鉴”[4]的决策需要,勾勒全球教育发展的蓝图,共谋教育治理命题的主次。第四,从不同立场对国际大规模教育评价进行元评价。一类是正面的评价。曾任IEA主席之职的胡森(Husen,T.)认为,国际大规模教育评价确实存在技术、方法与经费上的欠缺,但坚信它是在“开创性精神”[5]引导下的创举。另一类是负面的评价。PISA、TIMSS这些项目在世界范围内炙手可热,权赫勒(Trohler,D.)质疑其存在价值。他以PISA为例,将其放入OECD的历史背景中加以考察,把PISA和冷战文化联系起来,指出PISA正在复活“一个世界”的冷战意识形态,它存在将“集权化”“标准化”“千篇一律”“职业训练”“技术精英主义”的理念拉回全球教育领域的危险性。[6] 批评性反思目前是欧美教育理论界的研究主流。批评各个评价项目在技术、统计和方法论上的缺陷,反思它们忽视教育的文化和伦理基础、测评结果被政治误用的后果。许多学者甚至不惜公开表态,提出应彻底否定这些项目的价值。当中,影响最大的当属一份反对PISA的公开信。[7]这封信得到136名学者联合署名,强烈要求OECD终止PISA项目。 反思一事,任重道远。尽管面临众多批评,国际组织丝毫没有放弃国际大规模教育评价的念头。它们借助各式各样的国际教育评价项目之力,成功介入全球教育治理体系,牵引各国(地区)的官方教育决策、民间教育舆论甚至教育观转向。许多国家和地区教育当局对它半推半就、欲拒还迎,有时还利用国际大规模评价项目的有利证据推进国内教育改革进程。于是,国际大规模教育评价事业反而越来越升温,影响力呈增长态势。