无论是基于父母“望子成龙”的殷切期盼,还是国家层面追求教育高质量发展的卓越规划,教育作为“受力”的一方无时无刻不处在成绩焦虑之中。教育中的利益相关者都期待学校、教师、学生交出一份满意的教育质量“答卷”,也为此想方设法地努力寻找质量提升的途径。其中,标准化测验被当作是一种直观、客观又相对科学地衡量并改善教育效果的方式受到推崇和信赖。一方面,按照循证科学的发展状况看(尤其是在医学领域的突出贡献),标准化测验相对于无根据的个人判断来说,其基于事实证据筛选、诊断出使学校教育有效的因素有一定的说服力,为学校教育实践改进提供了数据支撑,确实推动了教育的科学化进程,也体现着教育研究对教育实践的密切观照;另一方面,作为一种评估手段,标准化测验也承担着管理的职能,即以问责绩效制度的方式敦促学校及教师提高教育过程的质量和效率,从管理学的视角看这有利于带来“好的绩效”。但上述两方面都拘泥于标准化测验的工具性价值,却并没有更深入地考量教育的本真性价值——教育究竟要为学生带来什么? 教育领域一直在做着“什么是好教育、怎么实现好教育”的探索。对这两个问题的回答,均涉及对教育质量的评估和衡量。受实证科学的影响,当代人们对好教育的判断在很大程度上依赖于标准化测验的技术性结果,甚至存在仅仅凭借测量所得数据去衡量活灵活现的人的现象,数字代替了人本身。当前,我们对教育质量的认知存在一种错觉,即认为学生在标准化测验中取得高分就代表着这是一种高质量的教育。比如,在PISA测试中,一个地区或者国家的学生获得了相对于前一阶段更高的分数,就意味着这一地区或国家的教育质量获得了提升,那些排名靠前的国家和地区因此而获得全球性的赞誉和效仿(比如芬兰、上海等)。也正因为标准化测验提供了一系列清晰明了的测试领域、题目、量化指标,这似乎给每所学校、每位学生的提升路径指明了方向,大家对各种各样的教育测量趋之若鹜,似乎达到了某个数字、某个排名就是我们获得了好教育的证明,而借着这些“优秀的证据”,学校和学生会获得相应的发展资源。 对于标准化测验,其主要在于试题编制的标准化、考试实施的标准化、以及阅卷评分的标准化。标准化测验关键在于“标准”二字,它依赖于可测验的、可标准化的、可预成的技术化操作,其所追求的并非人的超越性发展,而是测量对象的高度同质化、测量效率的提高、测量结果的直观可量化,最直观的表现就是达标,让原本多元化的鲜活生命趋同为测验所要求的预设生命体,并将这一转变的过程描述、界定为“提升”“发展”,在特定群体中获得相对高分的学生被推崇为优等生,而低分的学生则被认为是后进生。通过“题海战术”等应试策略,并掌握了标准化测试的稳定模式之后,后进生会取得看得见的进步,这种进步和被界定的更多数量的优等生被视为“教育的成功”。而这种相对简化的评估方式其实是一种捷径,学校以及教师在考试中尝到了“进步”的甜头,获得了声誉和更多的教育资源,并且继续循环、强化着这种“进步”,教育主管部门也受益于这种直观简洁的评价方式所带来的行政决策便利。这些利益相关者都沉溺其中,但他们却都忽视了教育本身的复杂性——教育对象的多元性、教育实践的丰富性和不可控性、教育目的的价值性等。在测量时代里,荷兰教育哲学家比斯塔(Gert J.J.Biesta)对教育测量的论述会给我们辨别何为好教育提供更深刻的思考方向。 一、标准化测验彰显工具价值:追求片面“有效”的教育质量 就测验的缘起看,在20世纪初,受实证科学的影响,欧美地区的部分学者倡导用科学的方法对教育问题进行分析和实验,致力于推动教育成为可量化的学科,标准化测验被视为检验教育成果的必备工具。在基于证据的价值导向下,标准化测验在引入国内的过程中,也逐渐让人们生成了教育成果可以用客观标准/数据进行衡量的观念。可是在客观标准“丈量”下的教育成果,真的是我们期待和需要倡导的好教育吗?标准化测验的测试内容是有限的,且测试到的只能是能够测试的方面,比如知识记忆的全面与否,但非智力因素等方面却被排斥在测量之外,也就无从谈起能够测量到这些。对于“无言之教”这样的受教经历,虽然我们无法通过一些数据等技术性的事实信息去呈现,但是这些个体确实明悟到了事物。再者,将客观标准作为有无限可能性的人的成长方向,在很大程度上会窄化人发展的可能性空间。这不得不让人质疑:“通过标准化测验,带来教育质量提升”的话语是否行得通呢? (一)专注“有效”的教育 标准化测验以一种强势的姿态去关注“有效”,这已经成为一种价值追求。教育中公认的有效教育和教学有效的例子,都在向我们展现“什么是我们应该去做的事情”。在比斯塔看来,“有效性”是一种工具价值,用来表达质量或者过程之类的东西,它所崇拜的是,凭借安全的方法,使得质量或者过程产生某种结果的能力。[1]而无论是测量文化的兴起,还是教育中循证的取向,都聚焦于教育过程的有效性和效率,而不是关注教育过程会带来什么。可以说,“有效”本身和“有效”带来的收益抹杀着我们对教育的其他想象和期待。 基于有效干预、因果逻辑,标准化测验可以被理解为一种工具技术取向的方式,所追求的是尽可能地保持安全和稳定,且倾向于消除差异和多元(消除那些造成教育困难——但恰恰是使得教育能称之为教育——的事物),它通常认同教育的进步可以通过更好的教育方法和手段来达到,可是这会使得教育研究专注于改进教学技术和策略,而非推动对教育目的的批判性讨论。[2]这可能会导致当教育没有获得成功或是教育的成功尚未显现时,我们通常将原因归结为技术性的失误(比如学生的不努力、教师的不负责等),并据此设想总会找到克服的方法,而不会怀疑这套系统本身会有什么缺陷。 标准化测验要关注的是抽象简化的排名、分数、绩效,而不是关心教育真正能够为教育者做些什么。按照标准化测验的运作现实,其将要走向的未来是继续生产同质化的学生、日益单调简化的教育生态、逐渐僵化的确定性测验模式,想方设法让身心尚未成熟的学生按照它事先所划定的方向、路线、指标、模板成长。可是,这些固定性的标准对于活生生的人来说是真正适合的吗?这些几十年如一日的有标准答案的确定性测验内容真的能衡量一个人的学业质量吗?这种便于问责和资源分配的技术手段能带领学生走向注重创新素养的未来吗?