一、文献综述与问题提出 习近平总书记在全国教育大会上强调,“要扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾”,明确提出解决教育领域的“五唯”问题。[1]2020年,中央全面深化改革委员会审议通过了《深化新时代教育评价改革总体方案》,对“建立科学的、符合时代要求的教育评价制度和机制”做出总体部署。学界对“五唯”问题的关注由来已久,相关研究主要集中在“五唯”问题的表现、“五唯”形成的原因、“五唯”解决的策略等方面。 有研究者认为,“五唯”所涉及的人才评价、学校评价、质量评价、科研评价等方面的问题在我国教育评价中长期存在。在基础教育阶段,“应试教育”长期被批判,但学生综合素质评价始终难以真正成为“硬核”。高考改革曾经被寄予厚望的“自主招生”也因技术问题而于“2020年起,不再组织开展高校自主招生工作”[2]。早在20年前,就有学者指出,“我国少部分高校和研究机构已出现片面强调SCI及由其所派生的影响因子在科研评价中的作用”[3]。“简单绝对地使用SCI作为科研成果的主导性评价标准,存在很多局限性。”[4]时至今日,“五唯”已由“问题”变成“难题”。 对“五唯”问题的归因基本分为三类。第一种观点认为,主导型制度效应是根本原因,如在人事改革政策[5]颁布后,学校将企业绩效工资模式引入教师薪酬制度以及实行高层次人才相关政策[6]所产生的引导效应;政府对学校评价、各种评选(如重点实验室、基地等)及各项评估检查[7],以明晰的指标体系加以引导,并以审计文化相配合[8],形成规范性服从。第二种观点认为,评价理念不完善、评价方法不科学是“五唯”问题形成的技术原因,“指标—量化”的科学实证主义模式与工业社会生产方式的标准化、规模化等特征相适应,却未必适合学校组织与教师劳动;[9]目前尚未能以一种简便的计量方式给出明晰的指数来标识其水平与状态。第三种观点认为,人才管理滞后导致连锁效应是“五唯”问题形成的操作原因,高端人才评选后的管理松散,人才称号功能泛化外溢,[10]导致学校在人才政策中“帽子化”倾向。 研究者普遍认为,解决“五唯”问题需要提升教育评价的专业性、科学设立评价指标、改革评价方式。首先,实施多元评价。“唯一”的反义词是“众多”,应该变“五”为"N",变“唯”为“维”。在采样标准合理的前提下,样本越多建模越准。[11]其次,实施代表作、标志性成果的同行评价制度。[12]注重标志性成果的质量、贡献、影响,把学科领域活跃度和影响力、重要学术组织或期刊任职、研发成果原创性、成果转化效益、科技服务满意度等作为重要评价指标。再次,实施综合素质的表现性评价。将反映学生德智体美劳全面发展情况的综合素质评价作为学生毕业和升学的重要参考。另外,取消考试大纲,从课程标准出发,实现“教”“考”一体化。[13]改变以“考”代“管”、升学指标化的“学业成绩政绩化”管理方式,强化区域教育发展的教育生态建设意识。[14]科学使用评价结果,激活教育评价的诊、咨、督、导等多元功能。[15]基于评价目的,在有限范围内使用评估结果,避免将评价结果简化为排名、筛选和淘汰机制的低水平使用。 已有研究为理解“五唯”问题提供了不同的角度,但对其中核心障碍的分析尚不充分。[16]“五唯”问题关涉大学自身的立场与定位、中小学自身的功能实现、学术与教育生态、评价对象的错位、更深层次的社会根源等一系列问题,需要深入探讨。新时代,解决“五唯”问题的政策语境是“深化教育体制改革,健全立德树人落实机制”。“五唯”直接指向科学研究与人才培养的评价及评价结果的合理使用,较深层次的问题是教育体制和科学研究体制的变革,更根本的问题则是治理理念和教育观念的转变。只有把握“五唯”问题的实质,找到解决问题的切入点,才能明确解决思路并且在“体制改革”的脉络中寻求“五唯”问题的有效解决,使教育实践回归立德树人的根本任务。 二、“五唯”问题的实质 (一)作为评价问题的“五唯”:标准、信息与判断 评价是指对某一事物价值、优劣及意义的判断。[17]评价的基本过程包括:确立用来判断质量的标准,收集相关的实证信息和使用这些标准检验实证数据,用以判断被评价事物的质量或状态。“五唯”问题之所以成为痼疾,是因为教育评价在以下三个方面不同程度地出现了问题。 首先,教育评价标准的缺位。缺乏判断,是因为缺乏判断的标准与依据——对测量结果作出判断的依据。确立标准是一项高要求的专业行为。就现实而言,相当多的教师并没有具备实施教育评价所要求的“标准”能力,测量结果便成了首要的评价依据——“分数”作为学生发展质量标准,“升学”成为学校教学质量标准,“论文”视为教师专业质量标准,“文凭”被视为人才培养质量标准,“帽子”被视为专家水平质量标准。例如,“唯升学”问题的根本症结,就是缺乏对教育、对学校的基本认识:判断“好学校”的标准与依据到底是什么。严格说来,对一所学校进行判断应是对学校功能的判断,即学校所承载的功能是什么,学校的功能是否得到了有效实现等。升学、社会流动只是学校功能之一,学校的“公共生活、训练、力量获得、精神生活、文化进步等”[18]功能都应当成为学校评价的主要维度。进一步说,当诸多功能均进入判断视野时,哪些功能更重要也是需要权衡的。 其次,教育评价过程重视“测量”,但“判断”不足。格朗兰德(Gronland,N.E.)把评价表述为:评价=测量(量的记述)+价值判断;评价=非测量(质的记述)+价值判断。[19]评价既要用到实证研究法以获得资料,也要用到哲学研究法以确立标准。完整的评价必须包括判断,判断是基于标准而对客观资料作出解释,进而对事物的状态给出结论。测量是获得数量化实证资料的主要方式,但实证资料不仅包括数量结果,而且包括通过观察、访谈等获得的客观质性资料。同时,测量本身不会对被测量的事物或测量的结果予以价值判断,着眼于提供客观的资料本身。“唯分数”“唯升学”的问题在于只使用了实证的方法,依据测量的数据并将数据作为判断的唯一对象与依据。这不仅没有考虑非量化的质性资料在提供完整的分析与判断依据方面的价值,更严重的是,致使评价过程不完整,即缺少标准确立与基于标准的判断两个环节。只依据测量结果的序列作出判断,大大降低了教育评价的专业性与权威性。此外,从理论上说,教育中最重要的东西依然面临着测量方法学上的难题。于是,在实践中,教育测量往往只测量教育中那些能够测量的部分,并通过强化测量数据的客观性、严谨性等科学特征而碾压其他判断依据——方法的无能却呈现为方法的狂妄。