教育科研评价如何走出困局

收藏 |打印|下载word

作者：

孟照海/刘贵华

作者简介：

孟照海，全国教育科学规划领导小组办公室副主任，中国教育科学研究院副研究员；刘贵华，中国教育科学研究院副院长、教授，（北京 100088）。

原文出处：

教育研究

内容提要：

构建中国特色教育科学三大体系的关键在于评价体系改革。在强调技术理性和绩效评价的社会背景下，教育科研评价目的逐渐异化为对新颖、绩效和功用的追求；学术共同体因行政力量的强大和第三方评价的量化推动而逐渐被弱化；评价标准简单划一，忽视不同知识类型、研究类别和知识情境中的科研差异；评价方法片面追求量化指标的简单加总，造成“劣币驱逐良币”；评价结果易受非学术因素影响，致使公信力不高。究其原因，作为评价对象的教育科研通常具有知识生成的复杂性、质量显现的滞后性和成果影响的间接性等特点。评价标准随社会政治和知识范式的变化而变化，并强调个体化和特殊性知识，同时整合了多维度的知识和研究方法。在评价制度上，存在推动创新与排斥创新、内在评价与外在评价以及技术理性与总体判断的矛盾。改进教育科研评价体系，需要实施分类评价、完善同行评价、强化综合评价、推动多元评价、健全公开评价，使评价真正发挥鉴别、诊断、规范、引导和激励作用。

期刊代号：G1

分类名称：教育学

复印期号：2021 年 03 期

关键词：

科研评价教育科学质量标准　　research assessment educational science quality standards

字号：大中小

构建中国特色的教育科学学科体系、学术体系和话语体系，关键在于科研评价体系改革。破除“五唯”的总体部署以及《深化新时代教育评价改革总体方案》都对评价改革提出了重要性和紧迫性的要求，“改进结果评价，强化过程评价，探索增值评价，健全综合评价”，更是将评价改革摆在了更加突出的战略位置上。科研评价是对学术品质和学术贡献优异程度的鉴别与认可，它既是学术知识生产的内在动力，也是学术资源分配的主要机制。

科研评价在项目评审、人才评价、机构评估中发挥重要作用。从世界范围来看，科研评价在很大程度上支配着科研机构及专业人员的行为；把控着学术论文和专著的发表以及学术会议的主题发言；主导着学术人员的聘用和晋升；决定着科研资助机构的基金项目分配以及国家的基本科研经费分配；对高等学校的研究生招生同样也发挥着重要影响。[1]推进教育科研高质量发展，必须紧紧扭住评价改革这个“牛鼻子”，克服科研评价中过度数量化、简单化和形式化的倾向，使教育科研评价真正发挥鉴别、诊断、规范、引导和激励的作用。

一、教育科研评价如何误入歧途

学术评价归根到底是一个“分配正义”的问题，是通过对每个人学术劳动的准确判断，给予他们与其贡献相当的回报和相应的社会责任，其最终目的是选拔优秀人才，激励先进成果，推动学术进步。[2]科研评价是形式评价、内容评价和效用评价的“三位一体”，包括评价主体、客体、目的、标准、方法与制度六个要素。[3]教育科学的繁荣发展有赖于合理的评价体系和奖励系统，正如培根(Bacon，F.)所言，“得不到奖励的事业就不会繁荣”[4]。教育科研具有特殊性和复杂性，在强调技术理性和绩效评价的社会背景下，教育科研评价在目的、主体、标准、方法和结果等方面容易发生异化或错位，致使科研评价未能有效、合理地发挥规范和引导作用，激励和奖励体系的识别偏差也带来了教育科研的虚假繁荣和学术泡沫。

(一)评价目的异化，片面追求新颖、绩效和功用

在教育科研领域，评价目的异化主要表现为三种评价倾向。一是为创新而评价。从学术共同体内部而言，教育科研的实质性评价是对学术原创性的鉴别，归根结底要实现知识的增长。[5]但在科研评价中，真创新与假创新通常难以区分。美国社会学家默顿(Merton，R.)就指出，原创性评价的最大难题就是，把值得承认的真正的创新与不值得承认的仅仅是新颖之物区别开来。[6]在教育科研领域，由于教育世界的人文创造性，研究者常常把自己的情绪、态度、偏好等主观因素掺进研究过程，把自己所意愿或期盼的研究结论或主张混同于研究证据所支持的客观结论，[7]研究的主观性、私人性和相对性也被幻化成研究的创新性。在追求标新立异的科研评价导向下，教育研究常被各种意见和臆断所包围，[8]研究者和实践者要“穿越教育概念的丛林”，[9]同时要面对教育研究的标签化趋同和低水平重复研究[10]。二是为绩效而评价。从外部的资源配置而言，教育科研评价是为了资源使用效率和效益的最大化，因而要以物化的研究成果来证明“物有所值”或“物超所值”。在实际评价中，由于形式评价和效用评价便于测量和计算，能够更有效地对科研活动进行鉴别、区分和排名，因而更受管理机构和科研资助机构的青睐。此外，改革开放以来的教育资源配置十分倚重各种工程和项目，而其筛选有赖于容易操作的简单指标，从而驱使高等学校和科研机构片面追求科研的绩效和功用，不遗余力地制造甚至包装各种评价指标，以争取资源、获得头衔或更好的排名。因陷入这种竞赛机制中，许多人都在努力地做着他们明知道不对的事情。[11]为绩效而评价的倾向带来了有数量缺质量、有专家缺大师的状况。三是为功用而评价。教育研究要能够有效解决实际的教育问题，科研评价通常比较重视研究成果是否“及时、有用和管用”。决策者和实践者对科研质量的评价也是强调即时有用性，特别是具体的、可操作性的建议，从而逐渐使教育科研成为一种纯粹的技术性活动。正如美国学者拉伯雷(Labaree，D.)所说，当教育研究者一心寻求科研的有用性时，他们有时就会削足适履，让自己的研究满足此时此地的教育实践需求，致使教育科研成为“短视”行为。而一些抽象的理论构建尽管在研究时看不到用途，却在将来大有用途。[12]我们必须为“天马行空”的基础研究保留空间，以思考不可思议之事。我们需要研究者挑战基本假设和正统观念，从而使政策议题发生根本转向，如果研究者不去为之，就更不可能指望其他任何人。[13]

(二)评价主体失范，学术共同体独立性和自主性力量不足

科研评价通常包括学术性评价、行政性评价与社会经济效益性评价。[14]作为一种价值判断活动，它面临学术标准与非学术标准及不同评价主体、评价程序之间的多重矛盾。[15]学术力量、行政力量和社会力量在科研评价中的力量并不平衡，在权力关系的支配下，评价主体的失范是造成科研评价乱象的重要原因。一是行政力量过强。国家是科研资源的主要供给者，从总体上调控着科研的方向和知识生产。教育研究具有鲜明的意识形态属性，政治体制和政治制度对教育科研评价发挥关键作用。面对同样的事实，在科学问题上，决定对与错的是其真假；而在价值问题上，决定对与错的却是评判者的立场。同样的事实可以为不同的甚至截然相反的价值问题提供支持，关键就在于证明者站在什么样的价值立场上解释这些事实。[16]以学术评奖为例，学界和民间组织的权威性评奖很少，且让人议论纷纷，而主管部门组织的评奖则由于主管官员主导的色彩甚浓，官员或准官员所占的比例过高，使评奖的学术水准很难让人信服。[17]换言之，行政力量既被排斥，但又被需要。二是学术力量被扭曲。在学术评价中，学术共同体的独立性和自主性因内外因素的影响而难以真正实现。在项目评审中对政策热点和政策意图的过于迎合，在成果评价中对领导批示的过于推崇，都将政治逻辑置于学术逻辑之上，最终损害学术评价的公信力和权威性。同时，由于学派和利益纷争，评价者发生角色错位，成为某部门或某个人的代言人，使正常秩序下的公平竞争蜕化为无序竞争。在不同的研究范式之下，对相同的教育事实也可能有不同的看法。在学术评价中掌握话语权的评价者就可能将自己的偏好强加到评价标准上，从而限制了学术创新和教育研究的多样化。三是第三方评价重形式轻内容。由于同行评议的公信力不高，为显示客观和公允，以文献计量为主的评价机构日益膨胀，由此带来量化评价的泛滥和学术评价的异化。这些评价机构主要包括各种核心期刊与来源期刊、各种文摘类期刊以及各类排名机构，它们是量化评价和“出身”评价的主要推手，“以刊评文”和计件制是其评价的主要方式。[18]这些评价机构的兴盛，正是由于同行评价的作用发挥不充分。

(三)评价标准单一，忽视教育科研的类型差异

评价标准是科研评价的关键，标准不当将会破坏整个科研生态。教育学科具有人文学科、社会学科和自然学科的多重属性，其知识是一种复合型知识。从教育科学的发展来看，尽管规范性的人文社会科学研究范式仍然占据主流，但进入21世纪以来，学习科学、脑科学等自然科学知识的引入使教育科研日益重视随机实验和准实验的实证研究方法，讲求客观、可量化、可验证、可重复等相关特征。[19]在教育科学追求科学化的道路上，评价标准日趋单一。一是简单参照自然科学的评价模式，忽视教育科研评价的独特标准。在自然科学和社会科学模式的影响下，教育科研的评价标准比较强调严谨性、原创性和影响力，特别是定量和定性的研究方法及科研的社会影响力。然而，教育研究不像自然科学那样具有极强的和直观的累积性，文献之间的相互引用有时显得可有可无。[20]单纯以学术成果发表数量和引用率等作为质量评价标准，不一定适合教育科研的独特性。以文学和艺术史等人文科学的研究为例，研究者就比较重视促进文化记忆以及反思批判性等学科独有的标准。[21]同时，即便是相同的指标，不同学科的侧重点也不一样。就原创性而言，人文与历史学研究者强调的是研究视角以及史料的原创性，社会科学研究者强调的是研究方法的原创性。[22]因此，在教育科研评价中，必须凸显教育研究的独特性。二是按照一种知识逻辑评价不同类型的研究。基础研究、政策研究和实践研究遵循不同的知识生产模式和知识逻辑。基础研究侧重于对根本问题的原创性研究，遵循纯粹知识生产的模式，追求的是不以应用为目的的“无用”知识。政策研究侧重于政策的可行性和社会合法性研究，要兼顾知识逻辑和政策逻辑，追求的是学术创新与特定政治制度和政策环境的适切性。实践研究侧重于理论知识的实践应用，遵循知识逻辑和实践逻辑，追求的是实践者的认知和行为改变。而以同一种知识逻辑评价不同类型的研究，则会加剧教育研究的同质化。三是在不同情境中采用一种评价标准。好的教育研究不是一个抽象的概念，而是体现在不同的具体评价情境中。在教育科研领域，作为知识创新的科研成果不是一个客观的结构实体，而是主体与环境互动的产物，科研创新在不同的情境中被重新界定，产生不同的意义。[23]通常，学位论文的评价侧重于学术规范的掌握和知识的原创性；学术期刊论文的评价侧重于填补知识空白和研究方法的合理性，以及与刊物风格的适切性；竞争性科研项目的评价，侧重于研究的学术价值和社会政治价值，以及研究的前期基础和研究设计；委托研究项目的评价，侧重于研究者的学术声誉及完成研究任务的时效性和经济性。[24]对于不同评价情境中的教育科研，应该在坚持一般科研评价标准的基础上有所侧重，根据评价的对象构建个性化和针对性的评价指标体系，而不能采用一刀切的方式进行评价。

共10条结果上一页12 3 4 5 下一页全部展开

论教育基本问题的“五元”性

金忠明

教育学2011年第11期
从战略高度提升教育研究质量

曾天山/丁杰...

教育学2011年第11期
全球化背景下教育研究范式转变带来的挑战

张红霞

教育学2011年第11期
“共情”对质性研究效度的影响

王硕

教育学2011年第11期
教育价值的多元与教育评价范式的转变

戚业国/杜瑛...

教育学2011年第11期

教育科研评价如何走出困局

相关文章：