中图分类号:G434 文献标识码:A 文章编号:1009-5195(2019)06-0014-08 教育评价是我国深化教育体制改革,推进教育现代化的关键环节,其重要性不言而喻。但囿于科学性和技术性不足,我国教育评价名目繁杂浮华,实质评价缺失,评价功用贫困,公信力大打折扣(叶赋桂,2019)。如何优化教育评价深受政府和学界关注,党的十八大以来,国家出台了系列招生考试、人才项目评价改革文件,2018年全国教育大会更是明确强调,要坚决破除“五唯”顽瘴痼疾,从根本上解决教育评价指挥棒问题。当前,教育信息化的持续推进使得大数据正在进入教育的方方面面(维克托·迈尔-舍恩伯格等,2015),其作为“数据、技术、思维三足鼎立的产物”(维克托·迈尔-舍恩伯格等,2013),能为教育评价带来海量时间尺度密集、空间尺度多样、价值尺度多元的教育大数据(王战军等,2015),同时提供挖掘教育数据潜在价值的技术手段和思维方式(赵伶俐,2014)。为此,国务院在《促进大数据发展行动纲要》中专门提及教育文化大数据工程,要求推动教育基础数据的伴随式收集和全国互通共享;《国家教育事业发展“十三五”规划》也明确提出,“鼓励学校利用大数据技术开展对教育教学活动和学生行为数据的收集、分析和反馈,为推动个性化学习和针对性教学提供支持”。诚然,大数据的价值日趋凸显,已成为教育评价变革与创新的重要驱动力量。 一、第四范式教育评价分析框架 大数据时代的到来,将事物的可量化程度和范围空前推进,催生出数据密集型的知识发现,驱动着科学研究范式转换。按照图灵奖获得者吉姆·格雷的划分,科学研究可分为四种范式:用于描述自然现象的实验科学范式(Empirical Science),利用模型和归纳法的理论科学范式(Theoretical Science),对复杂现象进行计算机仿真的计算科学范式(Computational Science),将理论、实验和计算仿真统一起来的数据密集型科学范式(eScience),也称之为第四范式。第四范式是通过仪器收集数据或通过模拟方法产生数据,然后用软件进行处理,再将形成的信息和知识可视化呈现(Hey,et al.,2012)。这使得人们不需要再借助“望远镜”或“显微镜”来观察世界,而只需通过数据来发现并理解世界。毫无疑问,大数据的诞生为人类认知和科学研究提供了新方法和新视角,其与教育评价的结合必然会开创“数据密集型评价”新范式,并将教育评价推向智能化阶段,即基于全样本、全过程、全景式的元教育大数据进行数据挖掘和学习分析,使教育评价专业化成为可能。 “范式”是贯穿于库恩科学哲学思想的一个核心概念和理论体系。库恩在1962年出版的著作《科学革命的结构》中对“范式”作出了系统性阐释,但由于将概念从认识论范畴上的共有范例扩展为科学共同体共有的信念、基本观点、价值标准、具体操作规范等认识世界和理解世界的工具、精神定向工具的综合体(陈俊,2007),导致“范式”富有“过分的塑造性”,“几乎可以满足任何人的任何需要”(托马斯·库恩,2004),从而引发了诸多误解和争议。针对库恩提及的21种“范式”概念,英国学者玛格丽特·玛斯特曼从三个层次进行了概括:一是哲学层面的形而上学范式,即科学共同体所共识的信念;二是社会学范式,即科学共同体普遍认可的学术传统和学术研究的理论框架,主要包含概念系统、基石范畴和核心理论;三是构造范式或人工范式,即解决问题的工具与方法,这三类范式相互联系成为一个有机体(Masterman,1970)。库恩认为范式间具有不可通约性,这是导致范式更迭或转换的根本原因。当旧范式的基本理论和方法在解释或解决某一问题时出现反常,就意味着原有范式已经面临危机,而范式的世界观功能及其作为“认知工具”的本质性意义,决定了只有转变世界观,基于新的立场和认知视角才能包容反常(托马斯·库恩,2012)。一旦立场和认知视角发生转变,科学共同体对研究目标和价值标准的设定以及研究方法和操作模式的选择必然也会受到相应影响,这可归结为范式的价值论和方法论功能(杨怀中等,2008)。据此,第四范式即“数据密集型评价”的出现,将会从本体论、认识论、价值论和方法论层面引发教育评价变革。因此,笔者以本体论、认识论、价值论和方法论四个方面作为分析框架,深入探讨第四范式如何促进教育评价走向智慧化和专业化。 二、丰富本体论:第四范式拓展教育评价意涵 如何理解教育评价、解释教育评价,是现代教育评价基本理论的首要问题,直接关系着教育评价活动的立场和认知视角。得益于大数据技术,第四范式教育评价在教育活动监测上实现了时间维的连续性、空间维的全域性和价值维的多元性,相应地,对教育大数据的识别和采集也突破了时空和类型限制,海量实时性强、真实度高、颗粒度细和内容广泛的教育评价依据全面汇聚,利于打破单一评价类型,使教育评价更加科学多元。 1.第四范式教育评价是贯穿于教育活动始终的嵌入式评价 教育是一个反馈调控的过程,教育质量的高低在一定程度上取决于其是否能成为一个自我调控和自我完善的系统(裴娣娜,2005)。教育系统要实现自我调控和完善,就必须依赖教育评价对教育活动进行实时监控并提供持续性信息反馈,即实现教学评一体化。回溯教育评价发展历程,现代教育评价自发端以来经历了测量、描述、判断和建构四个时代,依次形成了工具导向、目标导向、决策导向和价值导向的教育评价理念,评价方法实现了由简单到多元的扩展,评价类型也从强调终结性评价转向形成性评价。但从评价时间和空间来看,这四代教育评价与教学和学习活动仍然是相分离的,尚未真正实现教学评一体化,教育评价的智能化水平不高。具体而言,教育评价与教学的“共时性”被阻断,教育评价通常在教学之后,是教学的终点;“共域性”被隔断,教育评价和教学不在同一个情境或空间之中(于开莲,2016)。这导致教育评价相对滞后,评价无法实时获取过程性教育数据,更不可能为教学活动改进及时反馈最有效的信息。大数据时代,泛在网络、移动通信、传感器、云计算等信息技术飞速发展,教育数据爆炸式增长,同时大数据技术能够对教育活动中实时产生的海量数据进行动态捕捉和深度挖掘,这使得第四范式教育评价成为一个智能化的动态信息反馈系统。具体而言,大数据支持下的教育评价能够对教育活动进行动态监测和控制,持续搜集和处理与教学相关的信息,并及时将评价结果反馈给利益相关主体,使其不断调整和变革教学和学习行为,实现教育系统的动态平衡和教育质量的持续改进。可以说,大数据时代的教育评价并非单向度的结果性评价,而是贯穿于整个教育过程的伴随式评价,教育评价与教育教学活动不再是线性关系,而是构成一个反复迭代的循环回路,其能促使教育成为一个“自我纠正系统”,真正实现以评促改、以评促教、以评促学、教学评合一。