中图分类号:G434 文献标识码:A 文章编号:1006-9860(2017)07-0026-07 一、数据集驱动学习预测研究的发展契机 计算机和数据科学的进步使得基于新类型证据的决策得到前所未有的发展。尽管数据科学已经在商业、工程、技术、科学等领域建立了良好的应用基础,但对教育领域的影响和渗透还尚未全面展开。近年来,移动技术的逐渐普及和网络学习资源的指数性增长使得数字化学习逐渐成为常态,而增强现实技术和可穿戴技术的兴起则进一步丰富了数字化学习方式和学习环境。大数据技术和数据科学给教育带来的冲击使得研究者、管理者、教育企业、教师等不同角色人员开始重视对不同学习情境和学习方式下生成的数据进行整合与分析,并逐步形成了基于不同类型数据集进行学习测量与计算的学习评价新生态。与此同时,学习分析探索已走过初期对分析模型、应用价值、发展方向等理论方面的研究,正转向基于数据集的可视化分析和学习行动,以将其理论分析的价值转化成实际应用效能。在教育大数据和学习分析的背景下,以优化学习过程和改善学习成效为目标的学习预测研究迅速得到研究者的广泛关注和实践探索。而以模式识别、计算感知、神经网络、机器学习等为代表的人工智能技术的深入发展则为学习预测研究提供了分析技术上的有力支撑,从而使学习预测有了实现实时动态监测和智能化分析的可能。尽管当前对学习预测的研究有了一些探索和成果,但距离实现系统平台的准确分析和大规模应用还较远,特别是在实践中还出现一些分析和设计问题,使得预测模型和结果并不能被广泛应用于当前的数字化学习中。因此,有必要对学习预测研究中的问题进行深入剖析,明晰未来研究设计取向,促进其效能转化以提高其应用价值。 二、学习结果预测研究的内容解析与问题述评 该部分首先对数字化学习环境下的学习结果预测研究进行纵览,以窥看其整体研究状态。之后从不同视角对其研究内容和问题进行分析以洞察其研究现状。 (一)数字化学习环境下的学习结果预测研究探索梳理 对数字化学习环境下有关学习结果预测的研究文献进行系统搜集,采用内容分析法对各项研究中的预测维度、数据来源、预测方法、结果分析等方面进行总结分析,结果如表所示。在学习预测维度上,研究者主要对学习心理特征、学习结果与表现、学习能力等方面进行预测,其中对学习成绩、学习结果和学习成功预测研究较多。在数据来源上,主要集中在课堂学习测评数据、问卷调查数据和学习管理系统数据上。在预测方法上,以多元回归分析、决策树、贝叶斯网络和神经网络分析方法为主。在分析结果上,预测模型在所研究的具体情境中表现较好,但在不同预测方法的准确率上存在差异。整体而言,学习结果预测研究体现出以下几方面的特性:(1)微情境性,已有的学习预测研究偏向具体的学习情境,如多媒体学习环境、网络学习环境、移动学习情境等,侧重对学习者在某一具体情境下的学习阶段活动分析;(2)学习数据的外在性,预测数据来源主要依靠网络学习活动的外在行为表现和课堂学习情境下的学习测试表现;(3)预测内容的可计算性,尽管学习预测内容多样化,但每一项预测内容都转化成可以测量和计算的指标,以支持分析工具的数据处理和自适应学习系统的识别与自动化分析;(4)学习预测的结果导向性,学习预测主要依据之前和当前的学习活动特征对学习者未来的结果表现进行预估,如学习成绩、学习目标和学习能力等,通过不同形式的学习结果预测来改善学习成效和学习体验。通过对学习预测研究的梳理分析可以看出,以学习成效和学习能力为目标的学习结果研究是预测的重点,这反映出学习预测的目标是促进学生个体能力发展和学习成功。
(二)纵向解析学习结果预测研究中的内容 教育大数据的日渐兴起和学习分析的广泛应用使得学习结果预测研究成为学习分析领域中的一项研究热点。为了进一步明晰该类研究的当前状况和发展态势,我们对有关学习结果预测研究的内容进行解析,窥探其预测方向和原理。该类研究内容主要集中在以下四个方面: 1.学习结果预测模型的生成 学习结果预测的原理是将预测目标内容作为因变量,预测指标内容作为自变量,通过分析来探索两者之间的关系。而学习结果预测模型的生成就是通过数据分析探索自变量和因变量之间的关系,并确定不同测量指标对预测目标的影响效应权重。该类研究生成的模型包括基于特定理论设计并验证的结构方程模型、基于多元回归分析生成的学习预测参数、决策树分类模型以及数学公式的假设与验证[16]。在学习结果预测目标方面,主要是对学习成绩与等级和学习成败进行预测,在预测变量上,以个人背景信息、过程性测评结果、学习参与状况、学习情绪等方面为主要测量指标[17][18]。 2.学习结果预测系统的设计 学习结果预测的应用目标是实现自适应网络学习系统的实时监测与评估。当前对有关学习结果预测系统方面的研究还处在设计与初步应用阶段。这方面的研究主要是学习成功系统的分析设计和学习表现预警系统设计应用。其关键问题涉及将学习者的哪些数据作为分析指标以及如何对学习成败进行计算测量。在数据来源上,研究者将课程参与、内容学习、社交互动和测评分数等方面作为数据来源分析,在学习结果测量上,依据预测模型将输入数据转化成预测结果数据,并将分析结果按等级划分,同时采用不同颜色标识,从而形成对学习结果预测的计算和可视化输出。 3.MOOC情境下的学习辍学率与持久力预测研究 大规模开放在线课程爆发性的增长和广泛应用使得注册和学习课程的学生数量逐年递增。然而,相对于较高的课程注册数,能够坚持系统完成课程内容学习和测评的学习者数量较少,多数学习者在课程中后期退出学习,导致MOOC的辍学率较高[19]。与辍学率相对应的是学习者的持久力,即学习者能够坚持学习完整门课程的能力。当前对于MOOC学习结果预测的研究主要通过对学习者的课程学习时间、学习次数、学习互动情况、作业提交情况等方面进行分析来预测学习者的辍学率,通过学习者参与度和形成性评价预测其持久力。