[中图分类号]G434 [文献标识码]A [文章编号]1672—0008(2013)06—0011—07 一、报告发布背景简介 近年来,随着互联网的飞速发展,人们越来越多的行为在网络中发生,这直接导致互联网中人类行为相关数据呈爆炸式增长,人类在不知不觉中已经进入了一个“大数据”时代。联合国在2012年发布的大数据白皮书"Big Data for Development:Challenges & Opportunities"中指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响[1]。为此,世界各国都在此领域投入大量人力物力来支持“大数据”相关研究和应用。美国作为世界科技强国,在2012年3月29日正式启动"Big Data Research and Development Initiative"计划,提出“通过收集、处理庞大而复杂的数据信息,从中获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式”,正式将“大数据”提高到国家战略层面,美国政府为该计划投入了2亿美元[2]。2013年2月6日,美国国家科学基金会(National Science Foundation)宣布将额外投入1万美元,以激励社会及人文科学中的“大数据”研究的发展。另外,国际著名学术期刊Nature和Science分别在2008年和2011年推出大数据相关专刊,由此可见,“大数据”已经得到了世界各国学术界、工业界和政府机构的高度重视。 在教育领域,耶鲁大学、哈佛大学、斯坦福大学等世界知名高校也启动了教育大数据相关研究计划;另外,美国学校管理者协会(AASA)携手学校网络联合会(COSN),以及全球性的信息技术研究和咨询公司Gartner共同实施了一个名为"Closing the Gap:Turning Data into Action"的项目,旨在促进学校对学生信息系统和学习管理系统中大数据的使用。为了更好地促进美国国内“大数据”教育应用,为美国高等院校及K-12学校在“大数据”教育应用方面提供有效指导,美国教育部(U.S.Department of Education)在2012年10月发布了《通过教育数据挖掘和学习分析促进教与学》(Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics)报告(以下简称《报告》)。《报告》内容主要包括以下五个方面:个性化学习解读;教育数据挖掘和学习分析解读;自适应学习系统中大数据应用介绍;美国教育数据挖掘和学习分析应用案例介绍;美国的大数据教育应用挑战和实施建议。《报告》内容主要来源于以下三个方面:对公开发表或未公开发表的教育数据挖掘和学习分析相关文献的综述;对教育软件和学习管理系统开发公司中15位数据挖掘和分析方面专家的采访;8位数据挖掘和学习分析领域学术专家讨论的总结[3]。 二、核心概念界定 (一)教育大数据 “大数据”这一概念对于我们来说已不陌生,维基百科上给出的大数据定义是:数据量规模巨大到无法通过目前主流软件工具获取、管理、处理、整理成为帮助企业经营决策,达成更积极目的的信息[4]。 国际数据公司(IDC)认为,大数据是符合4V特征的数据集,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)[5]。而《报告》则引用了国际著名的咨询公司麦肯锡(Mckinsey)在2011年对大数据的定义,认为大数据是指数据量极大,以至于无法使用常规数据软件进行获取、存储、管理和分析的数据,“大数据”具有数据量大、数据多样和数据产生速度快三大特征[6]。教育领域中的大数据有广义和狭义之分,广义的教育大数据泛指所有来源于日常教育活动中人类的行为数据,它具有层级性、时序性和情境性的特征;而狭义的教育大数据是指学习者行为数据,它主要来源于学生管理系统、在线学习平台和课程管理平台等。 (二)教育数据挖掘和学习分析 通过对教育大数据的获取、存储、管理和分析,我们可以构建学习者学习行为相关模型,分析学习者已有学习行为,并对学习者的未来学习趋势进行科学预测。《报告》指出,目前教育领域中大数据的应用主要有教育数据挖掘和学习分析两大方向,两个研究方向虽然同源,却在研究目的、研究对象和研究方法等方面截然不同,具体比较情况如表1所示。
1.教育数据挖掘 教育数据挖掘是综合运用数学统计、机器学习和数据挖掘的技术和方法,对教育大数据进行处理和分析,通过数据建模,发现学习者学习结果与学习内容、学习资源和教学行为等变量的相关关系,来预测学习者未来的学习趋势。《报告》通过对教育数据挖掘领域专家进行访谈,列出了教育数据挖掘的四个研究目标[7]:(1)通过整合学习者知识、动机、元认知和态度等详细信息进行学习者模型的构建,预测学习者未来学习发展趋势。(2)探索和改进包含最佳教学内容和教学顺序的领域模型。(3)研究各种学习软件所提供的教学支持的有效性。(4)通过构建包含学习者模型、领域模型和教育软件教学策略的数据计算模型,促进学习者有效学习的发生。