解读教育大数据的文化意蕴

作者简介:
祝智庭(1949- ),男,浙江衢州人,华东师范大学开放教育学院教授,主要从事教育信息化系统架构与技术标准、信息化促进教学变革与创新、技术使能的智慧教育、面向信息化的教师能力发展、技术文化等方面的研究,E-mail:ztzhu@dec.ecnu.edu.cn;孙妍妍,华东师范大学教育学部上海数字化教育装备中心;彭红超,华东师范大学教育学部教育信息技术学系。上海 200062

原文出处:
电化教育研究

内容提要:

尽管大数据概念已经耳熟能详,而且在教育之外许多领域已经得到诸多成功应用,但在教育中的应用仍处探索阶段。文章对大数据科学、数据智慧、文化及其模式与计算进行了梳理,并探讨了它们在教育中的应用(包括大数据在教育领域的应用需求与挑战、教育中的文化过程等)。在此基础上,构建了基于大数据文化的教育策略框架,并设计了基于微文化模式的个性化学习适配处方模型,以期在一定程度上为支持个性化学习服务。最后,文章也指出利用教育大数据的机遇与挑战。


期刊代号:G1
分类名称:教育学
复印期号:2017 年 06 期

字号:

       [中图分类号]G434 [文献标志码]A

       一、大数据科学与教育发展

       (一)大数据科学的兴起

       在当今时代,信息化技术的迅猛发展以及互联网的普遍应用产生了前所未有的海量多样数据。维基百科将此类用传统数据处理方式无法处理的大量的、复杂的数据称之为“大数据”。《华尔街日报》在2012年2月的一篇文章中,将大数据列为引领人类走向繁荣的三大技术变革之一。2012年3月,美国奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,将“大数据研究”上升为国家意志。同年,联合国全球脉动(UN Global Pulse)组织发布《大数据促发展:机遇与挑战》一文,指出大数据时代已经来临[1]。

       大数据科学的兴起是信息时代的产物。Jim Gary在《第四范式:数据密集型科学发现》一书中将数据密集科学(大数据)作为继实验研究(实证式)、理论推演(理论式)、电脑计算(仿真式)之后的科学研究第四范式[2-3]。与传统数据不同,大数据具有4V的特征,即巨量(Volume),指数据不断增加的、很容易积累到百万兆字节甚至千兆兆字节的数据;迅变(Velocity),即及时处理大数据的必要性;多样(Variety),即数据形式的多样性;真实(Veracity),即提供信息的可信度,以及据此决策的可靠程度[4]。

       数据处理自18世纪末期统计学兴起时就存在,并随着技术的发展不断地进化[5]。Thomas H.Davenport认为数据分析经历了三个时代[6]。分析1.0时代是伴随着计算机技术的诞生和发展而产生的。在1.0时代,数据分析的重点主要集中在数据收集和准备阶段——这一阶段往往耗时最长,但数据的规模却并不大。数据分析报告往往侧重于对于过去的陈述,但缺乏解释以及预测。在互联网和社交媒体产生之后,数据分析进入了2.0时代。在分析2.0时代中,大数据已经和传统的“小规模数据”区分开来。大数据的来源不再仅限于企业内部的数据,而是扩大到了整个网络。为处理这些大量而多样化的数据,人们研发了多种新的数据处理软件和方法。在分析3.0时代,数据来源不再局限于互联网,而是拓展到物联网,将数据处理的威力拓展到几乎无边无际的“数据宇宙”。

       从数据分析的时代发展中可以看出,信息技术的发展促使了大数据科学的产生,而大数据科学不仅改变了传统数据分析的数据来源,也影响了数据分析的模式。与传统的数据分析相比,大数据科学不再局限于对过去的描述和解释,更侧重于对未来的预测。在大数据科学中,非结构化数据中蕴含着的价值也被挖掘出来。这种价值存在并非是被预先设计的,而是通过计算被发现的。因此,在大数据科学范式中,不依靠预设的模型(Model)和小样本,而是依靠全样本数据,通过计算发现“模式”(Pattern,或“样式”)。因为模式具有整体关联性和非凡洞见性(理解力),所以更具客观性和智慧性。

       虽然国际上人工智能研究已有60多年历史,但把数据与智慧联系起来的研究则不到20年,而且是由于知识管理、数据挖掘研究而引发的。中国科学院顾基发院士(著名运筹学与系统工程专家,曾为钱学森副手)于2013年撰文考证了数据—信息—知识—智慧四层谱系DIKW(代表Data-Information-Knowledge-Wisdom),认为文献中最早见于1987年,后经若干学者演绎,到了2004年才形成以理解力为纽带的DIKW谱系[7]。沿着这些线索,综合多位国际学者(L.Ackoff,G.Bellinger等)的观点,我们可以得到以理解力为纽带的DIKW图谱(如图1所示)。

      

       图1 以理解力为纽带的DIKW图谱

       Bellinger等人对数据智慧的DIKW谱系作了进一步修订,在知识与智慧之间增加了“领悟/顿悟”(Understanding/Insight),变成DIKUW五层演进模型,并将其与演进的外部条件、内在形态、结果价值联系起来,形成一个比较综合的视图(如图2所示)[8]。在人工智能的“强规则”领域(如机器下棋、语言翻译),通过嵌入“深度学习”机制,已经朝着领悟全局优化策略方向前进了一大步。但在教育这样的“弱规则”领域,目前主要依赖专家经验来解析/领悟各种大数据模式中所蕴含的教育因素,进而寻求较优的教育干预或学习处方。笔者认为,在教育大数据研究与应用发展中,总的发展趋向是通过人机协同的努力,将数据智慧转化为“行动智慧”。

      

       图2 数据智慧演进综合图解

       (二)大数据在教育领域的应用需求与挑战

       作为大数据科学的一个分支,教育大数据目前还没有一个公认的定义。随着大数据科学的发展,很多学者已经尝试在教育领域使用大数据的方法来提高教学质量,例如学习分析、个性化学习、教育科学决策等。

       美国教育部教育技术署于2014年发布了一份《通过数据挖掘与学习分析改进教与学》的专题报告[9],描述了教育数据分析的基本方法,并作了应用需求分析,包括应用领域、待答问题以及所需数据类型(见表1)。

相关文章: