[中图分类号]A8 [文献标识码]A [文章编号]1004-4434(2016)10-0169-07 习近平总书记在全国哲学社会科学工作座谈会上讲话时指出:“当代中国哲学社会科学是以马克思主义进入我国为起点的,是在马克思主义指导下逐步发展起来的。”[1]中国哲学社会科学的发展离不开马克思主义的指导,而坚持马克思主义的指导需要马克思主义理论教育的与时俱进。当今世界,大数据带来的信息风暴使人们的生活、工作和思维产生深刻变革,“数据就是未来流通的货币”,是“产生信息、知识、智慧的基础”,是“数字化生存时代的新型战略资源”[2](P3-4),“大数据”的“大事实”已然成为社会判断的重要依据和鲜明的时代特征。面对社会发展、科学进步和教育信息化的要求,2010年我国颁布了《国家中长期教育改革与发展规划纲要(2010-2020年)》,指出“信息技术对教育发展具有革命性影响”,2012年颁布的《教育信息化十年发展规划(2010-2020年)》称“以教育信息化破解制约我国教育发展的难题,促进教育的创新与变革”,2016年教育部关于印发《教育信息化“十三五”规划》的通知,指出要“落实中央网络安全和信息化领导小组和国务院有关‘互联网+’、大数据、云计算、智慧城市等重大战略对人才培养等工作的部署”[3],都为大数据时代马克思主义理论教育的信息化提供了重要遵循。马克思主义理论教育应及时研究、提出并运用新思想、新理念、新办法,否则理论就会苍白无力,就会“肌无力”,马克思主义就无法更好地指导哲学社会科学的发展。促进马克思主义理论教育的信息化,这一重大战略任务在互联网时代与大数据紧密相关,将大数据融入马克思主义理论教育的全过程,无疑是巩固马克思主义指导地位、掌握马克思主义话语权、坚守主流意识形态阵地和提升国家文化“软实力”的“四赢”策略。马克思主义理论教育必须抓住国家实施的大数据战略机遇,充分挖掘大数据对于马克思主义理论教育的潜在价值,实现马克思主义理论教育的思维变革,从而进一步坚定人们的马克思主义理想信念,维护我国意识形态安全。 一、认清大数据的科学内涵 “大数据”(Big Data)一词最早由美国的未来学家托夫勒提及和使用。他在《第三次浪潮》一书中,提出大数据将在第三次浪潮中“谱写华彩乐章”,预言“大数据”时代即将到来。最早正式提出“大数据”概念的是全球知名咨询公司麦肯锡公司(MGI),在一份名为《大数据:创新、竞争和生产力的下一个新领域》的研究报告中,MGI指出,在当今世界分析大数据是支撑新的生产力增长的基础[4]。真正把大数据推向公众视野的是维克托·迈尔-舍恩伯格(ViktorMayer-
)和肯尼思·库克耶(Kenneth Cukier)合著的《大数据时代:生活、工作与思维的大变革》一书。在书中,舍恩伯格认为,大数据能够“通过对海量数据进行分析,获得巨大的产品和服务”[5](P4)。随着“大数据”在各行各业的广泛应用,大数据带来的变革与日俱增、影响日益深远。抓住大数据战略机遇,促进马克思主义理论教育的思维变革,对于实现马克思主义理论教育的信息化,增强马克思主义主流意识形态话语权,维护国家意识形态安全具有重要的战略意义。 大数据,并非简单意义上理解的大量数据。对于“大数据”概念的界定,学界莫衷一是。权威IT研究机构Gartner认为,大数据是在一个或多个维度上超出传统信息技术处理能力的极端信息管理和处理问题[6](P142);美国国家科学基金会(NSF)认为,大数据是“由科学仪器、传感设备、互联网交易、电子邮件、音频视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集”[7]。MGI对大数据的定义为:大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群[8](P5)。按照摩尔定律(Moore’s Law),全球数据每年增长50%,每2年翻一番,并呈现出多源、异构、碎片化、低价值密度、实时性等复杂特征。因此,人们更多地基于大数据本身的特点,采用“4V”或“5V”的定义。“4V”是指大规模(Volume)、多类型(Variety)、高速度(Velocity)和低价值密度(Value);IBM认为,大数据需要精确性(Veracity),构成“5V”特征[9]。大规模(Volume)是指大数据的体量巨大。根据互联网数据中心(IDC)的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB①。截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类说过所有话的数据量大约是5EB[10](P48)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。多类型(Variety)是指数据来源多样、类型繁多、结构复杂、多元多变。总体上分为三类,即结构化数据(以文本形式存在的便于存储的数据等)、非结构化数据(网络中的文字、表格、图像、音频等综合数据)和半结构化数据(超文本文档,如HTML网页等)[11](P12)。高速度(Velocity)是大数据区别于传统数据挖掘的最显著特征。起源于处理网页数据的开源Hadoop系统可容纳100亿条数据,如果对这些数据进行条件排列查询,平均需要600秒以上。而经过数据结构优化的UniHadoop系统,数据分析的速度更快,同样100亿条数据的条件排列工作,只需要7秒就能完成。低价值密度(Value)是指大数据中有用数据占数据总量的比例偏低。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有1~2秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据时代的难题。由此可见,大数据首先是指不断呈现爆炸式增长的海量数据,常规的获取手段和处理技术已经无法完成对数据的集成、存储和分析;其次,大数据的低密度价值特点决定,不是所有的数据都有价值,要学会分析、整合有用的数据,打开大数据的“潘多拉之盒”,掌握规律、发现价值,才可以获得大发展和对问题的高效解决。