中图分类号:G40-032 文献标识码:A 文章编号:1671-9468(2013)04-0077-10 近来,大数据的概念风行世界。在“时间就是金钱”、“信息就是财富”、“知识就是生产力”等一波波浪潮过后,“大数据”成为又一个吸引眼球的概念。不知道这个概念的风行是否也会如以往情形,潮头过后,这世界依旧如退潮之后的滩涂,难寻遗踪。不过,对于传统自然科学包括大部分社会科学领域的专业研究者而言,重数据的意识其来有自,其区别仅在于“大”与“小”之分。本文尝试结合社会科学和教育研究中经常面临的困惑,对数据以及所谓的大数据在研究中的意义、价值和问题,提供些许分析与思考。 一、数据与真实的世界 提及“数据”,自然不能回避什么是“数”或“数字”。其实,数字与文字一样,就其文化起源而言,都源于早期人类的记录或记载的需要,甚至两者的功能曾一度混淆。如在尚无文字的我国上古时期,有所谓“结绳记事”一说,结绳者,“事大,大结其绳,事小,小结其绳”。古印加人神秘的奇谱也是“结绳记事”的一种形式,其中的绳结既用来计数又属于一种会意文字。因此,在发生学意义上,最早的数便是文字,也可以说文字就是数,它是我们祖先创造的一种作为记载或标识的符号,因为具有文字表意功能,所以既不抽象也不神秘,而是生动和具象的。数在人类历史上功能被放大的过程与其自身不断的抽象化相伴而行,这个抽象化过程展开的重要初始节点很可能是数字与文字的分离。我们虽然不知道这种分离发生于何时、为何和如何发生,但一个明显的事实是自此之后,数字与人类感官所触及的经验或现实世界逐渐失去了直接关联。正如赫弗德(J.R.Hurford)所言:“一般说来,数词明显是种神秘的、不规则的语言,因为它所表示的那些数目,并不像其他语言表示人、位置、事务、行为、状况和性质这样实际存在的东西。”[1] 然而,数字虽然无其具体的所指,是一种纯粹由人的心灵和精神所建构的抽象符号,却并不意味着它远离我们日常的经验世界。恰恰相反,抽象化不仅赋予数字越来越广泛和普遍的功用价值,如土地丈量、远洋航海、农时划分、货币交易、建筑设计等等,而且数字还越来越成为人类破解外在世界符咒最为可靠的工具。甚而至于,相对于文字所能够描述和呈现的世界影像——一个总处于流变之中且叵测的感官世界,正是数字化的呈现给人以世界的和谐、确定和秩序感,让人类在不确定的世界中寻求到了一丝终极意义上的慰藉与安全感。如常言说的一切皆有“定数”、中国传统的易经八卦、西方早期的占星术、毕达哥拉斯“一切皆数”的本体论主张以及牛顿“整个宇宙就是一口精确时钟”的机械论信念等等,无论你认为它们是荒谬绝伦还是精准可靠,这种以数为依据的阐释或解释一度成为人们在不确定中寻求确定性的心灵皈依。即使在一个所谓反思量化科学的后现代时代,数字的这一价值不仅没有贬损,反而借助高度发达的数据技术进一步增值,时下的大数据热便足可作为佐证。 可以说,没有数与逻辑这种纯粹人类理性的建构物,就不会有后来越发精致化的科学和技术,恐怕也不会有今天人类物质丰裕的社会。如果没有数字与文字的功能分离,一个仅有语言的人类世界或许与其他动物的世界并无二致。正是有了数字才使人类理性之光得以充分展现,把人的理性、智慧发挥到极致。尽管我们不敢妄言,人类是否通过数字识破了自在世界的神秘代码和秩序,但至少可以确认的是:人类已经通过数字精心建构了一个人工世界,我们生活于其间,甚至已经无法辨清它与自在世界之间的区分。更意味深长的是,数字原本作为人类探求和掌控自在世界秩序的工具,它所塑造的是一个人工世界或者是贝克(Ulrich Beck)所谓的“人造自然”[2]、吉登斯所谓的“人化环境”或“社会化自然”[3],其不确定性或“风险”反而日益剧增,数字反过来又成为应付它自身不确定性的工具。大数据概念的提出,与其说是对当下社会“信息爆炸”和“技术革命”的顺合与适应,不如说是对人类当下所生活的人工世界更具复杂性、风险性和不确定性生态的一种自觉反应。 人类期望以数字来寻求确定性,而由数字所演绎生成的知识、技术和社会系统又进一步增加了世界的不确定性,于是,人们再次对大数据寄予厚望。这一链式循环过程多少有些西西弗斯式的悲壮色彩,而且也有一种左右互搏的荒诞和反讽意味。 二、社会科学研究中的数据与知识 教育学究竟是社会科学还是人学?这恐怕是一个永远也阐释不清楚的问题,因为两者在根本上表现为立场之间的差异,而且两种取向长期以来基本上是各说各话,难得有实质意义上的交流,更遑论融通。教育研究取向和立场的差异,实质上反映了对教育日常世界的理解和预设不同。前者倾向于把教育日常世界理解为一个理性行动者主导、充满客观事实与事件而且不同事实和事件背后都存在一种因果关联或至少存在相关性的场景;后者则更多偏向于把教育世界理解为一个与特定历史、文化、政治存在情境关联且充满群体甚至个体间种种价值纷争和冲突的场域。两种预设又决定各自的研究取向和知识旨趣不同,社会科学取向更偏爱客观理论解释与知识建构,后者则执著于终极价值关怀、意义与文化诠释以及对现实的反思和批判。 相对而言,偏爱数据是社会科学取向之教育研究的基本特征。近年来,在国际社会科学主流研究范式的影响下,与质性研究兴起的情形相仿,实证意义的定量研究在我国教育研究领域开始呈勃兴之势,这种被称为规范化的研究无疑是对我国重逻辑思辨研究传统这一缺陷的弥补。但是,究竟如何理解教育研究中的数据?由数据所演绎和生成的教育知识是否就具有超越特定情境的客观性品质,即反映为所谓教育活动和世界中的秩序或规律(law)?