中图分类号:I01 文献标识码:A 文章编号:1004-3926(2020)08-0172-09 在千禧年前后的一个访谈里,德里达曾有过这样一段表述:“我发现我又处在一种矛盾之中,不过我接受这种处境。一方面我说:书已完结——从我说出‘书的终结’那日起——但同时我也支持拯救书以抵抗威胁着记忆、威胁着数字文化的某些新技术。这里我也试着同时进行两种相互矛盾的工作:接纳新技术,接纳一切与之一同而来临的东西,将之当作某种运气来接纳,但同时也去发现与之具来的威胁,以我所能,以我的方式与之抗争,以求保存一切与书本文化相联的东西。不仅仅是卷轴的形式,还有阅读的时间,阅读的耐心以及阅读的个体空间,即一切与书文化相联的品质”。[1](P.8)今日读来,德里达言语间所表达出的矛盾心理,是信息时代人文研究者都能感受到的茫然与不安:信息时代的到来是如此深刻地改变了文学艺术的生存语境,促使了基于新媒介、新技术、新方法和新语言的文艺创作与现象的出现,同时也在挑战与改变着我们介入、观察和研究文学艺术的方式,那么,该如何介入?是无条件的接纳,亦或是尽我所能的去保留和抗争?J.希利斯·米勒的答案是跟随,他的“文学终结论”唱响了“建立在印刷技术、报纸以及印发《宣言》的地下印刷机和出版商的基础之上”的书籍文化不可避免的衰落。[2]而马克·波斯特则更犀利地指出,德里达在宣告印刷时代终结的同时却以一种谨慎甚至是怀疑的态度徘徊在“深渊”的边缘:“似乎他(德里达)不能确定,解构到底是哲学家的‘灰身灭智’(gray on gray),描画着印刷书写这个已逝时代的轮廓,还是先觉者舞动的星,在宣告电子书写的诞生。现今的情境是一个深渊,向里面窥视只会看到怪物”[3](P.141)。如果说上个世纪下半叶,德里达在深渊边的彷徨与矛盾,或是因为新技术的发展尚处于初期,具有诸多不确定性,造成了认知上的困难。那么在20年后的今日,随着信息技术的高速发展和广泛应用,我们是否可以断言我们已经拨开笼罩在深渊之上的迷雾,看清了眼前的路了呢?似乎并没有。我们还在经历着从书籍文化到数字文化的转型期,依然被如德里达“双重约束”(double bind)般的心态所束缚,在不断地反思与再认识中寻找着自己的路。 数字人文或许是这样一条路。首先,数字人文是信息技术、数字技术所带来的知识生产的新形态。其次,“数字人文”从知识谱系上对已有的文学艺术理论进行了拓展,以多样性的“人文”的概念兼容了数字文化中的各种形式,比如电子文学、游戏研究等。这些数字文化形式具有“实践性”的特点,与数字人文具有一致性,从而也造就了广泛意义上的数字人文学者,一个以实践性介入知识生产的广泛、多样的群体。 数字人文的实践性还体现在研究者们从不同的路径和角度运用数字技术对人文问题进行研究和呈现。在这个过程中,技术与人文的概念发生了交混,从而造成了一些看似相同实则差异很大的概念被不加区别地使用。“文本”就是其中一个具有代表性的概念。在20世纪之前文本尽管被认为是可以脱离特定媒介而独立存在的,但更大程度上还是被认为是一种基于印刷技术得以呈现在纸上并能被引用的符号。这些符号可能具有特定意义而且只能被在一定的媒介载体上才能被理解(作为手稿或者版本意义上的文本),或者并不具有某一种特定意义(作为作者意图或社会文化的呈现)。20世纪中期,“文本”作为一个关键词被打开,其脱离了印刷文化既定框架内的使用语境,而被赋予了更多的意义,比如文学中会质疑是否有一个文本存在,新历史主义将文本视为历史语境的产物而历史皆可成为被研究文本,(后)结构主义更愿意将文本从作品中解放出来,强调文本无处不在,文本与文本的关联性构成了意义的网络,而文化研究则视文本为一种元模型,将社会、文化、历史都视为可以被作为意指实践的对象。人文领域内关于这些的研究也不胜枚举。然而,我们还应该看到在20世纪中期以后,文本在信息科学、计算机科学领域也被广泛地大量使用。比如计算科学中文本多指文本数据,是一种可以被分解为段落、句子、词和最终单个字符的文本文档。与此同时,文本是可以数字形式被表示的,也就是说,文本中每个独立的字符都有对应的代码。比如最常见的ASCII字符集和Unicode字符集。而在数字人文领域中,多学科和跨学科的研究使得不同意义上的“文本”概念被大量同时使用,造成了概念上一定的混乱。比如在数字档案与编辑中,文本既具有文献学中内容对象物的意义,同时又具有标记文档的意义,两者相互关联但又不完全相同[4]。数字人文在其发展过程中,两个重要的来源,即“人文计算”(humanities computing)和“电子编辑”(electronic edition)都非常强调文献学意义上的文本,但前者更多的是从语言学的角度强调作为语料的文本之于计算的意义,而后者则将文本视为一种无法与其历史物质技术剥离的社会实践。两者都对20世纪以来后结构主义开启的、丰富多样的、理论化的“文本”保持了一定的距离[5]。近年来,随着“文本标记”、“文本挖掘”、“文本分析”等数据分析技术的广泛应用,使得计算意义上作为语言语料的“文本”概念更加凸显。阿兰·刘因此将数字人文前身的“人文计算”称为“基于文本的数字人文”(text-based digital scholarship),指出更广泛数字人文应该包括人文计算,以及新媒体研究。而后者恰恰是沿着后结构主义、解构主义和批判理论路径与传播研究融合形成的一个跨学科研究领域[6]。数字人文学者也对之进行了回应。比如霍伊特·朗和苏真在《文学模式识别:文本细读与机器学习之间的现代主义》一文中,开宗明义地提到他们试图建立一种介乎于(结合了)文学细读和机器学习的文学模式识别的分析方法,超越计算模型与批评理论对峙的僵局。此处不对该模式做评价,但想指出的是,这种努力也是本文想要试图实现的一种路径,即从问题出发,从文本理论、电子编辑、信息理论和数据分析的角度对数字时代的“文本”问题进行辨析,试图在数字人文视野下打破计算本位意识下将文本作为数据处理对象的狭隘观念,重新打开“文本”概念的复杂性,建立一条融合了媒介研究视角的数字人文文本研究路径,发现数字时代人文研究持续发问并进行回答的动力机制。