中图分类号:G434 文献标识码:A 文章编号:1006—9860(2013)02—O006—06 一、前言 共词分析法是信息计量学的一种重要方法,也是内容分析法的常用方法之一。其原理是:利用文献集中词汇对名词或短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系,并且出现的次数越多,表明这两个主题的关系越紧密。由此,统计一组文献的主题词两两之间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络,网络内节点之间的远近便可以反映主题内容的亲疏关系[1]。通过共词分析,人们可以发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用的知识,并揭示某一学科或学科群的研究热点、结构与范式[2]。随着科学计算可视化的发展,人们对共词分析不仅仅停留在数据分析层面上,而且逐渐融入可视化方法,利用现代信息技术和统计软件图形显示功能,将科学知识的发展进程与结构关系直观形象地显现出来。这为人们提供了一种发现不可见信息的方法,丰富了科学发现的过程,给予人类深刻与意想不到的洞察力。本文采用共词可视化的分析方法,以聚类图谱与战略坐标图两种形象化的方式对教育技术学的研究热点与学科结构进行分析。 二、材料与方法 (一)数据来源 本研究选取国内公认的两种教育技术学核心期刊《中国电化教育》与《电化教育研究》作为样本刊集。在中国期刊网全文数据库(CNKI)中检索,分别套录两种期刊2001年1月至2012年6月间发表的文章(剔除有关会议综述、会议通知、访谈、广告、文件讲话等非学术类文献,最终得到有效文献7113篇),下载这些文章的标题、摘要和关键词,保存为TXT格式以便统计分析。 (二)分析方法与工具 1.选取高频词、生成共现矩阵 下载两本核心期刊在特定时间段的文献后,利用共词矩阵挖掘工具——书目共现分析系统(Bibliographic Item Co-Occurrence Matrix Builder,BICOMB)处理,抽取并统计全部关键词的频次,并生成高频词的词篇矩阵与共现矩阵。 2.系统聚类分析 聚类分析的基本思想是认为我们所研究的高频关键词之间存在着程度不同的亲疏关系。于是根据这些关键词的多个观测指标,具体找出一些彼此之间相似程度较大的关键词聚合为一类,把另外一些彼此之间相似程度较大的关键词又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有关键词都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。最后把整个分类系统画成一张谱系图,用它把所有关键词之间的亲疏关系表示出来。其功能是可以定量反映出词与词之间的亲疏关系,进而反映这些词所代表的主题结构。利用统计软件SPSS 18.0,输入高频关键词的词篇矩阵,进行系统聚类分析得到聚类树状结构图。 3.战略坐标 战略坐标是1988年Law等人最先提出的,其原理是在共现矩阵和聚类的基础上,来描述某一研究领域内部联系情况和领域间相互影响情况[3]。它是以中心度和密度为参数绘制成的二维坐标系,其中,密度用来衡量字词聚合成一类的紧密程度,也就是该类的内部强度,表示该类维持自己和发展自己的能力。中心度用来衡量一个学科某一研究主题与其他研究主题相互影响的程度。一个研究主题与其他研究主题联系的数目和强度越大,该研究主题在整个研究工作中就越趋于中心地位。密度与中心度的具体计算方法如下: (1)在高频关键词共现矩阵的基础上,横向保留某一类的数据行,纵向删除该类数据列,为每一行求和并计算加权平均,得到该类的外部连接平均数; (2)在高频关键词共现矩阵的基础上,横向和纵向都保留该类数据,删除其他类各项数据,为每一行求和并计算加权平均,得到该类的内部连接平均数; (3)分别将各类的内部连接平均数和外部连接平均数相加,并再次计算得到外部连接总平均数和内部连接总平均数; (4)将各类外部连接平均数和内部连接平均数分别减去总平均数,即可得到各类的中心度和密度。 以中心度为X轴,密度为Y轴,取各个类中心度和密度的平均值为原点,利用Excel绘制战略坐标图,从而将所有类分为四个象限,落入每个象限的类都具有不同的含义[4]:第一象限中的词团(类)密度和向心度都较高,密度高,词团内部联系紧密,向心度高,说明该词团与其余各词团有广泛的联系,即该词团处于所有研究主题的核心。第二象限中的词团处于边缘位置,但已经受到关注,且被很好地研究过。第三象限的词团密度和向心度都低,处于整个研究领域的边缘,研究尚不成熟。第四象限的词团中心度高,但密度低,说明该词团构成的主题领域也是核心,但不成熟。 三、实验结果 (一)关键词提取结果及关键词共现矩阵 1.高频关键词 为避免泛义关键词与命名不规范的关键词影响分析结果,在利用BICOMB抽取并统计关键词之前,剔除了与研究主题和领域表征关系不大的词,合并了教育技术学研究范围内基本同义的关键词。7113篇文章共包含了8089个不同的关键词。本文在选择高频关键词时,综合考虑了关键词的词频、词频累积比重和实际研究情况。最终将出现频率在40次以上的关键词限定为高频关键词,共获得37个,如表1所示。这37个高频关键词,其总的出现频次为3436次,占关键词总频次的25.14%,基本能够代表国内教育技术学十年间的研究热点。