教育评价的渊源可追溯至中国古代的科举考试制度,但现代意义上的教育评价却产生于美国,并在美国得到蓬勃发展。美国教育评价的历史发展可划分以下五个阶段: 一、早期的考试制度 考试的形式有口试和笔试。美国在19世纪后半期多采用口试法,即教师向每个学生提出不同的问题,要求学生口头作答,以判定学生的知识掌握程度。由于口试法不能向各个学生提出同样的问题,所以缺乏统一的标准,难以进行比较。而且随着教育的发展,学生渐多,口试法要从多方面考查,在时间上也是一种很大的浪费。基于这些原因,口试很快为笔试所取代。在西方,笔试创自1702年英国剑桥大学,1845年在美国著名教育家贺拉斯·曼(Horace·Mann)倡导下,波士顿文法学校首先引进这种考试,后来在美国逐渐推广和发展起来。不过那时的笔试方式主要是写论文或用同一试题同时考查全体学生。这样固然省时经济,但评分仍带有很大的主观性,而且试题太少,也不能检测全部知识。为矫正此弊,力求使考试客观化,便产生了美国的教育测验运动。 二、测验运动阶段 在教育评价中,考试与测验有明确的区别。测验是“经过标准化的测量”。标准化的过程是取得常模、信度、效度等资料的过程。常模是有一定代表性且数量足够大的样本在某项测验上的平均成绩。这是运用测验分数对人作出评价的参照系。这里所说的测验是指标准测验(客观测验)。正因为这一点,我们用考试标征上一阶段的评价水平和特点,而用测验标征本阶段的评价水平和特点。 实际上,美国的教育测验所以会在本世纪20年代形成一种运动,除了针对传统论文式考试的弊端外,还有其客观的历史背景,即(1)德国实验心理学的发展;(2)英国对个别差异的研究;(3)法国对于不适应者的临床关心。这三种研究思潮对美国的教育测验运动起了很大的促进作用。 在美国的教育测验运动中,桑代克和他的学生做出了突出的贡献。1904年桑代克(Thorndike,E,L.)发表了《精神与社会测验学导论(Anin-troduction to the theory of mental and social measurement)》,这是一本在测验学史上的划时代的巨著,他在书中提出了“凡是存在的东西都有数量,凡有数量的都可测量”的著名信条。在这一信条的激励下,他与他的学生积极投入教育测量工作,陆续编制了各科标准测验(Standard Test)和标准测量表(Scall)。经桑氏努力,教育测验运动蓬勃展开,不到20年(1909-1928),美国便有三千多种的测验问世。大致包括学业测验、智力测验和人格测验三类。 就学业测验而言,它具有以下特点: 1.标准测验的内容包括多数学校共同的一般内容; 2.标准测验采集问题的范围包括知识技能的全部重要部位; 3.标准测验包括一学年或一学期的全部课程; 4.标准测验由专家利用实验手段经过统计编订试题,并制定固体性标准,即常模; 5.标准测验的结果,可知被试者在被试的总体中处于什么位置。 标准测验的评分方案有以下几种: (1)商数法。所谓教育商数就是以实际年龄除量表年龄所得的商数(为了方便再乘以100,以消除小数)。而量表年龄就是学生在这个量表上(这次测验中)所得分数达到的那个年龄的常模。如果他的实际年龄是10岁,而他的得分达到12岁的常模,那么他的教育商数就是120。 (2)偏差值法(即标准分)。所谓标准分是一种以标准差为单位的相对位置量数。等于数列中各原始分数与平均数的差除以标准差所得的商,公式为{g195c.ipg}。标准分的作用除了能够表明原分数在分布中的位置外,还能对本来不能直接比较的各种不同单位的量数进行比较。 (3)百分等级法。百分等级也称相对地位量数,表示任何一个分数在该团体中的相对地位。在按大小顺序排列的分数数列中,要表示任何一个分数在该团体中的相对地位,须把该分数转为百分等级,计算公式为: {g195c.jpg} 式中,P[,r]为百分等级符号,x为给定的原始分数,L[,b]为该分数所在组的精确下限,F[,b]为小于L[,b]的各组次数之和,f为该分数所在组的次数,n为总次数,i为组距。 随着教育测验运动的不断发展,人们逐渐认识到,教育测验尽管能使考试客观化、标准化,并能把人的能力换算成数字,甚至个别差异的程度也可以度量(这些都是教育测验的重大成就),但测验毕竟不能测得人的全部,即使是研究最多最有成果的学力测验也不能测得学力的全部领域。如社会态度、实际技术、创造力、兴趣、鉴赏力等现代重要学力内容,因难以数量化,教育测验便不能充分把握,往往被教育者所冷落。因此,教育测验受到了批评: 第一,测验是片断的,无论是知识测验还是人格测验,都只能做片断的测定,不能全部了解人格之发展与知识之过程; 第二,测验只注重客观信度,而对于质的妥当性却不足说明; 第三,教师为测量成绩所采用的学业测验,根本就是教科书主义; 第四,测验或考试必然养成个人主义与被动式的学习态度。 教育评价正是为弥补教育测验之缺陷而发展起来的,当然教育评价并非取代教育测验,而是在重视原有教育测验的同时,也注重测验以外的评价方法,从而把所有能够用以考查教育效果的方法综合起来,以评定教育是否实现全部教育目标。