教育评价思想在我国渊源已久,但作为现代教育学科的一门分支学科却是西方的舶来品。在我国自20年代引进后约半个世纪的时间里,教育评价学科的发展却命运多舛,时断时续;直到70年代末期,才逐步获得了持续稳定的发展。本世纪以来,我国教育评价主要取得了哪些进展,有些什么经验教训以及未来可能发展的趋势如何?本文尝试对此作些探讨。 一、我国教育评价发展的历史回顾 现代教育评价主要产生和发展于本世纪。从1900以来,在将近一个世纪的历史进程中,我国教育评价理论研究的发展大致可分为三个阶段:间续发展阶段(1900—1977)、理论积累阶段(1977—1985)和持续发展阶段(1985以后)。需要说明的是,第一,历史与逻辑是一致的,从逻辑上讲,教育测量是教育评价的基础;就历史而言,我国的教育评价确实是从教育测验开始研究的。因此,本文关于发展阶段的回顾,将从我国的教育测验运动说起。第二,本文关于历史阶段的划分,主要以我国教育评价理论研究发展的客观过程和标志为依据,而不过多参照政治维度的分段标准。 (一)间续发展阶段(1900—1977) 中国作为世界著名的文明古国,蕴藏着丰富的原始型态的教育思想。换言之,许多种教育思想,都可以在古代中国找到其最初的萌芽,教育评价思想也不例外。早在战国时代的《礼记·学记》中便有对学生管理和考核的规定和要求。自隋炀帝大业二年(公元606 年)置“进士科”开始的科举取士,分科选拔、逐级考试,在考生来源、考试科目与方法、录用程序等方面都形成了一套较完备的制度,这也可以看作有系统的教育评价活动的萌芽。 然而古代中国所萌发的教育评价思想的嫩芽,却因种种原因,并未能在20世纪伴随着西方教育测验和评价运动而率先成长发展起来。1905年我国废止承袭已1300年的封建科举制度之时,正值西方教育测验运动方兴未艾,在内与外、主动与被动两种力量的共同作用下,西方教育测量的理论很快就传入了中国,并进而在二、三十年代形成了中国的教育测量运动。 1918年,美国人瓦尔科特在北京清华学校任教时,用推孟修订的比纳量表测量了该校高等科四年级学生;同年,俞子夷仿造了一种小学生国文毛笔书法量表,但也并未引起广泛注意。1920年,廖世承和陈鹤琴在南京高师开设测验课程,并以心理测验量表测量了学生,这算是在我国正式开始应用科学心理测验。1921年他们正式出版《智力测验法》一书,当时影响较大。1922年,费培杰将比纳量表译成中文。同年,美国教育测量学家麦柯尔(Mccall,W.A.)应“中华教育改进社”之聘来华,担任该社心理研究主任之职,将 TBCF(T:total ability; B:brightness; C:classification, F:effort)测量编制法介绍到中国,并在一、两年内迅速传播开来。陈鹤琴、廖世承等都按照这种方法编制过多种测验。这一时期,智力测验的研制与实施盛行一时:有陆志伟订正的比奈—西蒙智力测验;廖世承的团体智力测验;刘廷芳的中学智力测验;刘谌恩的非文学智力测验;陈鹤琴的图形智力测验等等。而后艾伟和其他人士编制了小学各科测验及诊断测验等。 我国的教育测验运动,从“五四”前后到1928年可谓第一个高潮。这期间西方以智力测验为代表的各种理论传入我国,我国学者在翻译、引进的同时也结合中国的具体情况作了修订、改造,并积极开展了自己的探索和研究工作。其间出版的一大批教育测验类理论著作,充分表明了当时研究的活跃状况。其中智力测验方面翻译出版的国外著作主要有法国比奈(原题宾尼特,Binet,A.)、西蒙(原题欣蒙,Simon,T.)著、费培杰译《儿童心智发达测量法》(上海商务印书馆1922年5 月初版)等;“五四”前后至1928年间,我国出版的测验理论著作主要有:张秉洁、胡国钰编《教育测量》(北京高等师范1922年8月出版); 华超编《教育测验纲要》(上海商务印书馆1925年1月初版)等。 对这些著作的研究表明,当时我国教育测量起始于引进与传播法国、美国、日本等多个国家的较为先进的智力测验理论与方法。稍后,我国学者就积极开展了大量创造性的研究。与同时期出版的译著相比较,当时国内的研究方法、广度、深度及成果的数量,都并不逊色许多。 然而事物的发展往往是曲折前进的。当时我国教育测验运动在发展过程中也出现了严重偏差,主要因为“一是人们赶时髦,东也测,西也测,把测验弄得非驴非马;二是搞测验的人夸大测验的功能,对测验结果翻译不慎重,导致社会对之发生反感”,以致于到1929—30年间,“测验运动竟一蹶不振,社会对之几乎有淡然抛弃之势”(注:宋伏秋、梅克主编:《我国普通教育评价模式研究》,中国和平出版社1995年版,第11页。)。 面对教育测验研究和实践的这种混乱、低迷的状况,我国学者痛定思痛,意识到教育测验在中国要健康、持续地发展下去,必须加强理论研究,还之以科学的面目。著名学者艾伟、陆志伟、陈鹤琴、萧孝嵘等倡议组织“中国测验学会”,专门从事测验理论研究。该学会于1931年正式成立,这也是我国教育测量和评价方面的第一个学术研究组织。 经过痛苦的低谷徘徊,进入30年代以后,至1937年7 月抗日战争全面爆发前,以“中国测验学会”成立为契机,我国的教育测验运动及其研究又获得了新一轮的发展。就研究而言,这期间,左任侠发表了《智力是什么》、《常态曲线之基本原则》等论文,对智力结构作了探讨。萧孝嵘对智力发展曲线和智力成熟年龄等问题作了一定的解答。 其中1933—37年间,黄觉民的幼童智力测验、萧孝嵘的订正古氏画人测验、艾伟的订正宾特纳智慧测验等纷纷问世。这期间也出现了一批有关测验、测量等内容的学术著作,其中关于智力测验的有:吴天敏著《中国比纳西蒙智力测验之经过(第二次修订)》(上海商务印书馆1936年6 月初版)等;关于教育测验理论与方法的有:汤鸿翥著《教育测验》(上海大华书局1933年8月初版)等。