中图分类号:G449 文献标识码:A 文章编号:1008—0627 (2000)02—0008—04 行为表现评估日益受到教育学家与测量学家的重视。它为教学评估提供了一种新的方法、一种新的思想,指导教师如何更科学、更合理地评价学生在学业上的进展情况。行为表现一词原主要用于工作中、人们的生产实践中,而在教学中很少使用。以往的教育评估多采用纸笔测验的形式,包括多重选择、填空、匹配等具体的格式,注重的是学生的学习结果而不是学习的过程,因此人们常常会怀疑传统的测验是否能真正测量到学生对知识的理解、掌握情况,经过长期的探索,寻找到了能真正对学生作出科学评价的方法即行为表现评估。 一、行为表现评估的兴起 行为表现评估是建立在对传统的测验批判的基础上的,1992 年, Herman等人列举了传统评估方式的不足: 1.测验的内容关注于低水平的知识、孤立的内容与技能; 2.测验仅测出结果,没有考虑学习者的思维与问题解决技能; 3.客观的格式,如多重选择题并不能测量出学习者在真实的世界中应用理解的能力。 确实,目前的评估似乎只注重学生对已学知识的回忆与再认,而不能真正测量出学生是否掌握学科各知识点之间的内在联系,更不能测量出学生对某些知识的应用能力。 行为表现评估兴起的第二个推动力就是准则参照测验的兴起。准则参照测验不同于常模参照测验,它是根据界定明确的内容范围来评估学生的行为表现。而常模参照测验则是将学生与所属的总体进行比较,确定个体在群体中的位置,并不能判定个体对知识的掌握程度如何。尤其对于资格考试来说前者更具优势。行为表现评估也关注于对某一内容领域的掌握,注重对学生的行为进行研究,它与准则参照测验具有某些相同的特点,所以准则参照测验的发展促进了行为表现评估的兴起。利用具体知识进行评判,这样更能结合所教授的内容,更客观地反映出学生的学业成就,也可找出学生所缺失的知识点。 二、美国的发展情况 在50年代早期,教育测量专家就论述了行为表现评估,但80年代,美国才大量开展行为表现评估。具体涉及写作、科学、艺术与历史等学科,这一评估旨在更好地进行诊断与课堂教学。自80年代中期,有40多个州采用写作的样例的评估方法代替传统的多重选择的方法,以此来评量儿童的写作能力。在80年代末期,至少有9 个州已采取州立法来规定评估,要从标准化的测验转向行为表现评估。1989年,纽约实施了小学自然科学行为评价测验(ESPET),旨在改变教师教与学生学的方法。当时有将近200000名四年级学生参加了ESPET,他们分别来自4000 所公立与非公立学校。许多州主要开展幼儿与学龄前儿童的行为表现评估。在国家层面上,新标准方案(New Standards Project )也尝试使用行为表现评估,并建议国家教育目标委员会使用此方法于国家教育考试系统之中。为提高实施的可行性、专业的可信性、公众的接受性、法律的辩护性以及经济的承受力等,行为表现评估在不断的实践应用中不断地发展与完善。90年代初期,学术界对这一方法的研究极为活跃。其中代表人物有Gronlund,Haertel,Mehrens等,他们对行为表现评估进行了科学的界定,分析评估的方法与步骤以及在应用中存在的一些问题。1998年,Gronlund将行为表现评估又细分为局限的行为表现评估与扩展的行为表现评估,它们在任务的现实性以及复杂性上存在很大的差异。[1] 三、行为表现评估的界定以及特性 界定Gronlund将行为表现评估界定为:评估要求学生实际完成某任务或一系列的任务,如编故事、演讲、做实验、操作机器等,从中表现出他们在理解与技能上的成就。也就是从学生的行为表现而不是A、B、C、D等的答案来分析学生的掌握情况。另外,还有两个术语,实证评估与可选择的评估。实证评估是行为表现评估的一种名称,强调将理解与技能应用于真实世界情景中的真实问题。可选择的评估也是行为表现评估的一种名称,它强调在评估方法上提供传统的纸笔测验之外的评估方法。这三个术语的互为替代使用,可力求在真实的情景中测量出学生的行为表现。 Herman提出与传统的纸笔测验相比,行为表现评估至少有下述三个优点[2]: 1.涉及较高水平的思维与问题解决技能; 2.它们可引发在真实世界中的应用; 3.让学生表现出创造、设计或做某些事情。 评估注重过程 以往的测验仅注重结果,其实许多心理活动、认知活动相当复杂,往往结果虽同,但途径却不同。而且要发现学生的学习困难、学习障碍,必须对过程加以认真的剖析。同时有些行为不会有很清晰的结果,所以更要进行过程评价。比如在演讲、朗读、操作实验仪器、弹奏乐曲以及各种身体活动(打网球、溜冰、跳舞等)中,需要进行行为表现评估。 过程性的测量也成为心理测量的一种趋势。因为人们认识到光依据结果评价来得出结论、作出解释并不符合真实的情况,不能诊断出真正的问题。现在的智力测验也偏重过程性的测量。他们认为,只有通过对过程进行评价才能完成真正意义上的评价。Das提出了PASS模型, 并以此为基础编制了智力测验,它就注重对认知过程的测量。Bloomer 所编制的学习测验也注重对过程的测评。其实,对过程的评估是很难的,在此过程中必须合理组织、精巧设计,否则从测验中不会得到有效的信息。评估涉及情景的安排、准则的限定、标准的确定,这些都对教师、评估者提出了很高的要求。此外,过程性评估可体现受测者的个体性,能增强评估者与受测者之间的互动关系,从而可以深刻地探察出学生的成就水平。 当然,有的情况下则要结合使用过程性的评价与结果性的评价。比如,化学实验要求一步一步地按照规范操作,同时它也要求最后的实验结果。许多领域内的评估在最初阶段强调过程的准确性,以后才会强调结果的质量。有时在后期阶段也需要过程评价,因为要保证结果的质量,就必须要对过程加以严格控制。