国际教育成就评价协会(International Associ- ation for the Evaluation of Educational Achievement,简称“IEA”)主办的“Progress in International Reading Literacy Study”(简称“PIRLS”,中文译为“国际阅读素养进展研究”)活动,主要以小学四年级学习结束时的学生为评价对象。2001年首次举办以来,每五年举办一次。2011年参与评价的国家与地区增至49个(另有波斯瓦那、哥伦比亚以及南非等三国作为准“PIRLS”评价对象国),影响越来越大。
从某种视角说,意在给各国“教育政策制定者、教育工作者、研究者及参与者提供有关教育质量和教育环境方面的信息”的大型国际比较研究项目[1],正成为世界小学阅读教学发展趋势的风向标,理应引起我国小学阅读教学界高度重视。2013年,“IEA”发布了《2016年“国际阅读素养进展研究”评价框架》(以下简称《2016年框架》)。研究这一框架中非文学类阅读评价,对推动我国小学非文学类阅读教学紧跟国际潮流,具有重要的参考价值。
一、概念释义
“国际阅读素养进展研究”评价,2001年首次举办以来,其中纸笔测试部分,一直是文学类阅读与非文学类阅读测试各占50%。“国际阅读素养进展研究”根据阅读目的,对“非文学类阅读”定义为“为获取信息、运用信息”的阅读,认为其特点是:“为获取信息阅读过程中,读者不是与一个想象的世界接触,而是与真实世界的某一领域接触。通过阅读承载信息的文本,读者了解世界面貌和曾经的状态,以及这一切产生的原因。读者超越信息本身,用信息进行推论、指导行动。非文学类文本阅读,不必从头读到尾,读者可以选择某些要读的部分阅读。这类文本有很多形式,但基本是连续性文本,或非连续性文本两类。”[2]这一阐述,既指明非文学类阅读“为获取信息、运用信息”的特征,又揭示读者与文本独特的关系状态,同时指出此类阅读独特的阅读方式——“不必从头读到尾,读者可以选择某些要读的部分阅读”,将其与文学类阅读明显区分开来。
根据《2016年框架》非文学类文本试题及其建构性试题评分指南,本文尝试分析2016年“国际阅读素养进展研究”非文学类文本阅读书面测试的基本特点。需要指出的是,在“PIRLS”秉持的“阅读素养”观下,学生非文学类文本阅读评价不仅包括试卷测试,还包括对学生、教师、校长、家长或监护人的各类问卷调查以及访谈。限于研究主题,本文暂不对这一部分进行讨论。
二、考点与分值
根据《2016年框架》,非文学类文本测试考点如下:
阅读理解过程各部分,从设计角度看,最基础的直接提取”能力与最复杂的“考查、评价”能力占分相当,均为20%。可见,在测试设计者看来,阅读能力层级与测试中相应赋分没有对应关系。此外,对《2016年框架》非文学类阅读试题分值实际统计表明,阅读理解过程中各能力层级“设计分值”与“卷面分值”有差异。也就是说,试卷命制过程中,允许分值微调。
三、试题设计
从《2016年框架》范本看,非文学类阅读试题由选择题与建构性试题(constructed-response questions)组成。选择题,即应答者在试题提供的几种答案中选择正确答案,《2016年框架》用的都是单项选择题。建构性试题相当于“主观性试题”,这类试题的答案虽源自文本,但并非文本内容的简单复述、重现,而是打上了应答者经验的烙印,体现应答者个性色彩,是应答者主观经验与文本客观材料相互作用建构的产物。进一步分析,其中“考查、评价文本内容、语言和文本元素”能力试题的答案,读者主观经验介入最多、最深,最具个性色彩。有关这一点,本文将在以下分析中具体展开。这一举措,正是测验与评价环节呼应其“阅读素养”定义的反映。《2016年框架》坚持它一贯秉持的阅读素养定义,即:“阅读素养是读者根据社会需求或(和)本人喜好,理解与应用书面语言的能力。读者可从各类文本中建构意义,并能成为在学校和日常生活中通过阅读而学习、参与阅读群体交流以及由此获得快乐的读者。”[3]“读者可从各类文本中建构意义”而非传统所称的“获取意义”,是“国际阅读素养进展研究”“阅读素养”观的核心。
根据《2016年框架》,非文学类文本阅读试题题型分布如下:
选择题主要集中在“聚焦并提取明确陈述的信息(直接提取信息)”和“直接推论”两种初级阅读能力测试中,是可以理解的。因为,无论是“直接提取信息”还是“直接推论”,读者主观情感不会介入答案建构。“直接提取”的答案自不待言,就是“直接推论”的答案,也不会有读者主观经验介入。正如《2016年框架》所说的,这种阅读理解过程,“读者仅需在文本提供的两个或两个以上意思或信息之间建立联系。这些意思本身清晰地呈现在那里,只是它们之间的联系不是那么明朗,因此才需要推论,而且,尽管文本没有推论过程,但所表达的意思相对是清楚的”[4]。可见,在这一过程中,读者只是利用形式逻辑的规则,在文本的“两个或两个以上意思或信息之间建立联系”。这样的能力检测,用选择题较为便捷,且不会给答题者造成束缚。
与此不同,“阐释、整合观点与信息”和“考查、评价文本内容、语言和文本元素”这样复杂的阅读能力测试,全部采用建构性试题,是有学理依据的。一般而言,后两种高级阅读能力,结构复杂,读者经验介入答案建构相对较多。使用建构性试题更宜于刺激应试者多方面反应,为应试者高级能力呈现提供更多空间,也有利于达到测试目的。当然,题型与所测试能力之间虽有一定联系,但也非简单对应。试卷实际编制中,题型出现一些变动,属于正常。如上表显示,第2、14题,测试“直接推论”的能力,用的却是建构性试题。
四、答题指南
分析《2016年框架》答题指南,是全面把握“国际阅读素养进展研究”非文学类阅读测试另一重要渠道。因为,根据测验一般理论,试题正确答案在某种程度上是测试者期待的目标。因此,答题指南提供的参考答案,可以理解为测试者理想目标的某种表述形式。
以下在每一能力层级测试上选择一题及其参考答案为例,进行分析。[5]
测试“聚焦并提取明确陈述的信息”能力试题,有第1、3、6、11题。四道题均为单项选择题,答案都可直接在文本中找到。如第1题,题目如下:
化石是什么?
本题参考答案是“古生物的遗留物”。很明显,文章第一句,“化石是千百万年前地球上的动植物的遗存物”,就直接含着这个答案,应答者能直接从文中提取。
测试“直接推论”能力试题,其答案不能直接在文本中找到,但联系文本一两处信息,可直接推导出来,如第2、5、7、9、14题。以第2题为例,题目如下:
根据文章判断,为什么很久以前有人相信是巨型动物的遗骨?
本题答案,应答者无法直接从文本中找到,但细读文本,应答者可从以下文字中找到相关信息,并通过对相关信息分析、整理,推出合适的答案。文本相关片段如下:
有些人以为,这些大骨头或许来自他们见过或书上读到过的某种动物,如河马,或是大象。但是,人们见到有些骨头那么大,即使是最大的河马和大象,也不会有这么大的骨头。这些巨型骨头让人们相信,它们一定是巨型动物的遗骨。
人们见到的最大动物,如河马、大象,其骨头也没有眼前遗骨那么大,理所当然,人们相信会有比河马、大象更大的“巨型动物”,这些遗骨应属于它们。这个判断不是文章直接呈现的,而是应答者根据文章的相关信息,梳理之后从中推导出来。
测试“阐释、整合观点与信息”能力,试题难度相对更高。读者不但没办法直接从文章表述中找到答案,也不能轻易通过对相关信息分析,直接推导出答案。为找到答案,读者要做艰苦的解释、整合工作。第4、8、10、13题是这样的试题。以第4题为例,题目如下:
白纳德·帕里斯的新想法是什么?
参考答案是“化石应是已经灭绝的某些动物留下来的”,或“有的化石属于地球上不再存活的动物”,或“他产生了新想法:地球上有些生物已经彻底地消失了”。[6]
以下是文章的相关文字:
几百年前,一位名叫白纳德·帕里斯的法国人冒出一个新念头。他是著名的陶艺师,工作中,他在黏土中发现很多细小的化石。仔细研究了这些化石,他写出一份报告,宣称这些化石是古生物的遗骨。实际上,这也不是一个全新的观点。但是,白纳德·帕里斯还陆续发表了一些报告,宣称有些生物已经不再生活在地球上,他们彻底消失了,这些物种灭绝了。
解答本题,要求应答者给出法国人白纳德·帕里斯的“新想法”。首先,这个“新想法”是他写的系列报告中呈现出来的。其次,不能满足于“这些化石是古生物的遗骨”这一结论,因为,文章明确提到“这也不是一个全新的观点”。因此,真正合乎试题的答案,应在承认这些化石是古生物的遗骨”结论后,进一步看到“有些生物已经不再生活在地球上,他们彻底消失了,这些物种灭绝了”,这才是“新想法”的准确内容。
“考查、评价文本内容、语言和文本元素”能力试题,测试学生更高级的阅读能力。根据“国际阅读素养进展研究”文献表述,应答者考查、评价文本内容、语言和文本元素时,其关注焦点已从建构意义转移到评价文章本身。在此过程中,读者与文本保持一定的距离,深究它并对它做出评价。读者凭借自身对世界的认识以及过去的阅读经验,以一种非常个人化,或挑剔的、反对的视角,深究、评价文本的内容和意义。[7]
第12题是这样的试题,试题如下:
仔细观看禽龙的两张图,它们帮你明白了什么?
本题解题思路与参考答案如下:
今天的科学家认为,禽龙看上去与吉登·门特尔判断有别。沿着这一思路,答案可以是“显示人们对禽龙外形的认识是如何改变的”,或“显示不同的人对禽龙外形有不同的看法”。
如侧重从“人们的看法有何区别”这一思路出发,参考答案可以是:“吉登·门特尔认为,这些遗骨化石显示禽龙是四足行走的,但后来科学家改变了他的想法。”
或者,答案还可从另一角度入手,照片说明吉登·门特尔和其他人可能错了。参考答案可以是“表明吉登·门特尔有些地方弄错了”,或“人总难免一错”。
《2006年框架》答题指南认为,还有一些答案,从更加一般的层面理解两张图片中禽龙的外貌差异,却没有扣住试题提出的“(这些差异)帮你明白了什么”,也可以得一半分。如“显示它们看起来不一样”,或“一张图上的禽龙四条腿行走,另一张上的两条腿行走”,或“吉登·门特尔认为禽龙有一只独角”。
“指南”提供这些虽非“完全正确”但“部分合理”的参考答案,认为应该适当给分,这对全面、准确评价学生阅读理解能力显然更加合理。
五、结论分析
“国际阅读素养进展研究”中非文学类阅读测试题及其参考答案,紧扣其“阅读素养”定义。一方面,“阅读素养”概念反映了当代社会发展对学生阅读目的、方式、功能等多方面的要求,且内涵清晰,为编制科学的评价框架提供了良好的基础。另一方面,阅读理解过程四种能力测试及其参考答案在纸笔测试层面,体现了“阅读素养”概念的先进性与丰富性。首先是四种阅读能力界定,既边界清晰,又相互呼应,共同构成阅读能力的完整形态。各种能力边界清晰,为试题编制提供了便利;在这样的前提下,所编试题测试何种阅读能力、与何种题型匹配、各类试题所占总体中的比例这些技术问题就容易解决。
此外,建构性试题参考答案多样性,在评价层面切实落实了“阅读素养”中“读者可从各类文本中建构意义”的核心观点。所谓“建构”,就必然烙上读者个性化印记,“正确答案”虽不能逾越基本框架,但必然具有个性色彩。就是说,在“阅读素养”理念下,尤其是一些测试高级阅读能力的试题,答案多样性成为必然。“指南”为高级阅读能力测试提供的多种参考答案,正体现了这种必然性。就评价活动而言,它也体现了评价的完整与统一性。
参考文献
[1]Ina V.S. Mullis,Michael O.Martin,Eugene J.Gonzalea,and Ann M.Kennedy,PIRLS 2001 International Report[M]. Boston. TIMSS & PIRLS International Study Centre. 2003:3.
[2][7]Jay R. Campbell,Dana L.Kelly,Ina V.S.Mullis,Michael O.Martin,Marrian Sainsbury. Framework and Specifications for PIRLS Assessment 2001(2nd edition)[M]. Amsterdam. International Association for the Evaluation of Educational Achievement. 2001:17,14.
[3][4][5][6]Ina V.S. Mullis,Michael O.Martin. PIRLS 2016 Assessment Framework[M]. Boston.TIMSS & PIRLS International Study Centre. 2013:14,21,119~137,130.
【本文系全国教育科学十二五规划2011年度单位资助教育部规划课题“提升小学生阅读素养的策略研究”(课题批准号:FHB110055)阶段性研究成果】