《文汇报》:PISA如何测出中国学生的“短板”

基础教育领域大型国际教育评价项目研究——以国际数学和科学趋势研究为个案发布时间:2017-05-04

基础教育领域的精准扶贫是实现我国整体教育结果公平、消除人力资本短板的重要途径,是最直接、最有效也是最根本的精准扶贫。

  已连续在上海举办两次的PISA测试并非测试学生的学业水平,而是通过测试学生的阅读能力、数学能力和科学能力,从而了解15岁的少年是否具备未来生活所需的知识和技能。15岁的少年不可能在学校里学习到成年以后所需的一切知识和技能,所以PISA测试的是他们能否在实际生活中创造性地运用所学的知识技能,以便成年后在社会上发挥应有的功能。

NOESP

质量监测;基础教育;精准扶贫

解读PISA中的数学能力测试——

全 国 教 育 科 学 规 划 课 题

原标题:关于利用质量监测促进基础教育精准扶贫的思考

知识的应用很重要

成果公报

作者简介:檀慧玲,北京师范大学中国基础教育质量监测协同创新中心讲师;李文燕,北京师范大学中国基础教育质量监测协同创新中心教师;罗良,北京师范大学中国基础教育质量监测协同创新中心副主任,教授,luoliang@bnu.edu.cn。北京
100875

本报首席记者 姜澎

课题批准号 GFA111015

内容提要:基础教育领域的精准扶贫是实现我国整体教育结果公平、消除人力资本短板的重要途径,是最直接、最有效也是最根本的精准扶贫。质量监测是当前世界各国为提升基础教育质量、改进薄弱学校教育教学而采取的主要措施,它能够准确呈现贫困儿童青少年教育发展现状,找到导致贫困儿童青少年发展存在差距的关键因素,客观动态地追踪评价扶贫政策实施成效等。在我国已建立较为完善的基础教育质量监测体系的背景下,充分利用和发挥义务教育质量监测制度及监测数据的作用,创建基础教育质量监测与基础教育精准扶贫的数据互通、资源共享信息平台;制定基于质量监测结果的精准帮扶方案;建立基于质量监测结果的追踪数据管理机制、评估机制和政策改进机制,推动基础教育精准扶贫有效开展,对于做好基础教育精准扶贫工作,助力教育脱贫攻坚目标的有效达成具有重要意义。

  “如果说日常学校数学考试成绩反映的是学生对数学知识掌握的能力,那么PISA测试的数学能力,指的是在生活中各种情形下发现、提出和解决数学问题的能力。数学能力用在这里隐含着数学知识和技能应用的能力,而不是对学校课程掌握的能力。”华东师范大学教育科学研究院专门研究数学教育的朱雁博士,对包括PISA在内的各种国际性数学测试的科学性进行了多年研究,在她眼里,2012年的PISA测试结果最值得期待,“因为可以从中看出亚洲人数学教育的短板究竟在什么地方”。

课题 名 称
基础教育领域大型国际教育评价项目研究以国际数学和科学趋势研究为个案

关 键 词:质量监测 基础教育 精准扶贫

数学能力是运用数学知识解决问题的能力

课题负责人 赵慧

标题注释:本文系2017年度国家自然科学基金项目“基于义务教育质量监测的教育扶贫政策评估研究”(项目编号:71704014)的阶段性成果。

  据介绍,PISA每3年测一次,每次的主题都不一样。自从2003年第一次以数学为主要测试的能力以后,直到2012年才又重新回归数学主题。

所在 单 位 上海市教育科学研究院

一、质量监测是实现基础教育精准扶贫根本目的的有效途径

  PISA数学测试的内容,是与真实生活相关的数学概念,包括数量、空间和形状、变化和关系以及不确定性。“这些测试主体的选择,并不意味着更多的学校课程的具体分支如代数学、几何学等都被忽视。”朱雁告诉记者。

填表 日 期 2016年12月6日

教育结果公平是教育扶贫的最终体现,也是基础教育精准扶贫的根本目的,如何对教育结果公平程度进行科学测评是基础教育改革与发展的重要议题。基础教育质量监测是相关监测组织运用学科考试、能力测评及问卷调查等方式,监测小学、初中学生的学科领域学习水平、各项综合素质及影响学生发展水平取得的各种因素,并通过监测结果的分析,掌握教育质量的现状,为教育政策制定提供信息和依据,为学校和教师的教育教学工作提供改进意见及进一步努力的目标。[1]尽管目前国内外已经开展的教育质量监测项目测试内容各有所偏重和不同,但测试的维度基本都是围绕教育结果质量和影响教育结果质量的关键因素两个方面展开。教育结果质量主要以学生的学业成就、身心健康、情感态度价值观等发展结果作为主要指标;影响教育结果质量的关键因素主要包括个体、家庭、学校、教师等层面对学生发展结果起到重要影响的过程性因素和环境因素。

  在数学测试中,数学能力被分为不同的维度,而且题类分为不同的背景,包括个人、职业、社会背景和科学背景。按照PISA的测试目标,主要是为了测试个体的数学素养,在不同情境中形成、应用和解释数学的能力。这种能力包含数学推理以及运用数学概念、过程、事实,工具描述、说明和预测现象等能力。“数学素养能帮助个体识别数学在世界中所扮演的角色,并且能够做出有根据的判断和决策,由此成为一个具有建设性、投入性及反思能力的公民。”

课题成果公报

质量监测能够详细描绘贫困儿童青少年教育发展现状

  测试的结果最终以精熟度分为6个等级。在6级水平,学生能够对复杂情境进行研究和建模,对信息进行概念化、概括和运用。必须能将不同的信息源和表征联系起来,并在其间自由的转换。这一等级的学生能够进行高水平的数学思维和推理,他们能够运用这种领悟力和理解力,以及所掌握的数学知识提出新的方法和策略来破解陌生情境中的问题。

上海市教育科学研究院
全国教育科学规划十二五规划2011年度教育部重点课题负责人主持完成了基础教育领域大型国际教育评价项目研究
(课题批准号:GFA111015)。课题组主要成员:丁笑炯、陈建俞、方乐,课题还有两名合作者:毛建茹、王湖滨,课题顾问为江彦桥教授。

掌握贫困儿童青少年发展现状是制定教育精准扶贫政策的起点和基础。要通过基础教育精准扶贫促进教育结果公平,首先要了解不同地区之间、不同年龄段或学段之间、不同贫困模式下的贫困儿童青少年与非贫困儿童青少年的差距是什么。质量监测的主要目的是客观反映义务教育阶段学生学业质量、身心健康及变化情况,科学诊断教育质量现状,推动义务教育质量和学生健康水平不断提升。通过自下而上的大规模教育质量监测,能够准确、全面、客观地描绘和呈现区域间、学校间、学段间,以及不同模式下贫困儿童青少年发展现状及差异状况。首先,质量监测以国家教育法律法规和方针政策、课程标准、教材与教育教学现状为依据,在考虑不同地域学生的文化、环境、学习条件等存在巨大差异的基础上,研制出对不同层次儿童的知识和能力水平进行科学测评的监测工具。其次,通过三阶段分层不等概率等抽样方法抽取有代表性的样本进行数据采集,并基于教育测量统计的多种方法对儿童学业成绩、身心健康水平等变量进行分析。再次,根据监测结果进行多重比较,客观分析儿童学业水平的城乡差异、区域差异、群体差异、心理品质、情感态度等全面发展状况。例如,根据省份或者城乡不同地区的教育发展状况,找出教育发展的优势地区和薄弱地区;根据人口学信息对学生进行分类,了解不同类别学生的发展现状,包括学业成绩、身体发展状况、心理品质等。

  在2009年的测试中,数学并非主要的测试内容,但仍然有比较高百分比的上海学生获得了高级别的成绩。“但这些高级别的成绩和数据究竟能证明什么,目前还在研读之中。而2012年是以数学为主的测试,所有从事数学教育研究的人都在关注2012年的成绩。”

一、内容与方法

国外已经开展的大规模质量监测项目也表明质量监测可以准确描绘贫困儿童青少年的发展现状。美国从1969年开始实施的大规模质量监测“国家教育进步评估”(National
Assessment of Educational
Progress,简称NAEP,NAEP主要包括国家级、州级和城市地区试验性评估等不同类型)主要依据地理位置、城市化程度、家庭收入、学校性质等抽样监测,从国家、州及学区等不同层面了解不同儿童发展现状。OECD则设立国际学生评价项目(Program
for International Student
Assessment,简称PISA),通过评估学生在数学、阅读和科学三个领域的学业表现,利用多国抽样分析协助成员国认识与其面临相同挑战的其他国家,全面把握贫困儿童发展状况。除了组织开展专门针对学生的测评项目,一些国家还开展了针对教师、校长等的大规模调查项目,旨在通过多种渠道收集教育质量数据信息,辅助分析影响教育质量和教育公平的相关因素。其中,比较具有代表性的是美国的“学校和教职人员调查项目”(The
Schools and Staffing
Survey,简称SASS),该项目于1987-1988学年首测,每隔3-4年收集一次数据,追踪分析全美至少50个州K-12学区、公立和私立学校、校长和教师的整体信息,为监控基础教育质量发展、摸清处境不利儿童发展现状提供了强大数据库。[2]

考察方式和内容每轮都在变化

本研究课题在界定了相关概念以后,以研究分析国际大型教育评价项目来入手,重点聚焦国际数学和科学趋势研究,并提出我国现阶段引进国际大型教育评价项目值得思考的问题,为我国推进科学、有效的教育评价提供决策参考。主要研究内容有以下三个部分:主要的国际大型教育评价项目总体概况及分析。主要介绍TIMSS的前身、国际阅读素养研究、国际学生评估项目等国际大型教育评价项目;分析三个评价项目的相同点和主要区别,相同点主要有:1.评价项目具有明显的年级或年龄性特征;2.学科界定明确,普遍认为学生的阅读、数学、科学素养和能力是核心内容,最能体现教育质量;3.参与国家、地区以及所发挥的影响力都有不断扩大的趋势。不同点主要有:1.评价理念不同,TIMSS的理念是评估学生在基本知识和概念方面,与课程框架紧密联系的数学、科学和阅读的思维能力。PISA的理念是评估学生在日常生活情境中处理问题所需要的阅读、科学和数学素养;2.评价内容不同,TIMSS评价内容大多与学校课程有密切的联系,试图测量学生对具体知识、技能和概念的掌握程度,大量题目覆盖课程的内容,少量题目测评学生综合能力。PISA则侧重于测量广义的素养,主要是应用知识和技能解决问题的能力,以及在日常生活情境下做出良好判断和决策的能力。这些不同于且高于对学校课程所设置的学科相关知识的理解或记忆能力的考察;3.评价目的侧重点不同,TIMSS项目主要面向学校,所收集的学生背景信息侧重于反映不同国家的教师是如何进行教学的,以及这些教学对学生的成绩可能产生的影响。PISA在于衡量各国义务教育的产出,应用测试结果提供教育成效对比的有效指标,并通过收集家庭、学校等方面的相关信息,侧重点在于为国家教育政策制定和调整提供参考;4.评价对象抽样不同,TIMSS采用以年级为基础进行抽样的方式,主要报告课程成绩。PISA采用以测试时年龄在15岁3个月到16岁2个月的学生为基础进行抽样的方式,目的是描述义务教育结束时的教育成效;5.评价结果报告不同。TIMSS项目的国际平均值以所有参与国家和地区为基准,包括工业化国家、中等收入国家和发展中国家和地区。PISA以30个OECD成员国的平均值为基准,教育质量国际平均值代表了当今世界发达国家的平均水平TIMSS项目个案解析。主要包括:1.研究TIMSS的发展演变历程及趋势,从实测工具和施策目标、参与的国际和地区分布情况、历次TIMSS测试的主要结论和发现等三个方面研究分析TIMSS的发展趋势;2.最新完成的TIMSS2011测试的评价框架,分别介绍分析了TIMSS2011数学测试和TIMSS2011科学测试评价框架的维度划分和占比情况;3.施测情况及结果分析,主要结论与分析详见下文。若干有关论题的思考,主要包括:1.从分析研究TIMSS所带来的对国际大型教育评价项目的认识;2.参与国际大型教育评价项目对我们自身教育体系所发挥的价值等,具体对策建议详见下文。

质量监测能够精准找到导致贫困儿童发展水平差距的原因

  因为PISA的考题是由OECD的65个成员国家和地区共同提供的,因此有一个巨大的题库。即便是同一个数学大类,每次考察的内容和侧重点都各不相同。

本课题研究以教育评价学视角切入,并用国际比较、专家访谈、个案研究等研究方法,通过面上分析国际大型教育评价项目特征、运作、发展等,剖析TIMSS个案,聚焦若干值得思考的问题,为我国大规模引进国际大型教育评价项目提出建议,探索推动我国教育评价理论研究与实践发展。

影响贫困儿童青少年发展的原因各不相同,明确不同地区、不同学段、不同贫困模式等贫困儿童青少年发展水平低的主要原因及其影响因素是国家制定教育精准扶贫政策的重要依据。质量监测不仅收集学生数据,也会收集教师、校长、教育局等多方面数据,采用量化、客观的方式对数据进行分析研究,从而获取贫困儿童青少年整体发展状况以及相关影响因素状况,反映贫困儿童青少年发展状况的短板、与非贫困儿童青少年存在的差距及原因等,为精准制定扶贫政策提供客观依据。

  “考虑到各个国家的特点,这些题目必须达成一个相对的平衡,以防止文化差异导致的测试的不公平。比如有一年的数学奥林匹克竞赛中有一道题目中国学生做得特别好,就是因为这道题目用到了孙子兵法,而其他国家的学生了解孙子兵法的不多。”朱雁说。

二、结论与对策

质量监测不仅能够准确刻画儿童青少年整体发展状况,还将对与儿童青少年发展现状相关联的各种因素进行深入分析,全面把握各相关因素与儿童青少年发展现状之间的关系。这些相关因素包括:在学生层面上的学习兴趣信心、学习方法、家庭社会经济地位等;在学校层面上的教师教育背景、教学策略和方法、职业培训、学校资源、学校环境氛围等;还有教育经济投入、区域差异等。基于监测结果,将儿童青少年发展状况与各相关因素进行关联性分析,可以呈现出各教育要素的相互关系,从而准确找到影响贫困儿童青少年发展水平低的因素。例如,将儿童青少年的学业表现与学校师资状况或者将儿童青少年身体素质状况与其是否享受营养餐进行关联性分析,在其他证据支持的基础上可以反映出儿童青少年学业成绩与师资水平、儿童青少年身体素质与营养餐之间的关系。

  据目前已经公布的资料分析,PISA2012数学测试知识内容主要包括代数表达式,方程与不等式、坐标体系,平面与立体几何之间的关系,测量,数字与单位,算术运算,百分数、比和比例,计数原则,估算,数据收集、表达与解释;数据的变化及其描述;样本与取样;机会与概率。

本研究从介绍分析主要的几个国际大型教育评价项目入手,以国际数学和科学趋势研究为研究个案,重点分析TIMSS2011项目评价进展概况,主要结论观点如下:

PISA、国际数学和科学成就趋势评估项目(The Trends in International
Mathematics and Science
Study,简称TIMSS)等多项国际大规模教育质量监测项目也有大量的相关实践。例如,TIMSS根据学生科学学习兴趣的高低将学生分成了三组,并呈现了这三组学生的科学成绩,一定程度上反映了学生的科学学习兴趣与科学成绩之间的关系。[3]又如,PISA通过问卷的方式测查了学生对学校的归属感,并将其与学生成绩进行关联性分析,以国家为单位,呈现出各参测国“学生的学校归属感每提高一个单位,学生的成绩变化幅度”,此结果反映了在不同国家,学生的学校归属感对成绩的影响程度。[4]此外,由国际教育成就评价协会(International
Association for the Evaluation of Educational
Achievement,简称IEA)主持的国际阅读素养进步研究(Progress in
International Reading Literacy
Study,简称PIRLS),主要通过学生、家长、教师和校长问卷中相关因素的分析,分析学生阅读素养发展与自我认知、学习态度、阅读习惯、家庭学习资源、父母阅读习惯和态度、教师教学时间及接受培训状况等各因素之间的关系。澳大利亚则通过国家基础教育监测,得出班级氛围、学校氛围、地理因素等对学生的学业影响十分显著。[5]

  据了解,2012年测试的大多数数学题目,都是建立在某个场景下的,比如爬山时计步器的使用问题。今年的测试新增了计算机和经济问题,还有问题解决的考察,不完全是往常我们熟悉的纸质考试。

1.新加坡、韩国、日本、中国台北、香港特别行政区等5个东亚国家/地区在TIMSS2011数学测试中持续领先世界。与学生数学学业成就具有正相关的因素有:对学生的早期培养,即早期培养对于锻炼孩子的数字技能至关重要;家庭资源保障和学校资源保障,即家庭资源保障和学校资源保障情况对学生数学学业成绩的重要影响;学校的学习氛围和学习环境,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的数学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生数学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的数学测试成绩;学生对数学学习的态度,即学生对数学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生数学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的数学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响数学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的数学测试成绩。

在严谨和自由之间寻找平衡

2.上述五个东亚国家/地区在TIMSS2011科学测试中表现突出,但没有像数学测试那样稳居前五名,其他国家,如芬兰、俄罗斯、美国等也表现不俗。国家之间成绩分布总体差异较大。TIMSS2011科学测试与前几次科学测试相比,更重视学生科学探究的表现,但结果显示,科学探究表现与学业成绩并没有相关性,TIMSS科学测试成绩名列前茅的东亚国家,学生的科学探究表现普遍不佳,而成绩排名靠后的一些国家的学生在科学探究方面的表现良好。与学生科学学业成就具有正相关的因素有:家庭资源保障和学校资源丰富程度,即家庭资源保障和学校资源保障情况对学生科学学业成绩的重要影响;学校重视学业成就的程度和学校的纪律状况,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的科学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生科学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的科学测试成绩;学生对科学学习的态度,即学生对科学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生科学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的科学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响科学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的科学测试成绩。

  朱雁说,在国际上的各类测试中,东亚国家学生都有一些共性,在PISA测试中同样如此。

通过以上本文对以TIMSS为代表的大型国际教育评价项目的研究与分析,对大型国际教育评价项目的认识以及对于参与国的启示主要有以下方面:

  东亚国家进行数学学习的特点是非常严谨,不论是课堂上的教学还是课后作业,整个过程都非常严谨、规范。“几乎所有前来我国学校听课的国外教育专家,都对我们学生答题和演示过程中专业语言的使用感到吃惊。”朱雁说,“但我们的问题是,不论比赛还是测试,低年级的学生成绩都非常好,到了高年级或者大学,就都不行了。”

1.关于教育质量测评的研究与认识。一方面是进行大规模的教育质量测评很有必要,这主要源于国际上对教育质量的越来越关注并相应地对教育质量的研究也越发深入,通过各种教育评价体系检验国家和学校的教育质量成为一种主要举措;第二方面是文化因素非常重要,已经有越来越多的研究者和实践者认识到文化因素在教育质量评测体系中有着较大的影响作用。但遗憾的是,文化因素在教育质量测评体系中常常被忽略且无法测试,本研究认为这也是国际大型教育评价项目改进完善的一个方向。

  目前国际上对于教育成效有几个主要的测试,除PISA外,还有国际教育评估协会的TIMSS,主要研究数学与科学成就以及影响因素。在TIMSS的测试中也发现,包括新加坡、日本在内的东亚学生,数学总体成绩虽然远超西方发达国家,但在数学推理和理解方面却没有优势,甚至与解题能力有巨大差距。“从2009年的测试来看,中国的学生在数学方面也存在这样的问题,他们在数学知识的掌握方面毫无问题,但是推理和理解能力有欠缺。”朱雁告诉记者,“因此有人把这个现象归结为:过度的严谨影响了我们学生的数学能力——老师要求学生的每一个论证过程和解题步骤都必须严格遵照一定的规定,而西方国家对于数学的要求则是过程和结果正确就可以了,不必过于纠结于细节。”

2.参与大规模国际教育评价项目的思考,主要包括三个方面:一是通过数据可以有针对性的开展大量的改良工作,国际比较的结果不仅仅是一张排行榜,通过这些数据可以有针对性地开展大量的改良工作,也可以对学校结构性与教学结构性条件。如班级规模、课时量、社会身份、移民背景,以及对制定学校发展纲要、教师合作等方面,进行广泛而深入的探究,从而为学校发展、教育领导以及学生成绩的改进提供必要数据;二是参加测试可以聚焦比较,发现优势与不足;比如中国台北在
TIMSS2011表现非凡,很大程度上仰仗于TIMSS测试内容与官方课程高度吻合,或者说,官方课程的国际化程度颇高,这可以说中国台北在课程内容的国际化方面是一个优势。同时,在测试中成绩居后的一些发达国家也逐渐认识到本国教育体系中存在的某些不足,激发他们对TIMSS进行深入细致的研究,例如美国的政府相关部门、教育研究机构及个人对TIMSS进行多方面、多层次的研究分析,这些分析和研究结果在很大程度上推动了美国近十多年基础教育的改革发展;三是参考数据信息制定合适自身教育系统的政策。对于参与国际大规模教育评估的教育体系来说,评估数据可以用于诊断甚至缓解教育体系现存的问题与不足,并向教育政策制定者和学校发展研究者提供线索,以便制定合适自身教育系统的政策。比如新加坡在TIMSS项目测试中成绩名列前茅,但TIMSS测评信息也反映出新加坡教育体系一些不足,比如强调科学探究精神不够、以教师为中心重视知识传授等,基于此,新加坡政府希望能够在创造能力和创新精神方面有更高的发展,因此致力于改变现有的教育体系,要培养年青一代能够独立思考,以便于下一代和将来的年轻人能够找到解决问题的方法,而无论他们遇到什么样的问题。提出建立思考的学校,学习的国家,成为新加坡学校教育改革的大目标,而批判性与创造性思维成为新加坡教育体系实施的重大革新举措之一。

  据了解,OECD在未来还将推出针对成年人的测试,主要是测试成年人的终身学习能力。

三、成果与影响

【链接】

本项目在课题组的协作研究和共同努力下,现已达到课题结题所规定的成果发表要求,由课题负责人赵慧在北大核心期刊《外国中小学教育》上公开发表论文三篇,分别是:1.TIMSS2011科学教育评价框架及运行研究,刊登于《外国中小学教育》2014年第9期;2.TIMSS2011数学教育评价框架及运行研究,刊登于《外国中小学教育》2015年第2期;3.TIMSS2011四年级调查问卷的设计研究,刊登于《外国中小学教育》2015年第9期。为深化研究,作者及课题组成员撰写了4篇相关的专题研究报告,分别是:1.大型国际教育评价项目的现状与发展方向;2.关于教育质量测评的研究和认识;3.TIMSS2011项目的设计与实施;4.我国跨区域大型教育评价项目的设计与运作研究。这4篇专题研究报告从不同的视角对TIMSS项目进行了更深入的分析和研究。

  PISA数学测试中的问题往往是围绕着数学所需的不同类型的技能建构的。

本研究课题的论文发表产生了较好的反响,文章TIMSS2011科学教育评价框架及运行研究和TIMSS2011数学教育评价框架及运行研究为基础教育领域的教育行政管理者、教育研究者、中小学校的校长、教师等认识TIMSS这一国际教育评价项目提供了详实的数据信息、深入的研究分析,为他们了解外国同行提供多维度的渠道和线索,为他们将自身情况进行国际比较和借鉴提供实证信息和研究支撑。其中刊登于《外国中小学教育》2015年第2期的论文TIMSS2011数学教育评价框架及运行研究被中国人民大学复印报刊资料全文转载,刊登于《初中数学教与学》2015年第6期。文章TIMSS2011四年级调查问卷的设计研究则是从问卷调查的角度对TIMSS项目测试进行深入分析,问卷调查在我们的研究工作常常处于一个不太受重视的状态,而TIMSS项目却是包含大量的问卷调查,非常注重问卷调查内容的深刻性以及问卷调查设计的精细化,本论文深刻剖析了TIMSS调查问卷的科学性和专业化特征,这对于我们设计研究项目的调查问卷有重要的借鉴意义。

  这样的技能被组成三个“能力组”:

四、改进与完善

  第一,再现,指在传统数学评估中经常出现的简单计算或定义;

虽然本研究课题已经公开发表若干篇研究论文,并完成研究总报告的撰写,但是由于课题组对本课题的研究认识水平的局限性以及研究计划规定的时间要求等诸多原因,本课题仍有一些需要改进和完善的地方,主要有以下几个方面:

  第二,联系,指回想数学公式和程序来解决简单的和比较熟悉的问题;

1.国际大型教育评价项目本身有需要改进的空间。目前有越来越多的国家和地区参加国际大型教育评价项目,并将评价结果作为调整本国或本地区教育政策的重要依据之一,但是本研究认为,任何一项国际大型教育评价项目都有其可取之处,也都有缺憾,TIMSS不例外,在本研究中就指出文化因素非常重要,也的的确确在学生的学业成绩中具有重要影响,但在质量测评体系中却无法体现,这可能是包括TIMSS在内的大多数国际教育评价项目所共有的缺陷。除了文化因素以外,TIMSS是不是还有其他的不足,这需要进一步的研究探讨。

  第三,反应,指数学的应用、归纳和洞察。要求学生通过分析确定该情形下的数学元素。

2.本课题组对项目的研究水平存在局限性。主要有两个方面:一是从课题组成员构成来看,本课题组成员大多是从事教育研究的科研人员,对于学术理论的把握、数据资料分析、国际比较、研究方法的使用等方面具有较大的优势,但是对于教育实践缺乏亲身体验和了解,这是本研究存在局限性的一个因素。另外一个方面在于TIMSS项目并没有在中国正式测试过,仅在2003年的部分地区2547名学生参加了高三年级数学素养测试,小范围的试点不具有典型意义。这使得本课题组无法从TIMSS的中国实践中得出更多、更有启发的建议和意见,为弥补这一缺憾,课题组研究其他国家、尤其是和我们具有相同文化背景的东亚国家运用TIMSS测试结果进行教育改革的具体实践和举措,经过提炼概括变成具有普遍意义的建议,但毕竟国情不同,教育体系也有很大差别,在政策建议这一方面本研究仍有改进完善的空间。同时本课题组对TIMSS调查问卷最具独特性的课程问卷单独拿出来作为模板并经过适当改造,特请上海有关课程专业研究人员进行问卷回答,据此结果分析了上海基础教育数学和科学课程的实施情况,并提出政策建议。

解读PISA阅读素养测试——

五、成果统计一览表

准确搭脉“第一名”的短板

课题组成果统计一览表

本报首席记者 樊丽萍

序号

  2009年时,上海学生在PISA阅读测试中,成绩排名世界第一。但是,一些对于试题本身的议论,仍然值得一听。

作者

  一位做过真题的学生这样说:考了一些“平时语文课不考,数学课不学”的内容。

成果形式

  一位研究上海语文中考命题的专家则说:PISA对于“阅读”本身的理解,很值得借鉴。

成果名称

  一言以蔽之,PISA阅读测试,和平时国内中小学的语文考试很不一样。

出版单位/发表刊物

  眼下,不少教育专家正在形成一点共识:PISA提供了一种更科学、更权威的评价阅读的方式——对我国的中考和高考语文命题而言具有借鉴意义。

刊物级别

PISA阅读,考出了上海学生的短板

(CSSCI/核心)

  2009年,上海学生在PISA阅读素养的平均成绩是556分,领跑OECD国家。排在后面的依次是韩国(539分)、芬兰(536分)和香港(533分)。参加测评的65个国家和地区,平均成绩493分。

出版时间/刊物期号

  可是,当更为细致的后续阅读素养分析报告出炉时,有个指标却准确地标注了一块上海学生在阅读时存在的“短板”——当遇到具体的阅读困难时,上海学生的调整策略和解决问题的能力低于OECD国家的平均水平。

转载

  PISA所指的阅读,不仅限于国内学校教育中的“语文阅读”,它被认为是一门年轻人为了今后学习、参加工作以及参与社会活动而需要掌握的生存工具。

获奖情况

  华东师范大学课程与教学系研究室主任董蓓菲,毫不掩饰自己对于PISA所秉持的“大阅读”理念的赞赏。“不可否认,当我们读懂文本或教材内容,可以更好地推进下一步的学习。但比起这些连续文本,人们日常生活中的阅读,更多是为了获取信息,更好地达成自己的目的和任务。”就像在数码时代,每一件新产品的问世都附带着产品说明书,说明书一般都是“图文并茂”地教用户操作新产品——这可是典型的非连续文本!

决策采纳

  PISA认为,15岁初三学生中有一部分学生在一二年以后就将走上社会。所以,学校教育应该让他有能力阅读产品说明书、操作手册、工作计划表、报告、备忘录等等。

1

  正因为PISA对“阅读”的理念和我们学校的语文教育有一定差异,按照一些学者的观点,“是一种更先进的理念”,所以表现在具体命题上,不少用来测试阅读素养的PISA试题给人以耳目一新的感觉。

赵慧

  PISA给出的阅读材料大致可分两大类:一类是连续文本,即由句段构成的文本;一类是非连续文本,包括清单、表格、图表、图示、广告、时间表等等。

论文

  董蓓菲告诉记者,她曾用一些PISA的例题给就读教育学或中文系的硕士生做,“有的题目不容易,连研究生也不一定能做对”。

TIMSS2011科学教育评价框架及运行研究

  让董蓓菲印象更深刻的是,PISA所指的学生阅读素养,同时包括了阅读表现、阅读参与度和阅读策略。而上海学生低于OECD国家平均水平的那个名为“自我调控策略”的指标,正是反映学生在阅读策略上的不足。“非连续文本在我们现行教材里几乎没有。当学生面对陌生的文本,理解困难时该从什么地方下手——这在我们现有的教育体系中确实是缺乏的。”

外国中小学教育

相比中高考语文试题,PISA阅读测试更加“科学”

全国中文核心期刊

  更多专家在谈及PISA的测评结果时,通常会用一个词描述:“科学”。在阅读素养领域,PISA的科学主要体现在:把教育学专家们对于阅读的前沿研究成果融入到了考核评价的体系中——对改革国内的中考、高考语文命题而言,这一条的意义尤为重大。

2014年第9期

  国内语文升学考试,无论是中考还是高考,阅读理解题时常引发争议。什么道理?一个司空见惯的现象是:某地高考引用一篇文章作为阅读理解材料展开命题,文章作者本人有时就会跳出来当“小白鼠”做考题,进而发现命题者给出的所谓“标准答案”和自己的写作意图大相径庭。然后,围绕着命题是否合理、科学的争论就唾沫横飞地来了。

2

  相比之下,PISA的阅读测评从根本上消解了这类争议。这正是因为,PISA融入了世界上最新的教育研究成果。

赵慧

  PISA对于“阅读”这个行为的基本理解是:在同一个文本面前,不同的人因为经历不同、文化背景不同,所以读出不同的内容,产生不同的个人喜好,完全是正常的。所以在阅读测试时,PISA的不少试题要求学生对文本作品展开评鉴。比如,针对一篇文章,作者的观点是什么,你是否同意他的观点。

论文

  其实,这类开放性命题在上海近年的中考、高考中已经开始出现,但阅卷老师的反映是:“评审尺度难以把握”。

TIMSS2011数学教育评价框架及运行研究

  在考试评价上,学者们认为,上海应该向PISA学习。

外国中小学教育

  董蓓菲介绍,和PISA十分类似,国际上还有一项针对小学四年级9岁儿童的阅读项目叫“国际阅读能力发展研究”,简称PIRLS(中国目前尚未参加)。这两个阅读测试所使用的测评标准比较接近,由此也刚好反衬出我国的“语文阅读”测评和国际测评的差距。

全国中文核心期刊

  以PISA的一则阅读样题《倒立的老鼠》为例,该文大概的意思是:一位87岁的老人家里闹鼠灾,于是他买来捕鼠器、强力胶。第一天,老人将强力胶涂在捕鼠器的底部,并将捕鼠器黏在天花板上。晚上,老鼠出洞看到了天花板上的鼠夹哈哈大笑,没有上当。第二天,老人把家里的床、大橱等所有家具全粘到了天花板上,老鼠看了以后,以为自己站在天花板上了,于是纷纷倒立,最后一个个脑充血晕倒了。第三天,老人起床,把老鼠扫进簸箕倒了……

2015年第2期

  针对这段材料设置的开放性题目包括:想一想老人和老鼠在故事中所做的事情,这故事里有哪些令人难以相信的地方。

中国人民大学复印报刊资料《初中数学教与学》2015年第6期

  可见,PISA的阅读素养测试,把学生的批判性思维能力放在了一个十分重要的位置,相当程度上传递了语文教育研究的前沿信息。对上海而言,如何参考PISA的理念,建立更科学的考试评价体系,还有进一步提高、完善的空间。

3

《文汇报》 日期:2013年12月2日 版次:12

赵慧

链接:

论文

TIMSS2011四年级调查问卷的设计研究

外国中小学教育

全国中文核心期刊

2015年第9期

4

赵慧

专题报告

大型国际教育评价项目的现状与发展方向

5

赵慧

专题报告

关于教育质量测评的研究和认识

6

赵慧

陈建俞

专题报告

TIMSS2011项目的设计与实施

7

赵慧

方乐

专题报告

我国跨区域大型教育评价项目的设计与运作研究

1.成果形式请注明为论文、编著、专著或教材

2.获奖情况请填写政府颁发的、省部级二等奖以上的奖励,奖项名称应与课题名称对应。

3.决策采纳指被省部级以上党政领导机关完整采纳吸收,并附有基本材料和相关证明。

Leave a Comment.