“实时·自动化教育评价”系统给你带来惊喜
“这套系统的核心就是等价测题的生成。没有等价测题,就像用不同长度的尺子去搞测量,测量的结果肯定不具有可比性……”
11月12日,在珠海“第四届中国教育创新成果公益博览会”上,由中国经济改革研究基金会立项资助、中教新材文化发展机构专家组开发的“实时·自动化教育评价”系统,吸引了众多参观者的关注。这套系统包括了中小学生综合素质教育评价中的自动生成等价测题、自动生成测评报告、自动撰写评语和自动推送补偿练习等功能,承载了能实现测评尺度统一、测评结果“实时高效”、思想品德和社会实践实现量化评价等一系列成果。
该系统在历经3年多的试运行后,终于在本次教博会上精彩亮相。
在展台前,来自全国近40家高校和研究机构的专家、中小学校长等专业人士,正在认真观摩该系统现场抽取等价测题、查看测评报告和诊断意见、评估自动生成的“评语”等操作,不时点头表示肯定。
“等价测题就像是一把测量教育结果的公平尺子。有了它(等价测题),公平地进行教育评价有了根本依据。”中教新材文化机构专家常维媛在展厅告诉记者。
什么是等价测题?在学业评价过程中,若学生通过解答不同的两份测题所得的结果,能判别被评价的学生在受到的学科教育中所获得的知识、能力对其自身素质提升价值的大小是相等的,则这样的测题就叫做等价测题。简单说就是,如果学生做答不同的两份测题而付出的智力劳动相同,那么,这两份测题就具备了等价的基本条件。
记者发现,这套系统还内嵌了一个“智能型题库”,作为等价测题生成的源泉。
“对于学生的测题,不是越难越好,也不是越简单越好。题目设置是否科学关键要靠两点:一是要与课程目标相契合,二是要与孩子的成长规律相吻合,”中教新材文化发展机构专家高岩峰说,“我们在设计题库时充分考虑了上述两点,并对每道题目都进行了多维度检验,确保其达到等价测题的标准。”
有了自动生成等价测题和智能型题库这两个条件,要对一个地区的学生进行学业评价,就可以不动用很多人力组织大规模的统一命题。教育行政部门只要规定出测试类型和各项标准,各个学校、各个学科或各个班级,都可以按照规定的测题指标在系统中自动组成多套等价测题供使用者选用。这样就可以使教育水平测试化整为零,可以在不同的时间、不同的地点完成目的统一的测试,结果完全具有可比性,能够更加客观便捷地了解教学质量。
“我们从研究课程、测题、学生头脑中的知识结构这三者之间的关系入手分析,引进相关学科的科研成果为指导,历经20多年探索,终于研发出了判定测题‘等价’的系列方法,又用电脑软件开发出了自动生成等价测题系统,”常维媛自豪地表示,“自动生成等价测题系统连同自动生成测评报告系统、自动选择参照标准系统等三项创新成果,已申请国家专利。”
记者从辽宁省瓦房店实验小学学生王小丽那里了解到,她在近两个学期里使用“实时·自动化教育评价”系统在线测试。开始时,测试报告显示她在数学方面有些问题、需要“补偿”,系统自动提出了补偿建议并给出了适应小王学习水平的补偿练习题。经过使用系统推送的梯度练习题,坚持自我训练,终于把不十分明白的知识搞明白了。
“经过几次测试,系统把我学习上的短板一个一个都给拽了出来。通过‘补偿练习’,我一点一点地把短板补上了,学习也越来越有底气,”王小丽告诉记者,“现在已经离不开这个系统了。”
“过去从来没想过思想品德项目还能进行量化测评。近半年的测评报告显示,我们孩子在‘直面挫折、不怕失败’方面还得再加把劲。”大连市沙河口区新兴小学的一位学生家长表示。
原来,该系统不仅能对学生进行学业平均水平、增值水平、学科协同、存在的主要问题和发展趋势等学习方面的评价,而且还能进行其他素质分项评价和综合素质评价。
比如,针对中小学生的综合素质评价分为“思想品德”、“学业发展”、“身心健康”、“兴趣特长表现”、“学业负担体验”、“实践能力”等六个模块。以“思想品德”为例,专家组按照“中国孩子健全人格培养的核心要素”进行分解,设立34个测评点,每个测评点都有明确的评价标准与方法,并将测评融入日常学习、生活中自然而然进行。这样就能根据每名学生的不同特点,形成了关于“思想品德”方面的个性化测评报告,既有效避免了以往思想品德评价报告“千人一面”的窘境,更让学生和家长明确了孩子在德育方面的着力点和努力方向。
与此同时,已经是辽宁省新民第一中学的高二学生丁思洋告诉记者,他上学习期末利用这套系统对自己的“实践能力”进行了测评。“系统测评的实践能力包括学科实践、班组实践和自主实践三大类,目前我在自主实践方面的得分不高,得抓紧下点功夫。”丁思洋说。
“实时”,就是立刻、马上的意思。
“不仅能实时生成等价测题,测试报告也能实时产生,太神奇了!”这是大连市甘井子区六一小学的姜龙梅校长发出的感叹。
姜校长指着五年级学生语文、数学、英语单科和三科综合四份报告让记者看,学生的平均水平和分化程度、对比上次测试的增值水平、男女生群体的差异、各学科的协同水平、“学困生”的比率,等等,在报告中都是一目了然。
“在过去,这些报告的生成少则几个月,多则一年。有时拖得太久,(测评结果)参考价值也就不大了,”姜校长说,“现在运用该系统,不论是个体还是群体、单科还是多科,都能立刻生成测评报告,我们马上就能知道接下来的工作重点是什么。这对于教育真是翻天覆地地变化。”
“在辽宁、北京、陕西等多个地区的试运行显示,该系统能够客观全面地评价学生综合素质发展,实现了‘评价’与‘导行’的完美结合,受到学生、教师和家长的一致好评,各类测试符合度和回访满意度均在96%以上。实践证明,该系统的研发为互联网和大数据助力教育事业找到了切入点和突破口。下一步,我们将继续拓展其功能,着力打造一个现代化的综合性教育网络平台,为落实立德树人根本任务、服务建设教育强国添砖加瓦。”中国经济改革研究基金会秘书长石明磊表示。
图片说明:学生们正在运用系统进行测试