(原标题:机器人已试点参与多次大规模考试,探索作文等开放式题目评分) 澎湃新闻记者【新葡京官网】 徐笛薇 实习生 李伶俐 在今年中考阅卷中,襄阳市引进了智能化网上阅卷系统。视频来源 襄阳广播电视台网站(02:51) 对于各大考试来说,阅卷是相当重要的一环,同时也耗时耗力。而随着人工智能不断升级,近年来机器人阅卷技术已日渐成熟。 近日,科大讯飞相关人士向澎湃新闻()表示,在教育部考试中心的组织下,智能阅卷技术,已经在全国多个省份的大规模考试(如中高考、成人高考、学业水平测试等考试)中通过了多次多范围试点验证。 在2017年湖北省的中考中,襄阳市率先引进了智能评卷系统,该市教育考试院院长刘朝志对媒体表示,“相比人工阅卷,智能阅卷除了在阅卷速度上有优势外,还能弥补其在雷同卷、空白卷处理上的不足。” 大规模考试中已进行多次多范围试点验证 2016年3月,教育部考试中心和科大讯飞成立了联合实验室,共同开展人工智能技术在智能阅卷、命题、考试评价分析等方面的研究。 近日,科大讯飞方面告诉澎湃新闻,目前,在考试中心的组织下,科大讯飞的全学科智能阅卷技术已在学业水平测试,例如大学英语四六级,以及全国多个省份的高考、中考、成人高考等大规模考试中进行了多次多范围试点验证。 验证结果表明,计算机评分结果已经达到了现场阅卷老师的水平,完全满足大规模考试的需要。 以往,进行几十万、几百万份考试试卷样本的分析需要耗费巨大的人力资源,可行性很低,但如今通过精准的图文识别以及海量文本检索技术,可以快速核对检查所有试卷与目标相似的文本,并迅速提取并标注出可能存在问题的试卷。 据《襄阳晚报》报道【新葡京官网】,与往年中考阅卷不同的是,2017年湖北襄阳市中考阅卷在全省率先引进了智能评卷系统。阅卷点一位技术人员说,智能评卷系统可进行工作量分析,可列出每个评卷源评卷总量,监控每个老师的评卷质量。 襄阳市教育考试院院长刘朝志称【新葡京官网】,有了智能阅卷大数据,每道题的得分情况,全市的平均点,哪块知识学生掌握得好,哪一块教育教学不到位,都可出一份教育教学诊断报告,更有利于老师教、学生学。“相比人工阅卷,智能阅卷除了在阅卷速度上有优势外,还能弥补其在雷同卷、空白卷处理上的不足。” 据襄阳市教育考试院中招科工作人员龚勋介绍,智能阅卷系统可覆盖绝大多数的范文。运用智能系统后,可在海量数据里面搜索,就能准确判断是否抄袭了范文。 7月19日,刘朝志向澎湃新闻表示,目前还需更多时间才能对外透露更多信息。 科大讯飞方面告诉澎湃新闻,智能阅卷采用了基于深度神经网络学习的图文识别技术,已经达到人眼识别中英文手写字符相当的水平。该项技术应用于正式考试中,可以辅助人工阅卷,减少人员投入,降低人工阅卷中疲劳、情绪等因素的影响,进一步提升人工阅卷评分的效率、准确性和公平性,从而对整个产业产生极大的变革。 此外,通过该项技术,将全部考生作答试卷都进行电子化后生成的海量、准确的分析数据也为之后教与学的研究提供了有力素材,并且提供了未来可被良好应用的、与考试阅卷业务深度结合的突破点。比如,通过智能化的评分和批改加强与真实的课堂更好地结合。 “在做的大项目中有一些技术成果可以用于高考阅卷,但根本的目的是引入人工智能将阅卷推向3.0时代。”6月,科大讯飞轮值总裁吴晓如对澎湃新闻表示,“阅卷1.0时代是纸笔阅卷,2.0时代是在网上把人组织起来用机器自动评阅一些客观题,而在人工智能时代,已经可以开始对主观题进行自动评阅。” 机器批改主观题早不再是空想 一般考试中通常包含客观题和主观题两个部分。而在有了答题卡、扫描仪后,客观题全部可以由机器批阅。不仅阅卷速度大大提升,而且更加准确。 而自20世纪60年代以来,国外许多专家和学者就开始致力于主观题的机器阅卷技术研究,出现了各种不同的自动批改系统,例如美国的MBA、托福考试中就应用了E-rater系统。但这些系统大部分针对的都是第二语言作文,即非母语作文。但是,批阅学生用母语写的作文需要在更高层次,比如作文的文采、篇章的衔接、作文立意等方面做出评判。 到了2015年11月,科大讯飞的机器智能阅卷技术在安庆、合肥等地成功试点应用。经过对人机评分结果的分析,计算机在评分一致率、平均分差、相关度以及与仲裁分更接近的比例等指标方面都已达到或超过人工评分水平。这意味着,机器评阅主观题已不再是空想。 (责任编辑:本港台直播) |