作为国家级项目, “ 高考机器人 ” 仍在开发和完善之中,要 2019 年才会正式参加考试。但今年参与考试的 “ 考生 ” 之一准星云学 AI-Maths ,与该项目有着密切关系。资料显示,准星云学的核心团队于2015年参与了 “ 基于大数据的类人智能关键技术与系统 ” ,并主导子课题 “ 初等数学问题求解关键技术及系统 ” 。后者正是 AI-Maths 技术的重要来源。除此之外,AI-Maths 还综合了清华大学大数据及自然语言识别等前沿技术,是“一款以自动解题技术为核心的人工智能系统”。 而另一个 “ 考生 ” Aidam,则来源于学霸君。此前,学霸君接受36氪采访时曾经描述教育中,清楚地分析知识点,做到知识框架全局可细分就需要用数据来驱动学习效果,而数据则来源于学生使用学霸君时的各种行为记录。 在讲解 Aidam 的背后逻辑的时候,学霸君的首席科学家陈锐锋使用了围棋作为比喻。类似于围棋棋盘可以被分为无数横轴和纵轴。人的思维模式和解题模式也可以被具象为棋子,棋子的纵轴与横轴分别代表起始的状态和下一步的状态,这样,每一次题目的可能解法,就相当于在一个庞大思维矩阵里下棋的过程。而学霸君此前积累的庞大的题库与数据记录,恰恰类似于无数张围棋棋谱,为人工智能自主学习提供了可能性。“我发现,原来在我们的题库里面我们记录了大量的关于状态之间可跳转、可推演、可演算、可关联的信息。” 不同的背景决定了二者的不同的解题思路,甚至在一定程度上截然相反:准星云学的 AI-Maths 与 863 计划的高考机器人的思路一致,强调 “ 不联网、不连接题库、无人工参与 ”,在只有少量训练样本的情况(只有约500套试卷、1万道题的训练量)以机器建立类似人类的复杂逻辑推理能力与联想能力。试图让机器在较少样本和较少资源耗费的情况下,拥有“举一反三”能力。而学霸君的思路则强调大题库(已经有超过7000万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识元件和解题模式。从某种角度说,这两种模式的区别类似于Alphago 早期版本的学习过程,计算机可以通过规则自己对弈,也可以学习棋谱。从此前的测试中看,Aidam 的成绩要好于 AI-Maths,但如果以纯粹人工智能的难度和多行业的延展性,AI-Maths 要略高一筹。
陈锐锋为观众讲解AI原理 不过,尽管距离人类只有“1分之隔”,但无论是 AI-Maths 还是 Aidam ,仍然有很长的路要走。 在四个月前的那次首次亮相中,AI-Maths 仅得了 93 分。事后,准星云学 CEO 林辉在接受记者采访时,认为它失分的重要原因来源于“无法理解题意”,它们缺乏人类生活的常识,它们无法理解“投资”、“理财”这些概念。 在现场,AI-Maths 的研究人员举了一个例子:它可能能够解决复杂的数学问题,因为1-9的数字对它理解起来非常很容易。但是人工智能要理解“苹果是什么”却很难,因为一个具象苹果,需要非常多的描述。人类可以从小从生活经验里习得,而 AI 则不能。这也导致了,在语言相对更复杂,概念更多的应用题领域,AI 的难度要比人类解题大得多。 这一问题同样困扰着 Aidam 的开发者。陈锐锋简要介绍了 AI 的答题过程必须经过三步: 第一步,从自然语言转为形式语言,需要将复杂的数学题分析其中的语法结构,抽出其中的主谓宾,形成能够让AI理解的语句。第二步,从形式语言进行自我映射、自我推理,并完成最终解题过程。第三步,将解题完成后的机器语言翻译回人类的语言。仅在解决“如何将几何语言转化为机器语言”这一难题上,开发者就花费了整整一年的时间。此次的题目也是由人手工输入,在一定程度上降低了 AI 解读的难度。 但从整个 AI 行业而看, AI 对语言的理解,乃至对于主观题的判断,又比人们设想的更加迅速。据吴晓如在访谈中介绍,目前科大讯飞的智能阅卷产品,已经可以实现对主观题,甚至对语文、英文的这样一个作文题都可以实现自动的评分,包括给出详细批语,甚至可以对学生们用的好的一些优秀的排比句,和名人名言给予针对性的鼓励和评点。另一方面,微软小冰在2017年5月19日出版的诗集《阳光失了玻璃窗》获得好评,被认为比起去年的高考作文有了很大的进步。 (责任编辑:本港台直播) |