并且在实际操作中,还必须把整个测试过程的日志,即机器上所输出的、详细的中间处理过程全部要输出来,以便来确认,这是一个完全由机器自动、一步一步求解过来的过程。 质疑不只限于操作方式。 相对其他学科,机器考高考数学要“相对”容易一些。一方面,数学更多的是依据符号逻辑,数学题目的语言理解相对比较容易,因为相对而言都是一些比较标准化、结构化的描述语言或出题语言,所以机器较好理解。 另一方面,数学中很少有“一千个读者有一千个哈姆雷特”的现象,很多定理、公理和自动证明等,在几十年前就已经有了一系列研究成功,所以目前数学方面的进展还算不错。 但是,最大的难点在于“应用题”,因为涉及到常识理解,目前还有较为明显的短板。 科大讯飞方面还解释称,同属863计划中“高考机器人”研发的“AI-MATHS”,除了自身研发能力,也和电子科技大学数学攻关组保持对接,目前机器解答数学应用题方面,因为涉及常识理解的问题,仍是最大挑战所在。 此外,创新工场人工智能工程院副院长王咏刚,也认为目前的技术远未达到可以应对高考试卷中各类试题的水平。 这位前Google工程师表示,“高考机器人”需要将机器视觉、自然语言处理、知识图谱、机器推理、机器阅读理解等AI方法综合起来,可以部分解决少数类型的文科、理科试卷中的试题,但要说能够应对各类试题,甚至还要跟高考状元等PK,并不现实。 甚至目前的技术水平,科研层面的检验也没有看到有所突破。 王咏刚介绍称,在科研领域,一些单独的计算机解题类任务,atv直播,比如阅读理解,求解代数题,完形填空,知识问答等,目前都有相对客观的测试标准,相对完善的数据集,比较成熟的评估体系。 所以他认为,如果这一类“高考机器人”采用的AI技术真的有科研突破层面的意义,那首先应该做的不是参加高考,而是在权威期刊或权威会议上发表论文,接受同行评议。 对于类似项目对标AlphaGo,王咏刚觉得应该先发或者同时发布学术论文,通过科研同行评测认可,不然会有商业炒作嫌疑。 这位创新工场人工智能工程院副院长还认为即便“直播”也不能完全令人信服,比如现在因为保密的原因,机器是在高考结束后才开始答卷的,而且机器运行时是否有网络和物理层面的隔离,也难以证实。 最后,对于机器做出来的试卷如何评判,也需要有相关标准先定义。 当然,也有人更加直接地表示,这样的“高考机器人”商业炒作意义大于实际。 一位人工智能领域的知名CEO告诉量子位,不看好高考机器人,因为让机器理解题目并不是一件容易的事儿,即便是可能相对有希望的数学,在很多题型上读题难解题更难。 新时代的图灵测试 当然,虽然吹得有点过,但现在的“机器人高考”也并非全无价值。 首先,最直观方面肯定是客观上加速了人工智能的民主化,可以让更多人了解人工智能在教育领域的应用和变革,对于更多机构、学校、老师、家长和学生,也能够利用最新进展,帮助提升应试能力和效率。
△衡水中学学生晒练习题 如果借助AI可能不再会有这么多 比如使机器判卷、个性化指导、个性化作业、教案改进等变成可能,老师的教学效率和学生的学习效果都可以得到大幅度提升,从孔子以来就开始追求的教育终极问题——因材施教,将不断趋近现实。 其次,如牵头参与“高考机器人”项目的科大讯飞所言,根本目标不是为了这个高考,而是聚集科学家对一些人工智能问题进行攻关,产生一批成果,然后在更多领域,比如像机器翻译这样涉及语言理解的任务当中,去应用这些成果。 比如同样的成果就能迁移应用到客服系统中,以及车载人机交互系统里。类似的领域都需要让机器预先对一些行业知识拥有理解,同时基于这个理解的结果,能够做一些决策判断、一些相关问题的回复。 当然,讯飞方面还向量子位提供了一种此前鲜被提及的意义——图灵测试。 (责任编辑:本港台直播) |