正是有了以上对于人工智能的分析、定义和决策,公司在2014年推出 “讯飞超脑”系统。我们希望能够突破感知智能和认知智能,能理解会思考,这样才可能真正解决问题。
我们如何构造讯飞超脑系统?若将人类的大脑皮层摊开,大约是类似于餐巾布的厚6层的部分。大脑皮层的不同部分处理不同信息,比如视觉、听觉,再汇聚到概念层面。眼睛看到一只猫,会映射到“猫”的概念,大脑会做好准备,听到的猫叫是怎么样的,摸上去是一个毛茸茸的动物。人类可以将这几方面完全联系到一起。《On Intelligence》这一本书详细解释了人工智能与脑科学的关系。讯飞超脑有感知智能,我们做了viewing machine,reading machine和listening machine。我们的路线是采用深度学习。深度神经网络应用于语音识别最早的公司是科大讯飞和谷歌,之后的6、7年间,深度神经网络被应用于合成、自然语言处理、翻译等各方面。深度神经网络现在已经有很多开源工具,比如TensorFlow,Torch,Caffe,最重要的还是对于深度神经网络的理解。深度神经网络中线怎么连接,构型如何,重复之间的反馈,如何协调不同节点之间的关系,对于性能的提升很重要。掌握这些,并与脑科学连接在一起,才可能达到最佳效果。 在大数据方面,每一个公司都应该有一个大数据的训练平台。讯飞与百度是国内用GPU做训练平台的最大公司之一。讯飞训练语音识别需要10的11次方个训练样本,其中的参数要更新10的9次方次。人脑是不需要那么多数据的,但是目前弱人工智能需要。这种性能在实验室里很难实现,也是目前公司成为研究的主力的原因之一。讯飞输入法现在可以支持方言,少数民族语言,中英、中日之间的翻译。2010年讯飞输入法刚上线,识别率只有55%,第二年就达到83%,去年达到97%。每一种人工智能算法都会按照这一途径发展。去年,讯飞取得了国际多项测试的第一,标志着中国在AI的技术和产业上做好了充分的准备。Challenge 是英语语音识别大赛,一个pad上有6个麦克风,2个麦克风,1个麦克风,距离4-5米远讲英语,讯飞去年参加比赛,将前年的识别率提升100%,做到了2.24%的错误率。在英语语音合成大赛上,讯飞连续11年保持第一。在去年的知识图谱大赛,讯飞也获得冠亚军。 同样一句话,爸爸没法拒绝他儿子,因为他很虚弱,这中间只换了一个词答案就完全不一样,这个测试叫常识,人类都知道的常识。比如说我们讲一只大老鼠爬上了一只小象的鼻子,虽然它讲了大老鼠和小象,但是我们的常识都知道小象比大老鼠要大很多很多倍。 这类常识需要很强的推理能力和知识的记忆能力,计算机是很难搞的,任何人类十岁的小孩就可以得到做到90分,机器在这方面就是打不了高分,这个测试第一年参加我们得了第一名,但是它的正确率只有58%,人类十岁的小孩可以做到90%,知识技能上机器人的挑战非常大。 另外还有一个我领衔的事情就是人工智能863这个项目就是高考机器人,这个项目当时刚出来的时候,很多人说这个项目肯定做不出来,因为高考是每年真考,高考卷子每年不可能从题库里面查的到,而且又是实打实的,一定要推出来,当时我们做了国内有一百多个专家参与这个项目,一开始很多人都说有两部分人,一部分人嘲笑我们,说这把吹牛吹大了,你们肯定做不出来,还有一帮给我们担心的,说这个题目是不是太难了一点,事实证明今年是第三年,我们现在语文做到90分,数学做到110分,地理和历史能做到40到50分,地理和历史比语文和数学都难,数学只要能看懂题后面都简单了,后面是逻辑推理,但是语文要写作文,现在我们也能写作文了,问题是看他每一句话都对了,放在一起就不太对。
这个就告诉我们人工智能挑战是非常大的,下一个问题就是什么时候人工智能会到来? (责任编辑:本港台直播) |