我们如何构造讯飞超脑系统?若将人类的大脑皮层摊开,大约是类似于餐巾布的厚6层的部分。大脑皮层的不同部分处理不同信息,比如视觉、听觉,再汇聚到概念层面。眼睛看到一只猫,会映射到“猫”的概念,大脑会做好准备,听到的猫叫是怎么样的,摸上去是一个毛茸茸的动物。人类可以将这几方面完全联系到一起。《On Intelligence》这一本书详细解释了人工智能与脑科学的关系。 讯飞超脑有感知智能,我们做了viewing machine,reading machine和listening machine。我们的路线是采用深度学习。深度神经网络应用于语音识别最早的公司是科大讯飞和谷歌,之后的6、7年间,深度神经网络被应用于合成、自然语言处理、翻译等各方面。深度神经网络现在已经有很多开源工具,比如TensorFlow,Torch,Caffe,最重要的还是对于深度神经网络的理解。深度神经网络中线怎么连接,构型如何,重复之间的反馈,如何协调不同节点之间的关系,对于性能的提升很重要。掌握这些,并与脑科学连接在一起,才可能达到最佳效果。 在大数据方面,每一个公司都应该有一个大数据的训练平台。讯飞训练语音识别需要10的11次方个训练样本,其中的参数要更新10的9次方次。人脑是不需要那么多数据的,但是目前弱人工智能需要。这种性能在实验室里很难实现,也是目前公司成为研究的主力的原因之一。讯飞输入法现在可以支持方言,少数民族语言,中英、中日之间的翻译。2010年讯飞输入法刚上线,识别率只有55%,第二年就达到83%,去年达到97%。每一种人工智能算法都会按照这一途径发展。去年,讯飞取得了国际多项测试的第一,标志着中国在AI的技术和产业上做好了充分的准备。国际多通道语音分离和识别大赛(CHiME)里,一个pad上有6个麦克风,2个麦克风,1个麦克风,距离4-5米远讲英语,讯飞去年参加比赛,将前年的识别率提升100%,做到了2.24%的错误率。在国际语音合成大赛上,讯飞连续11年保持第一。在去年的国际知识图谱构建大赛,讯飞也获得冠亚军。 同样一句话,“爸爸没法拒绝他儿子,因为他很虚弱”,这中间只换了一个词答案就完全不一样,这个测试叫常识,人类都知道的常识。比如说我们讲一只大老鼠爬上了一只小象的鼻子,虽然它讲了大老鼠和小象,但是我们的常识都知道小象比大老鼠要大很多很多倍。 这类常识需要很强的推理能力和知识的记忆能力,计算机是很难搞的,任何人类十岁的小孩就可以做得到90分,机器在这方面就是打不了高分,这个测试第一年参加我们得了第一名,但是它的正确率只有58%,人类十岁的小孩可以做到90%,知识技能上机器人的挑战非常大。 另外还有一个我领衔的事情就是人工智能863这个项目,就是高考机器人,这个项目当时刚出来的时候,很多人说这个项目肯定做不出来,因为高考是每年真考,高考卷子每年不可能从题库里面查的到,而且又是实打实的,一定要推出来,当时我们国内有一百多个专家参与这个项目,一开始很多人都说有两部分人,一部分人嘲笑我们,说这把吹牛吹大了,你们肯定做不出来;还有一帮替我们担心的,说这个题目是不是太难了一点。事实证明今年是第三年,我们现在语文做到90分,数学做到110分,地理和历史能做到40到50分。地理和历史比语文和数学都难,数学只要能看懂题后面都简单了,后面是逻辑推理,但是语文要写作文,现在我们也能写作文了,问题是看它每一句话都对了,放在一起就不太对。 “When”——人工智能时代何时到来? 人工智能挑战是非常大的,下一个问题就是什么时候人工智能会到来? 人工智能能用在什么地方,这个是我们现在都很想回答的问题。在我们看来人工智能主要是用在两个方面,第一个方面就是改变你所有的日常生活,人工智能使很多机器具备了和人自然交互的能力,包括用语音、红外可以和我们自然交互;人工智能因为可以学习,可以颠覆很多需要专业人士的领域,比如说医疗、教育,这里面很多需要专业人士。人工智能可以替代这些专业人士的某些技能。 (责任编辑:本港台直播) |