宋继强最近与德国做机器人的院士进行交流。院士坦言,即便是最厉害的深度学习也不可能将识别准确率做到100%,算法只是其中的一步,事实上机器人要运行稳定、要可靠,还有很多维度的事情要完善,还有很多问题要解决。在AI+IA的发展思路上,德国院士与宋继强的观点是一致的。
知识库是下一AI竞争关键点 目前大家对人工智能的关注焦点是算法,“深度学习”尤其火。应该说,深度学习是目前解决AI问题的最好方法,直播,但并不排除未来还会有更高效的AI算法出来,事实上解决人工智能的问题,不同的工具在不同的维度有不同的优势。 宋继强表示,另外一个维度是中国应该关注的,就是前面提及的“知识库”(Knowledge Vault),这是AI的另一个难题。 麻省理工(MIT)等是比较早开始做知识库的机构,当时为了让机器人在室内工作,需要建立一个知识库,主要覆盖室内的常识(Open Mind Common Sense)。比如让机器人从室内到门外,门是关着的,机器人看到门是关的,它是不知道如何出去的,门牵扯到哪些?开关如何操作,门才可以开?这是一套连接的知识网络。当时学术界做这样一套常识,投入很多人力,几届学生一起做才完成,用半结构化的短句,把知识做在里面,这些知识通过一定的模式可以查询出来。仅仅是一个室内场景,建立常识库就很不容易,而且稍稍变化一下环境就不适用,比如在国外建立的常识库,拿到中国就未必适用了。 在宋继强看来,知识库是人工智能里边最复杂的东西,因为知识日新月异。他举了一个非常浅显的网络语言的例子,现在年轻人三天两头换新词,如果不更新这些词汇,你就不懂他讲的是什么意思。 宋继强提及了谷歌公司正在建立全球最大的知识库的事情,可能这个信息还没有引起更大的关注。谷歌通过算法自动搜索网上的信息,利用机器学习将数据变成知识,到目前,谷歌已经收集了16亿件事实,而谷歌表示这个知识库要建立起来至少需要十年的时间。而事实上,这是一个非常有“野心”的事情,因为一旦建立起来,意味着全球的智能设备都有可能需要去使用其知识库,它就有可能左右这个世界的所有智能设备。 我在网上搜索了一下国外分析师对谷歌正在构建知识库的评价,还是吓了一跳。比如,“知识库除了改善人机交互之外,也会推动现实增强技术的发展”。“知识库还能够改变我们研究人类社会的方法,甚至可以对未来做精准的预测”。“知识库改善人们的生活和娱乐,甚至是战争的方式”。 目前全球许多大公司都在构建知识库。在宋继强看来,构建知识库这个事情也只有大公司可为,因为做它时间跨度很长,小公司根本支撑不下去。而且这个知识库如果被别人利用了,智能设备的观点都会发生变化,它会影响机器人以后的价值观,重要性不言而喻,不能被短期利益驱动。而且知识库和文化和地域有关,我们不可能一大堆的设备总用英语去查询,所以它需要本地化、中文化,美国做的知识库肯定不太适合中国。中国的大公司应该注意到这个维度。中国的公司中,宋继强认为,百度和腾讯都有可能做这个事情。 除了知识库中国需要发力,宋继强认为中国应该发力的第二个方面是自然语言处理。因为在认知推理中,很重要的一个关键是如何在比较少的数据中,推理得到有意义的结果,在其中很多是与自然语言相关,而中国在自然语言理解上有优势。从视觉识别来看,国内和国际没有太大的区别。而在自然语言识别上有很多差别,我们推动AI往下走,很多技术与之密切相关。只有在知识库和自然语言理解上做好,我们才敢把更多的事情交给机器人。 CPU、FPGA和ASIC 谈及AI离不开计算力,从字符识别语音识别到图像识别,对计算能力的要求是一步一步往上走的,这一步一步的往上走离不开计算能力的大幅提升和成本的大幅下降。现在AI要求计算能力不断提升,有的公司也采用图形加速器去做训练、去做识别,遇到的难题之一就是计算能力提升,功耗也变大。而很多智能设备是移动的,不管是无人车还是服务机器人,都要求续航时间,都对功耗降低有迫切需求。而做AI智能设备有三步,识别、推理、行动,所以不仅仅是要它进行识别,还要它进行分析、挖掘信息,计算能力和功耗之间的矛盾就变得越来越突出了。 (责任编辑:本港台直播) |