本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:这家被收购小团队 完成了百度唤醒万物的第一步(2)

时间:2017-08-05 12:36来源:本港台现场报码 作者:118开奖 点击:
KITT.AI的另一项核心技术正是NLP,应用到其产品对话系统ChatFlow中,从而帮助开发者开发对话系统,实现人机对话。而姚旭晨和首席科学家曹原则是美国约翰

KITT.AI的另一项核心技术正是NLP,应用到其产品对话系统ChatFlow中,从而帮助开发者开发对话系统,实现人机对话。而姚旭晨和首席科学家曹原则是美国约翰·霍普金斯大学CLSP实验室(Center for Language and Speech Processing)的博士,主攻方向就是NLP。

近期,关于智能音箱的“智商”问题一直被大家吐槽,而智商背后的关键就在于NLP。尽管BAT等互联网公司拥有海量的数据资源,能够将语音识别做到97%以上,但在NLP上进展却并不明显,各家的语音助手仍被吐槽。

(KITT.AI官网关于对话系统ChatFlow的介绍)

那么NLP在语音应用上到底进展如何呢?姚旭晨谈到,“凡事无法衡量的东西,都是难以改进的”,像语音识别和图像识别很容易measure(衡量),语音识别看看错别字就可以衡量识别率。但是自然语言不是,直播,它是一种开放式的问题,你问它一句话,它可能有100种回答,所以你很难测量这个表现的结果。如果不能测量这个表现,则很难对其进行优化。

NLP是人工智能里最难的问题之一,在人机交互里,机器距离听懂人话还有很远的距离。以智能音箱中的多轮对话为例,目前通用语的多轮对话还难以实现,更多的是特定任务中的多轮对话能力,如打车、叫外卖、定电影票等。

目前NLP还没有太大的突破,它要像人一样会思考、会推理,还有很长的路要走。所以NLP在智能音箱、儿童玩具中做一个简单方便的小助手尚可,但其他的应用还难以做到。这另一方面也说明了,为什么当下的智能音箱大多是“one shot”(一次唤醒一次问答)模式。

四、从收购KITT.AI看百度的语音布局

DuerOS语音交互平台是百度“All in AI” 的重要一步,景鲲指出,DuerOS的核心理念是“唤醒万物”,而唤醒万物的三个基本要素是:听清、听懂、满足——可以理解为语音识别、语意理解、以及响应。

(图为度秘事业部总经理景鲲)

百度在语音识别和内容服务方面已有很多资源,此举收购KITT.AI,正是看中其在语音唤醒和自然语言处理上的优势,从而在“听懂”上更具优势,完善整个语音生态。

KITT.AI在被收购前就已经有近2万名免费开发者,还有来自四个大洲的许多付费客户,并且其公司在今年4、5月份已实现盈利。

在谈及选择百度的原因时,姚旭晨谈到,确实有许多公司想要收购KITT.AI,之所以选择百度,核心原因在于KITT本身的定位就在于平台,即成为一家成功的SaaS (Software as a Service,软件即服务)公司,而百度可以给他们提供一个更大的平台,更多的开发者。此外,百度对技术更加认可,并且也给予其团队很大的自由度,同意团队在西雅图独立发展。

百度需要唤醒和自然语言技术,来强化底层技术根基,而KITT.AI也需要更大的平台,二者可以说是一拍即合。

除了DuerOS和Apollo两大平台产品以及语音领域的KITT.AI外,今年百度还在2月份收购人工智能创企渡鸦科技,4月份收购硅谷专注于机器视觉的AI公司xPerception。在百度内部,搜索部门为AI提供知识库和文本的解决方案,地图团队为自动驾驶提供导航,百度云提供基础设施,百度医疗大脑提供人工智能诊断,可以说百度的“All in AI” 绝不是一句空话。

结语:语音——人机交互的未来

DuerOS的核心是唤醒万物,而人机交互的第一步则是唤醒词,可以说KITT.AI这个由3位高材生组成的明星团队完成了百度唤醒万物的第一步。

然而,姚旭晨也坦言,自然语言处理尚未实现突破性进展。如何让机器听懂人类、理解人类,仍会是我们很长一段时间内面临的难题。返回搜狐,查看更多

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容