2014年五月,森尼维尔市的研究中心正式启动,吴恩达和他的首席助理亚当·科茨(Adam Coates)在一块崭新的白板上决定了他们的第一个项目。在罗列出他们即将面对的所有可能性与挑战后,他们决定以语音识别为起点,为将来的一系列其他项目打下根基。 2015年,吴恩达带领的50人团队研发出了能够识别大部分英语的语音识别系统Deep Speech。不同于以往的逐字机械识别,Deep Speech可以通过对于语言数据的语法分析,推测其句法和句意,而这正是深度学习的一种。吴恩达表示,相比较传统的依靠单词表和语音规则翻译的搜索引擎,Deep Speech更是对语言的一种转录。Deep Speech能够根据上下文推断每个单词的具体含义。 研发中,他们遭遇最大的问题就是英语中的外来词。“如果你对Deep Speech说‘播放柴可夫斯基的音乐’,它录入的可能是‘播放柴·克服·司机的音乐’,”科茨解释道,atv,“所以我们把这个问题戏称为‘柴可夫斯基问题’。”
为了解决这一困难,百度的开发员们并非简单地在单词列表中增添“柴可夫斯基”一词草草了结,而是尝试教会Deep Speech系统理解这个单词。这就意味着他们必须投入更多精力,输入更多数据让系统本身学会识别上下文。 百度自然语言工程师赵世奇回忆起自己在中国哈尔滨工业大学学习计算机科学的年代,电脑翻译软件只有200万中英词对,而如今,百度翻译却有1亿对。不过根据《科学》杂志2016年刊登的文章中的数据,Alphabet已经拥有5亿中英词对,百度与之相比仍是小巫见大巫。
Baidu Deep Mind 为缩小这一差距,百度想的解决办法似乎是老套路:投入大量人力资源。就像文章开始提到的那场翻译马拉松赛一样,百度定期聘请大量译员进行人工翻译,作为回报,百度会在每次翻译大会中分发智能手机或者净水器作为奖励。收集到的大数据不仅能提升百度翻译系统的性能,也能支持Deep Speech的进一步研发。 2016年六月,随着web语音翻译工具TalkType的发行,Deep Speech首次应用在商业用途中。此外,Deep Speech也进一步和其他产品进行合作,其中包括各类和Siri类似的语音助手,比如结合了“百度”和“秘书”两个词的人工智能秘书“度秘”。在世界其他地方,“度秘”的名字叫“度儿”,因为这一中文发音类似于英语中的“Doer”。百度开发的Deep Speech也逐渐和其他产品合作,开发人工智能。例如在今年一月美国拉斯维加斯举办的国际消费类电子展(CES)上,百度度秘和小鱼在家联手发布了新一代小鱼在家视频对讲机器人,成为亚马逊的对讲机器人Echo的有力竞争对手。
百度展示的“小鱼在家”(来源:百度图片) 百度拥有的一系列门户网站使公司清楚知道中国大部分用户的个人信息大数据,这在一定程度上也是百度进军AI产品和服务领域的优势。有了百度糯米和百度外卖,百度对于中国家庭的购物和饮食偏好了如指掌;有了世界第二大旅游网站携程,百度又进一步掌握了中国家庭最爱的旅游目的地。每个月,有6亿650万智能手机用户通过百度的移动终端或者app上网,有3亿410万用户使用百度地图导航。“纵观各个应用案例,我们不应该把AI理解成一种产品,而应该把它理解成产品背后的支持体系。”汇丰控股有限公司分析师Chi Tsang如是表示。 尽管百度的AI产品还未实现盈利,但这一努力可能帮助其在其他方面取得主导优势。在这些领域,百度已经拥有立足之地,同时在将其推向新的层次,比如云计算和无人驾驶汽车等领域。“三到五年内,这些领域都可能涌现另一个百度,”百度总裁张亚勤在谈及百度的602亿美元市值表示,“是时候下一个赌注了。” (责任编辑:本港台直播) |