AlphaGo在围棋界耀武扬威之后,AI成了当下最受瞩目的技术趋势,即使在实体经济下行、互联网银根紧缩的“寒冬”里,AI依然逆势而行并迅速成为风口。且在资本趋向保守的情况下,更有助于驱散伪趋势,优质技术趋势和领先的公司,更易在马太效应下获得更多关注、投资和估值。然后,一直被以为在搜索市场紧趋百度的搜狗,终于向人们展示了几年间在AI方面的巨大成果。 搜狗AI进入大众视线是借由江苏卫视的《一站到底》栏目,作为国内一线卫视中答题类综艺节目的头把交椅,《一站到底》在鸡年正月全新改版的节目中,引入了搜狗问答机器人“汪仔”,与人类选手对决。 从人机围棋大战、到《最强大脑》的人脸识别,再到一站到底的人机答题PK,机器AI取得了对人类的三连胜。而这三场胜利,分别代表了AI的三个核心技术:基于深度学习的算法提升、以及图形识别和自然语言理解——值得注意的是,这三场人机大战中,所涉及AI技术甚多,以搜狗汪仔在《一站到底》中的答题为例,在自然语言理解之外,参与比赛还涉及到语音识别、信息抽取、信息检索、数据挖掘、文本计算等诸多AI技术,但其中最具代表性、技术综合难度的还是自然语言理解。 只是答题?没那么简单 AlphaGo让人们聚焦在AI,甚至有“机器取代人”的恐慌,人脸识别技术中AI包含的很多技术标准,让人们知道了机器除了会下棋还能进行图像识别;而搜狗汪仔,则真正带大众进入了AI普及:AI已经存在于我们身边,并非那么晦涩的技术,它有着更多意想不到的用处。 搜狗的选择也体现了这家公司强调实用的风格,但对于大众来说,理解其中的技术难度是有一定门槛的。如果不了解《一站到底》比赛规则的观众大概会觉得机器答题当然比人要强多了,机器的运算能力这么强,就如同加减乘除一般,当然能够很快找到正确答案啊!? 然而并非如此,《一站到底》的答题规则实际上是不利于机器答题的,主要基于语音听题和可以抢答这两个规则。 简单来说,比赛对机器有着严苛的规定,需要根据语音转化为数字信号再进行识别分析——汪仔在开始进行答题之前,须先跨过自然语言识别与理解这个巨大的门槛,而在中文语音识别上,直播,谷歌、苹果这样的公司,要做到准确都很难,更不用说在节目现场嘈杂的环境中、允许抢答的速度压力下,进行自然语言识别——数字信号分析——在线问题检索和答案匹配——文字转化语音播报回答,这么一系列高要求的运作,即使搜狗已经将准确率做到了97%,但该节目规则限定给出答案只在几秒之间(看节目,atv,人类选手答题的速度大概在听完题后的3秒内)。 而在所有环节中,最难的就是前段语音识别,从节目现场看,主持人也并没有为机器人特意减缓语速,而自然语言识别又提高了难度——想知道多难吗?打开你的苹果siri,用正常说话的方式问问题,看看识别率和速度有多快,就知道这有多难了。 进行了自然语言的识别与理解后,到达最关键的答题环节,不论是比赛中的问答,还是答题外的对话,搜狗汪仔背后依靠的是基于人工智能技术的搜狗立知问答系统。 据悉,目前立知主要可以处理三类问题,事实类,分析类,与观点类,而这每种类型的问题背后也有着多层的技术处理。 这大概也是人们感叹汪仔AI技术能力的重要原因。 AI某些领域,中国公司强于Google 每次新的风口到来的时候,就会冒出很多程咬金希望分一杯羹、蹭个热点,刷刷脸讲故事,做些品牌包装。但了解行业和王小川的人知道,在AlphaGo和李世乭大战之前、AI进入人们视线之前几年,搜狗王小川就已经是AI技术的倡导者,不仅在各科技大会上频繁站台AI,这位技术范儿十足的老大也早就深入到AI研发中。 (责任编辑:本港台直播) |