首先,需要继续提升智能语音的识别率,突破最后的3%。实际上,目前搜狗使用新开发的语音修改功能,通过自然语言交互的形式修改所输入的文字,比“将弓长张改为立早章”等,已经在一定程度上解决了语音识别准确率最后3%的差距,达到了解放用户双手和提高用户输入效率的目的。而搜狗之所以能够在智能语音技术方面率先取得突破,一方面与其多年来的深耕积累密不可分,另一方面也与其搜索引擎公司基因密不可分。按照王小川的话说,搜狗本身就是一家人工智能公司,作为搜索引擎公司之所以能够向用户提供精准的搜索结果,其技术原理就是不断的进行数据积累和机器学习,从而使得其能够准确理解用户输入文字背后的真实意图,从而给出最为精准的答案,而智能语音的原理与此类似,因此与搜狗输入法一样,搜狗有先天优势能让其在智能语音技术方面能够率先获得突破,达到领先行业的高识别率。 其次,复杂多轮交互能力的提升依然是智能语音技术的突破点。实际上,在众多关于人工智能的科幻电影当中,对于人类与机器的交互描述的最理想状态就是让机器能够理解自然语言,实现完全无障碍的复杂的多轮交互对话,而只有做到这一点才真正能够触发“奇点来临”,人工智能时代才算真正开启。因此,在解决最后的3%的语音识别率的同时,在语义理解方面继续提升机器对人类自然语言的理解能力,以及对于不同语境下的复杂对话的处理能力也非常重要,而这些技术等突破甚至还需要情感识别技术的应用,将是更难的技术突破点。 而在这方面,搜狗依然具有优势,因为像语义理解这样的人工智能技术的提升,同样是一个数据积累和机器学习的过程,而这意味着具有庞大的用户量和数据量能够提供为机器学习更多的机会。首先,与其它没有搜索引擎基因公司相比,搜狗搜索是一家国内排名前三的搜索引擎厂商,拥有足够多的用户和足够大的数据量,这是其拥有让人工智能技术成长的“土壤”,而搜狗搜索语音搜索次数增长超过4倍也恰好印证了这一点;而与其它搜索引擎公司相比,搜狗还有国内用户量最大的搜狗输入法作为搜狗语音的“训练师”,其不仅拥有海量词库,日均语音输入更是超过1.9亿次。因此,这两大优势相加,使得搜狗基本上可以“跑赢”目前市面上所有的智能语音产品。 最后,智能语音的技术必须更加通用化和行业化。也难怪人们此前对于智能语音能够达到97%的识别率的“惊讶”,因为除非是记者、作家等文字工作者有语音转文字这样的需求,大部分人在日常的交流当中,极少情况下会有语音转文字的需求,因此尽管智能语音的技术不断进步,但人们却丝毫没有感觉到。因此,在下一阶段的发展过程中,智能语音技术必须走下“神坛”,不能再是普通人不需要的“黑科技”,而是应该成为企业和个人都能因此受益的通用技术和解决方案。 目前来看,搜狗已经率先展开了对于智能语音技术在行业应用中的探索。就在不久前,魅族召开发布会发布了其首款电视智能盒子--魅族盒子,其中就内置了搜狗智能语音技术,用户通过魅族盒子的智能遥控器,用户只要说出自己想看的内容,视频、歌曲、学习、健身等内容就会一呼即应。与此同时,搜狗智能语音技术 在车载导航的应用方面也有动作,最近国内车载导航的领先企业飞歌推出飞的歌黄金G8Ⅱ智能车机产品,该车机就载了搜狗车载语音解决方案的趣驾行车助手,并将语音与服务进行深度整合,实现了以轻应用的形式将搜狗智能语音技术在飞歌黄金G8Ⅱ上呈现,迈出了向车联网探索的第一步。除此之外,搜狗还正在酝酿与VR、智能电视等第三方在智能语音技术方面展开合作。因此,可以预见的是,智能语音技术在家居、汽车、教育、医疗等领域的应用不断深入,用户将能够在更多的场景下,享受到智能语音技术发展所带来的优秀体验和服务。 总的来看,智能语音技术不仅仅需要在语音识别准确率、多轮复杂交互能力方面继续提升,还需要真正能够转化成为企业和用户都需要的服务,这样才能够真正体现出价值,也才能够迎来一个真正属于智能语音时代的到来。 (责任编辑:本港台直播) |