继在年初预告之后,黑智(ID:VR-2014)的年度50家创新公司采访计划已经正式启动。在今年的系列“AI创新50”采访策划中,请和我们一起走近人工智能领域的创新公司,对话AI行业领军人物,寻找人工智能技术和行业结合、走向商业落地的机遇。 未来已来,只是也许你还没有注意。而这里,讲述的就是AI的商业价值,以及那些人的故事。 本期采访嘉宾:普强信息CEO 何国涛 VoiceLabs近日发布了《2017年语音报告》,预计语音交互的市场规模将超过200亿美元。国内外互联网巨头,包括车厂都在不断收购初创语音技术公司,抢夺语音交互的赛道。亚马逊开放Echo音箱的语音识别技术;Facebook创始人扎克伯格去年自己花100小时完成AI管家Jarvis的开发…… 作为中文智能语音和语言核心技术提供商,成立于2009年的普强信息,对自己的发展路径,也作出了清晰的定位:专注语音分析系统,实现技术产业化。普强自主研发的“千语千寻语音分析系统”,针对呼叫中心,切入语音大数据分析业务。2015年,普强切入车载场景,联手四维图新和腾讯,共同开发出“云+端+芯片”的智能车联网大数据系统。 普强CEO何国涛认为,算法是公司的技术壁垒,在此基础上,积累大数据,做语音数据分析,以理解用户、挖掘刚需市场,则是在语音识别领域,切分巨头市场的一大法宝。 文 | 赵雪娇 编辑 | 黑智(VR-2014) 语音识别是“最具前途”的领域 从北京大学和美国费城大学分别获得计算机系硕士学位后,何国涛曾在HP、Aruba等公司从事Opencall、Voice XML、无线网关等产品的研究和开发,HP多媒体服务器的语音识别技术,就是他所在的小组研发的。 而也就是在Aurba,何国涛结识了蒲瑶。后者本科毕业于中国科技大学,是科大讯飞CEO刘庆峰同系校友,同样也是从事语音识别相关产品的研发。 2008年,科大讯飞上市,一度垄断国内语音识别市场的半壁江山。但那时的语音识别创业领域,还是一片待开发的处女地。后来被苹果收购的Siri也成立没有多久,而何国涛却动了创业的念头。 “我刚毕业时,根本还没有人会说自己是学人工智能相关的。因为那意味着失业。”何国涛说。“也有很多人质疑,总是说这个方向不对,那个技术不好。而我们就决定,自己出来,在这个领域做一些事情。” 何国涛和蒲瑶最终还是决定,在语音识别领域做下去。“创业,我认为一是要有技术壁垒,二就是要有能够赚钱的市场。我在惠普接触了客户需求,也懂得应用,我认为,语音识别仍然是最具前途的领域之一,而当时,其他人要进入这块领域,也并非容易。”为了解决核心算法,何国涛还“挖”来了自己的师弟——IBM Almaden研究中心的李全忠博士。后者一直从事数据库及云计算研究,还获得过IBM发明成就奖。 于是,普强信息最初的创始团队形成了。何国涛担任CEO,负责公司运营;李全忠博士任CTO,负责核心算法的研究;蒲瑶(普强信息VP)负责产品。2009年,普强信息在美国加州硅谷成立,直播,并获得了EDA之父黄炎松博士的100万美元A轮投资。第二年,普强信息设立了中国运营公司,在硅谷和中关村都设有技术研发中心。2013年,普强获得戈壁领投500万美元B轮投资,2016年获得四维图新领投的近亿人民币的C轮融资。 目前,普强研发团队占公司人员的80%左右,其中博士、硕士以上学历者超过30%。 挑战语音大数据分析 何国涛对公司的发展方向有长期的思考。“小公司做事要专注,现在普强一百多人只做垂直领域,包括车载和电话信道语音识别,而且要做到最好。其实这很简单,就集中优势力量做好一个小事情。” 普强在自身的语音识别和语义分析技术基础上,就锁定了两个方向:语音大数据和车载。 当前,由于智能设备的大量应用,大量数据,尤其是呼叫中心等领域,大部分数据都是语音和图像等非结构化数据。普强力图提供语音大数据分析能力,为企业解决非结构化数据分析的需求。 2010年,普强面向呼叫中心推出了“千语语音识别引擎系统”和“千语千寻语音分析系统”。 据介绍,普强已经为金融、电信、保险等多个行业,提供了准确度较高的电话信道的ASR(语音识别)引擎。针对呼叫中心座席与客户的对话,千语千寻系统的算法和模型接入后,能将不同地域口音的来电转换成文字,还能根据不同的系统用户需求,标注出关键用词。 (责任编辑:本港台直播) |