◆ 年过四十的张胜 文| 铅笔道 记者 连然 ?导语 四十不惑,张胜已不再轻易喜怒行于色。 创业两年后,团队研发的人工大脑逐渐实现无屏化交互等能力,但他明白这只是阶段性的成果,前路仍旧漫漫。 灵聚科技是一家做商用级人工智能核心技术的研发商和解决方案提供商,通过语音、视觉识别,产品可为机器人等智能硬件提供自然语言交互、无屏化交互能力,就像给冰冷的硬件装上了“大脑”。 去年,灵聚科技营收约100万元,与约30余家企业达成合作。 注: 全文未经创始人审阅,由铅笔道记者根据采访录音独立撰写,内容仅供参考。 不做游戏做AI “你怎么没创办游戏公司,跑去做人工智能了?”不少人都这么问过张胜。他笑而不语,在游戏行业协会呆了多年,他知道其中深浅几何。 “创办一家游戏公司的风险实在太大,不光要拼创意,更多是看运气,看能不能正好抓住时代的浪潮。” 2012年,张胜在频繁的广州出差中与后来的CTO熟悉起来,一次闲聊,两人不约而同谈及Siri中文版的上线以及其在国内带动的一波智能助理浪潮。 当时Siri支持的服务尚有限,且只能启动App,并不支持后续操作,使用体验有明显的不连贯性。两人分析,手机端的人工智能应用并不属于强需求,并且此模式存在一定问题。 而随着启动Siri从原来的要先点亮手机屏幕再打开变为后来的长按home键即可,张胜进一步想到了无屏化交互(即不依靠屏幕完成人机交互)。 根据人工智能发展的周期性、摩尔定律等做分析,张胜判断大约三年后,随着通讯与计算能力的大幅提升成本降低,智能机器人会有一波爆发,这要求交互中的搜索结果表达精炼。 加上考虑到创业公司若要做硬件将无可避免地遇到诸多不可控的“大坑”,张胜决定从软件入手,开发面向机器人的人工智能交互引擎,j2直播,即“灵聚人工大脑”。 三次迭代 在开发过程中,尝试过正则表达式后(正则表达式是对字符串操作的一种逻辑公式),团队考虑到此种方式有着对人力的海量需求,便自行结合语义分析、知识图谱开发了新的问答系统——通过前置大量的预处理工作,借助算法,将云应答时间从500毫秒缩短至20毫秒。 “灵聚人工大脑”的数据处理来源之一为基础知识所形成的知识图谱。其中,基础知识分为静态与动态。对于地理位置等静态信息,团队结合认知计算算法群自行构建知识图谱。天气、股票等动态信息主要来自于相关机构或互联网,团队主要通过大量的获取、清洗与精细化处理来构建知识图谱。 灵聚人工大脑的核心之一在于对无屏化交互的支持,而其关键在于通过认知计算,以听读的方式,提供精准练达的答案给用户。当用户提出“最近几天的天气怎么样”,系统会在分析最近几天的天气情况后给出总结性的趋势分析,而不是将每天的天气状况陈述一遍。 2015年年初,“灵聚人工大脑”2.0版本上线,相比此前仅可实现部分交互功能的1.0内测版,整体架构升级,可提供一定的商用服务;也基本实现无屏化交互、多轮交互。 随后为了更好地实现系统与人之间交互,团队在2.0版本的基础上,重新构建知识图谱,不断迭代:3.0版本实现了数据从完全结构化到半结构化的转变,答案的生成可由系统自行计算处理,而非之前的人工提前编写。 4.0版本则进一步升级了整体架构,将语义分析与知识图谱、认知计算算法群结合,并添加神经网络技术,实现对用户意图更精准的命中与回答。 落地方案 拓宽合作 在用户反馈的基础上,团队还加速了闲聊系统的开发。灵聚人工大脑既有精准系统用于解答相关的知识性问题,也有一套模糊系统用于陪用户闲聊,以及用于新数据的获取与算法模型的调整。 灵聚人工大脑技术主要面向B端用户。在使用上,终端用户需要借助产品来使用,开发者则通过接口来使用——灵聚输出的是完备的认知计算结果,开发者不需再做开发,只需要考虑以何种形式将结果呈现出来即可。 (责任编辑:本港台直播) |