2014 年,小源科技推出信析宝第二款产品,与多趣的 App 形态不同,这是一款 SDK 产品,能嵌入任何获取手机短信的应用,提供场景式服务。而这正是小源科技今日业务模式的来源。在与 360 手机通讯录等大型 App 取得合作后,2014 年底,小源科技开始与手机厂商广泛合作。 100% 准确率的来源:提高算法 + 人工标注 然而,在三四年前,人工智能并不像今日这般火热,自然语言处理技术也不先进,在今日,语音识别、人脸识别取得了巨大进步,但因为自然语言的复杂,自然语言处理依然没有太大突破。 而在那时,基于语义分析最普遍的商业应用是帮助企业分析舆情,但语义很难判断,通常的做法是通过标注正面词汇与负面词汇进行分析,因而错误率很高。 信析宝在商业短信的基础上,提供场景服务,难以想象,如果给予用户错误的信息,对用户体验将会造成什么困扰,对企业客户又将造成什么影响。 「既然计算机无法识别大段文字中蕴含的信息,如果是一段话,或者十来个,数十个模板化文字呢?」段雨洛认为,语义分析的难度就会降低。因此,小源科技先写出语言的文本结构,比如搭建好主谓宾,再通过语言结构,把很多样本归为一类,处理这类样本即可。而规模的复杂度则会少 3-4 个数量级。 但是,段雨洛认为,再好的算法也只能提升 80%-90% 的准确率,小源科技要达到 99% 甚至 100% 的准确率,不能有任何误报。 既然不能有误报,那就将语义分析的算法放在服务器而非手机,进行样本的训练,并人工决策,从中选择正确的语言识别结果,将该语言模式生成 pattern,放进手机,手机不做语义分析,只是简单的模式匹配。 准确率 100%,代价却是巨大的人工标注量,因为每一个样本,都需要人工决策。如今,小源科技有三四十人的团队专做人工标注。 「人工标注是个脏活、累活,没有人愿意做脏活累活吧?那我们就去做。」段雨洛很自豪,在多年前,就敢于去做人工标注。「我们的核心竞争力不是技术,而是勤奋。」段雨洛一半玩笑,一半认真地说。 给客户提供的是产品和解决方案,而非技术 尽管小源科技是一家技术公司,但段雨洛认为给客户提供的是产品和解决方案,技术要蕴含在解决方案中。「人工智能不是业务,帮助客户解决问题,才是公司赖以生存的根本。」段雨洛说。 正因如此,小源科技在每家客户都派驻了团队,与客户共同进行产品的研发。而与企业的合作,段雨洛认为,一定要摆正心态,出了 Bug,要真诚地想着如何解决。因为,厂商花费巨资研制手机,一部手机才卖数千元,OS 中嵌入新应用,他们会非常谨慎。 小源科技的首家手机客户是三星,此前,谷歌凭借 Google Now 占据了海外的大额市场,在中国却无法开展业务,三星总部希望在中国填上这个坑,三星中国借此取得了产品开发权。从与三星建立合作,到如今,小源科技对三星科技的合作已经非常深入,新产品的规划,直接上报韩国,批准之后,快速执行。 与三星的合作很顺利,与华为的合作则让段雨洛近乎「崩溃」。将短信做成卡夹样式,首先要进行文本识别,其次要将文字做成界面,计算量很大。 但是,对供应商要求严格的华为对小源科技同样提出了严苛的要求:添加这个功能后,手机的 CPU 指标和内存占用都不能上升,滚动还要非常流畅。比如,企业发送了 1000 条短信,做成 1000 个卡夹之后,用高速相机拍,每秒钟要有 60 帧,1 桢都不能差。 当时的段雨洛认为,要达到这样的标准,简直是天方夜谭。但最终在华为的帮助下,解决一个关键性问题之后,三个指标都已达成。 有了三星和华为的客户经验,小源科技打开市场容易了很多。 段雨洛将厂商比喻成大船,「实际上他是拿一艘大船换你这一辆小汽车。」因为供应商做得再好,对手机厂商而言,也是锦上添花,厂商的核心还是自己这艘大船。「创业者不能认为自己很了不起,而是要有多方共赢的格局,」段雨洛说,「如果你做的事情,能使产业上下游都能获益,那你就能做成。」 本文为机器之心原创,转载请联系本公众号获得授权。 ✄------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |