除了语音识别之外,搜狗知音引擎还将语音合成、理解以及搜索的能力整合其中,在描述中,它被赋予了「让用户感到幸福」的愿景,力求摆脱机器的非人属性。 搜狗选择的是「自然交互加上知识计算,并服务于具体场景」的方向,这或许也解释了搜狗对于搜索引擎的坚持——腾讯和网易都早已放弃了啃不下来的搜索业务——搜索做的信息结构化的工作,是最为直接的知识储备,自建仓库的便利性自然也是显而易见的。 搜狗的CTO杨洪涛也演示过,用户使用自然语言——比如说出「把张修改为立早章」——就能在输入法里完成纠错,这就是在语音识别之上的语义理解的功夫。 王小川当年的室友、同为「清华系」出身的周枫,则在一次访谈中展示了网易有道在多语种翻译方面的语音技术,用户直接读出中文句子,软件便可即时翻译成其他语言,整个过程都不需要做出任何输入动作。 这条路径上的创业公司代表,则有图灵机器人的「弯道超车」,它试图直接跳过智能手机时代,而是抢先进入家庭机器人的硬件终端,和深圳的代工厂商打得火热,主攻儿童陪伴及早教的场景。 各有各的自信。 Siri或许是同类美国产品当中最为中国用户熟知的名字,但是准确来说,Siri只是提供索引功能的虚拟助手,它的交互性能在行业里并不被视为领先。 在苹果公司的官网,有着一封来自CEO蒂姆·库克的公开信,主旨是强调苹果对于消费者隐私的重视,以及承诺决不提取用户的电子邮件、浏览历史和云端信息进行分析和盈利。 在建立有「王婆卖瓜,自卖自夸」的免疫机制的人看来,这无疑是商业公司的宣传话术,实际情况肯定不会如此。但是就路透社的报道和美国学界的感受来看,苹果似乎是真的限制了自己提取数据——比如其地图产品保留用户信息的时长不能超过15分钟——用以改进语音服务质量的能力,连苹果内部都有声音,表示如果苹果继续奉行「极端隐私主义」,那么这家公司将在人工智能方面彻底失去和Google和Fcebook等同行比肩的机会。 当然,你也可以理解为,苹果是为了取悦消费者这项不无功利色彩的动机,而设立了这种道德「牌坊」,都是为了卖掉更多的手机。 相比之下,没有自设障碍的公司——以亚马逊为首——进展就大了许多。 亚马逊的Alexa语音服务已经能够接入新一代的家居用品乃至乘用车,自主生产的智能音箱Echo已经在美国销售了超过500万台,这种「黑科技」让亚马逊距离公众印象中的那个「图书线上零售商」的角色愈来愈远。 Linkedin的创始人雷德·霍夫曼认为,硅谷的长处在于,这里的所有公司,从出生开始就具有全球视野,这是和中国科技公司的最大不同。 所以也有人说,在语音技术的进化过程中,中文兼具优势和劣势两大特征,它既是一道防线,有利于以其为母语的技术人才站在更为靠前的起跑线上,又近似于一个枷锁,限制着中国公司向拉丁文体系世界进攻。 不过,如果将之比作新航路的开辟,那么任何定论都是过早的。 王小波是这么说的:「智慧本身就是好的,有一天我们都会死去,追求智慧的道路还会有人在走着。死掉以后的事我看不到。但在我活着的时候,想到这件事,心里就高兴。」 (责任编辑:本港台直播) |