如何让机器辨别出人的喜怒哀乐?传统的方法是将人的表情分解成不同的部分,基于不同部位的表现计算出一个可能的表情,竹间智能则是利用深度学习的方法进行识别。 对人脸识别进行情绪情感的辨识和决策依赖于9种情绪和22种属性,直播,9种情绪是开心(Happy)、生气(Angry)、哀伤(Sad)、惊讶(Surprise)、害怕(Fear)、反感(Disgust)、轻视(Cotempt)、困惑(Confused)、中性(Neutral);22种属性包括性别、是否佩戴戴眼镜、头发长度、胡子样式、肤色、发色、年龄以及皮肤质量等。基于对人脸情绪的识别,结合对人脸属性的辨识,算法给出情绪识别的判断。语音的情绪识别则是基于音频、声波,结合深度学习的方法进行。 同时对语音、图像及文字的情绪情感识别进行攻坚,对于一家人数在150人左右的创业公司而言,并不是一个容易达成的目标。但简仁贤认为这是必须要做的事情。 选择这条路径,是基于简仁贤对人机交互未来发展趋势的判断。 “为什么竹间要做的是人脸情绪情感,再加上语义的部分合起来做。我个人坚信,在未来的2到3年,在人机交互里面会成功的公司,一定是具有三个人机交互的能力的,就是视觉,语音的情绪,还有语言。三个要同时具备。如果只是一个集成商,要把这三个技术集成是做不到的。即使做到,也是很碎片的。” 设想是好的,但现实瞬息万变。 两年前简仁贤创业时,人工智能还没有今天这么热,现在,人机交互是当前人工智能热潮中的热门方向,巨头如BAT均已有所布局,赛道上的创业公司也为数不少。 竹间智能面临的已经是一个竞争激烈的市场。 蚂蚁与大象 竹间智能北京办公室位于五道口的一个写字楼内,距离简仁贤上份工作的地点不到三公里。而人工智能也是一个巨头与创业公司近距离搏杀的领域,在技术、人才等各方面,创业公司的资源均不占优,巨头们均重金投入人工智能的背景下,如何以小博大,是摆在竹间智能面前的问题。 从巨头出来的简仁贤对此倒有些不以为意,因为在他看来,大公司AI技术规模化会非常非常慢。 “我自己是在大公司出来的,我在大公司干了二十年,就是他们规模化慢。小公司是很容易规模化,因为我们很专精,我们马上就规模化,标准化。大公司要做标准化,小公司如果说花一年,大公司要花三到五年才有办法标准化。” 人工智能是一个需要长期投入研究,并极依赖数据量的行业,在资金储备上,竹间智能已经完成B轮融资,而在数据量上,简仁贤认为,“大公司有数据是个迷思”,因为“在解决AI问题的时候,(关键在)有没有适当的、合适的、高质量的、能学习的数据。这个数据如果不是能学习的,你再多也没用。” 为了做图像情感情绪识别,竹间智能通过购买、收集等方式积累了百万级的图像数据量,并通过外包团队对其进行了精细的标记。而在应用层,通过与垂直行业客户合作,其可以获得特定领域的精准数据。因此,简仁贤认为,身为创业公司的竹间智能在数据上并没有劣势。 竹间智能目前着力的落地场景是金融、电商及IoT,《Her》激励着研究人机交互的工程师和研究员,激励着简仁贤。不过现在,竹间智能真正同时落地三种识别技术的场景不多,技术的进步空间很大,尤其在语义理解上,竹间智能接下来会投入更多人力。 面对可以预见的激烈竞争,简仁贤颇有自信,在他看来,人工智能的热潮里,创业公司的机会很大。 因为“大公司不可能为其它的公司需要AI场景的做定制化服务,在AI的领域里,只有靠小公司才有办法在特定领域里做出来一些场景。” 来源/腾讯科技 编辑/钱馨瑶 ·END· 版权声明: (责任编辑:本港台直播) |