这是极客公园「极客公开课 · Live」第五期的活动,来自 Face++智能商业产品线总经理宋晨和我们分享了人工智能在日常生活中可实现的应用场景,如何将技术产品化、商业化,人脸识别的概念是什么?基于先进的人脸识别核心算法,Face++在智能商业领域中如何实现 AI+。 什么是「极客公开课」? 1 位技术产品大牛和 10 位优秀技术产品人围绕技术产品相关话题,面对面深度分享和讨论,共同创造更优的知识与更高的学习效率。 而现在,这种深度的交流方式属于每一个人,知乎 Live 同步线上实时问答,随时随地参与提问互动,与数百人共创一本知乎 live 版的「课堂笔记」 每周 1 次,全年 50 场,极客公开课,推动产品人的自我迭代 以下为本期课堂笔记精华摘要: 人工智能的闭环
人工智能这件事情谈得现在也很多,什么是人工智能每个人的理解不太一样,在我们看来所谓人工智能的定义,我们会把它定义为一种闭环,这里面的闭环是通过数据、技术、产品到最终的使用,使用完以后的反馈,这样形成一个整体的闭环,我们拿谷歌这个公司或是百度来举例子。 谷歌大家都知道,是搜索引擎嘛,那搜索引擎通过这个技术,首先创造了搜索框,也就是现在的产品,所有的用户都在使用,使用完以后你所有的搜索习惯、关键词和搜索的记录其实都会被记录下来,包括你的历史的习惯,这个时候反馈到后台以后会做分析,分析完以后再改进产品,所以你会发现在使用搜索框的时候,后面再去用的时候,搜索的内容和提示的内容会有些许的不太一样 在深度学习这部分,其实也使一样的,也是通过整个的神经网络和世界的深度学习的技术创造出不同的产品,这个产品会分不同的行业、不同的场景,紧接着就是用户去使用,使用完以后产生了数据,数据的回流会带动深度学习的引擎,比如说我们所谓的识别成功率,大家都关心的问题,刚开始可能是七八十分的水平,看慢慢的变成 80 分、90 分、100 分这么一步一步往上,所以是一个深度学习引擎闭环的过程。那么我们谈到在整个的公司分布上来讲,其实也能看到,在人工智能领域当中会分不同的类别,包括有机器学习的通用类别、应用和机器人的语音的助手,旷视会在机器视觉里面的通用的部分。 所以人工智能为什么 2015 年爆发,其实会受到很多的硬件和算法瓶颈的突破,像图象处理和深度学习,是基于 GPU 的训练来产生的,所以 2015 年之后图象处理的这些板卡过程是什么大家购买的很多,这也是为什么这个财报很好看的原因之一。 机器视觉
机器视觉我们会把它定义成给机器赋能,让它具备一双眼睛的能力,让它像人一样思考、去想、去看,它能够有这些功能以后,做的事情就会比较多了,包括有各种的检测、判断、识别、测量,其实就会做很多的事情。在我们研究的 机器视觉的方向上我们可以看到,从人脸开始到人,到文字、到车,最后到所有的感知器件,这是线下所有能够被机器识别的,这里面也是让大家知道,从不同的识别类型里面,其实是可以做分类的,包括图片分类、视频分类,是通过不同的分值来判断的。 什么是人脸识别
人脸这部分有两个非常核心的维度。 第一,1:1 定义是一个判断的作用,应用的场景其实是在金融和人证,特点是更加的精准和安全,所以现在大家不管是支付宝还是银行的人证比对、实名的业务,基本上都会用到 1 比 1 人脸的识别。 第二,1:N 更多的是在一个数据库当中或者是一个底库当中,能够找到这个人是不是在底库当中的人,所以是个识别的过程,是一个动态的,还是一个非配合的场景,比如说在安防当中我去缉拿逃犯,我去抓到逃犯总不能让逃犯看到摄象头。在商业场景当中也不可能让我们的 VIP 客户、员工、会员对着摄象头做着一遍操作,所以是动态和非配合的场景。 这里面 1:1 有个过程,通过身份证能够读取图片的介质,再加上现场的抓拍的照片,有两个源来做个比对,最后做个结果告诉你他是不是本人,更高级一点是通过一个公安部的数据库,做一个交叉比对,来证明我读的这张身份证里面的信息是不是真伪的。像这种比对,现在我们做到的是互联网金融,你们的贷款、消费做到实名验证,基本上互金的业务我们 80% 以上的市场都在用到 Face++提供的技术支持。 1:N 的部分也会分为三个阶段,大家最了解的可能是后面的人脸识别,前面的两个阶段还是很重要的。 1. 我要在一个动态的视频流当中找到人脸的位置。 (责任编辑:本港台直播) |