从1:1到1:N 难度指数级增加 深度学习 机动算法 0失误 0时差 刚刚跟我打招呼的那个人是谁?好眼熟的样子…… 这样的尴尬大概每个人都遇到过,也许王昱珩(《最强大脑》节目中图像、人脸等识别项目的优胜选手)很少遇到脸盲症的困扰——不过就算是王昱珩,也已经完败于百度人工智能的人脸识别能力。要知道,相比人类与生俱来的视觉能力,机器完全就是睁眼瞎,即使能够用镜头来看世界,相比有效图像数据量相当于5.76亿像素的人眼,机器镜头的视力实在可怜。更何况,人类的视觉认知,最牛X的地方在于大脑的图像处理能力,狭义上的视力,只能更有助于提升识别、处理能力而已。
但机器还是在识别能力上超越了人类。虽然人工智能还远远没有到拥有自主意识的终极阶段(到那时候我们讨论的重点是道德观、机器是否拥有“人权”,而非现在的AI技术了),但机器已经拥有了“看到你”和“认识你”的能力。 感谢2016年沸沸扬扬的人工智能热潮,基本向普通大众普及了人工智能的概念,老百姓基本上不再纠结于“人类是否会被AI统治”的杞人忧天,而是切实关注起已经无处不在的人工智能技术和应用。这其中,图像识别能力首当其冲,而识别人脸,则是图像识别的重中之重——人类是万物之灵,实际上,识别其他物体已经不是难事,例如爱奇艺等视频网站就基于图像识别技术开发出了广告产品——自动在视频中的物体上添加广告元素(例如桌子上加上一瓶广告商的饮料)。 2月21日,美国权威科技杂志《麻省理工科技评论》(MIT Technology Review)2017年全球十大突破性技术”中国大陆地区首发,在上榜的十大技术中,“Paying with Your Face 刷脸识别”榜上有名,这也是中国领先世界的人工智能技术,百度获此殊荣的同时也被重点提及,今年也是百度连续第二年上榜(去年是语音识别)。 识别人脸有多难?这可不是简单的答题比赛,从“认出这张脸”到“应用场景”,需要跨越至少三座大山:
从1:1到1:N,难度指数级增加
广泛场景中的人脸识别可不是银行服务里的1:1识别,1:N的难度是指数级增加。简单的说,以前的人脸识别应用,是将眼前的人和系统的里人匹配,仅作为确认身份使用;而1:N,是看到一张脸,就要从几万、几十万,甚至未来上亿的身份库中识别出来。这其中的关联算法、大数据模拟复杂程度可想而知。这一点,不光需要庞大的数据库(百度有200万人、2亿张照片的数据库),还需要精准算法的定位。
深度学习,机动算法
学习能力,是人工智能的核心之一,而在人脸识别上,学习能力就是机械表的发条、网游人物的装备。机器需要在不断的识别中,积累经验,调整算法。简单的说,百度的人脸识别,不是简单的一套逻辑和算法去匹配,而是根据不同的特点机动调整。例如,在人脸库中,所有人都是鹰钩鼻,那可能鼻子的特征就会被放弃识别。或者某种面目特征的重复率很高、为整体识别贡献的效率偏低,也就可能在算法中的加权被降低。 不要小看这种能力,狭义上说,这能提高识别效率和速度,广义上说,这是机器意识的一部分。
0失误、0时差
在电脑上给予充分的时间,实现很高的识别率,并不算很难。但要真正实现应用场景,实现商业化,真正应用到包括金融、支付在内的生活中,就必须做到0失误和0时差。 (责任编辑:本港台直播) |