继“围棋”人机大战——以李世石为代表的人类,输给了?Alpha Go 代表的计算机后,人类又发起了“人脸识别”之人机大战。这一次是诞生于杭州的人脸识别机器人蚂可,对战“鬼才之眼”王昱珩。 15 年“最强大脑”中,在同质同量同源的 520 杯水中,王昱珩成功指出评审选中的那杯,并精准说出水杯旋转了 15 度,中间经人手,从此,“水哥”一战成名。 (腾讯视频) 这次,对上“万变不离其宗”的网红脸,人类可以一雪前耻么? 结果揭露前,先了解计算机“看人”的套路。人眼和计算机,都喜欢瞄“点”。只不过,人眼在辨别物体时,往往通过不同点来判断。而计算机则相反,它找的是相同点。 开奖,人类能否一雪前耻?" src="http://www.wzatv.cc/atv/uploads/allimg/160906/030502c44_0.jpg" /> 通过摄像头“观察”目标,计算机将拍摄到的物体,以图片形式传给计算机,这就是图像识别过程。淘宝的图片搜索、百度的图片识别功能,都属于这类应用。 在识别中时,计算机会找一些“与众不同”的点,来和“脑海”中的图片进行匹配。这些“鹤立鸡群”的点,通常被称为“角点”或“关键点”。这些点在图像中具有一定特征,j2直播,如局部最大或最小灰度(即图像亮度)、某些梯度特征(描述图像灰度变化情况的量)。 比如人脸上的一颗痣,在计算机识别时就会被当成参考点。那么计算机是如何找到这些“角点”的? 角点图计算机在查找某个像素点时,是遵行逐个查询的规则。为了判断一个点是否为“角点”,会选取一个大小合适的窗口(比如 3*3 的窗口),让窗口中心遍历(即依次访问)整个图像像素,同时,判定中心点与它的周围点是否有明显不同。 因此,当窗口在平滑区域(图 a),窗口在各方向上移动时,图中三个窗口内部的图像无变化。当窗口在沿边缘方向上移动时(如图 b),三个窗口内图像也是不变的。当窗口在“角点”处时(如图 c),窗口无论朝哪个方向移动,三个窗口内部图像均不一样,因此判断该点为“角点”。 不同的“角点”检测算法使用的窗口不一样,采用圆形窗口检测“角点”的 FAST,和采用 16*16 采样窗口的 SIFT 算子中,是图像特征点检测的两大算法。 “配对”又是怎么一回事?找到特征点,对它们进行描述后,才能开始图像匹配。描述的大前提是,我们需要利用特征点周围像素的梯度方向分布特性,为每个关键点指定方向。 比如在 SIFT 算子中,将采样点与特征点的相对方向,通过高斯加权后得到一个 4*4*8 的 128 维特征描述子。 (一系列加工后,就成了上图这个“鬼样子”) 有了特征点描述子,就可以和模板图的特征点描述子进行比较,得分最高的就是最佳匹配点。然后对所有特征点进行遍历。 计算机的“人脸识别”就是基于以上理论。同时,它还会进行一些纵向比较,比如通过图片上五官的分布距离,来进行比较。 所以,结果是? 第一局,从 150 张网红照片中找出 3 人,蚂可胜 第二局,从 300 张网红照片中找出 3 人,“水哥”胜 第三局,从 80 张网红童年照中找出 2 人,“水哥”胜 (腾讯视频) 三局两胜,“水哥”代表的咱人类胜利了~ 蚂可能胜一局,说明计算机在图像识别的未来可期,但最终失败,也说明还存在一些问题。 胜败分析 这次比赛挑选的识别对象——网红脸,看上去都是从一个模子里刻出来的,无疑增加了比赛的难度。 面对这些千篇一律的网红脸,蚂可在识别近照时尚可,但到了童年照就有点吃力。 (责任编辑:本港台直播) |