近日,被业界誉为人脸识别年度“世界杯”的微软百万名人识别竞赛落下帷幕。百万名人识别子命题无限制类,Panasonic-新加坡国立大学合作夺得第一,CIGIT和中科院合作队伍与美国东北大学位列第二第三;成立不到一年的中国人工智能创业公司猎户星空,获得百万名人识别子命题有限制类(只使用竞赛提供数据)第一名。 2016 年 6 月,微软向公众发布了大规模现实世界面部图像数据集 MS-Celeb-1M,含有 10 万个名人的约 1000 万(10M)张脸部图片,鼓励研究人员开发先进的人脸识别技术。 同时宣布的还有 MS-Celeb-1M 百万人脸识别挑战赛。参赛者需要根据(但不限于)挑战赛提供的数据集作为训练数据,开发图像识别系统,从脸部图像中识别 100 万个名人。 据微软技术与研究院(Microsoft Technology and Research)首席研究员/研究经理张磊博士介绍,首先,MS-Celeb-1M 的目标是识别百万人脸,是计算机视觉内最大规模的分类问题,并且其中一个人物对应一个 entity,绑定了知识库,并且知识库中提供了每个人的职业,性别等等丰富的信息,从而解决了人物重名的问题,可以从识别达到认知。“最开始我们是面向学术界做的这个数据集,”张磊说,“但后来很多工业界的同行也表示我们的数据集对他们的研究工作很有帮助。” 据悉,本次竞赛由微软研究院主办,借助计算机视觉领域顶级会议 ICCV 2017 的平台,atv,既包括大规模人脸识别竞赛(Hard Set 及 Random Set),也推出全新的、更具挑战性的小样本学习(Low-Shot Learning)竞赛。这场堪称级别最高、难度最大的技术赛事,也吸引了全球人脸识别的顶尖团队参与。 而在近日公布的结果中,百万名人识别子命题无限制类,Panasonic-新加坡国立大学合作夺得第一,CIGIT和中科院合作队伍获得第二名,美国东北大学位列第三;有限制类(只使用竞赛提供数据)第一名是北京猎户星空科技有限公司。而识别单一训练样本的名人子命题无限制类(可以自由使用外部数据),第一名是NUS-Panasonic,有限制类(只使用竞赛提供数据)第一名由美国东北大学夺得。 百万名人识别夺冠有多难? 在一众科研机构中,猎户星空作为初创公司,显得尤为引人注目。而在赛后,猎户星空也向黑智对竞赛项目和公司采用的技术进行了介绍。 据悉,和可以无限制地使用外部数据不同,有限制类别只能在限定的数据集内调用,比拼的是团队的算法能力。而在本届竞赛中,只有猎户星空一个团队,采用hard级受限级(hard级)。 据了解,无限制类不是单纯算法的比拼,在某种程度上是在比拼数据,数据越多训练的模型越好,所以无限制类是算法和数据的综合比拼;有限制类则是单纯算法的比拼,也是从算法层面难度更大的比拼,“因为这个东西只能靠算法,因为数据是一定的。当没有外部数据的情况下达到最高精度是非常困难的。”因此,组委会也认为猎户星空的难度极高,单独列了一项采用受限数据集的子项目。 最终,猎户星空团队获得 0.75/0.606(random set/hard set)的高分,被组委会判定为接近满分,atv,远超去年的记录。 在此之前,猎户星空还在另一项人脸识别国际赛事 LFW 上,仅用单个 Resnet50 模型就达到了 99.65 的优异成绩,用比较小的网络实现了极高的精度。 猎户星空成立于2016年9月。而业界对其熟知,来自于今年6月,喜马拉雅发布的小雅 AI 音箱,其背后的核心便是猎户星空全链路自研的远场语音交互系统。
小雅AI音箱 而据猎豹星空表示,其人脸识别技术已经应用到猎豹移动旗下的直播产品 Live.me 中,对直播内容进行监测筛查。这次人脸识别的比赛技术,也将在门禁、机器人等领域逐步得到应用。 (责任编辑:本港台直播) |