本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【图】赛后专访:如何在 ImageNet 比赛中获得冠军?

时间:2016-09-28 13:21来源:668论坛 作者:118开奖 点击:
【图】赛后专访:如何在 ImageNet 比赛中获得冠军?,里约奥运会女排比赛,歌唱比赛评分表,王洪祥唯一被ko的那场比赛

  近两个月,国内团队先后在全球权威的人脸检测评测平台 FDDB 和全球自动驾驶算法公开排行榜 KITTI 以及 Cityscapes 上取得非常好的成绩,atv直播,这在一定程度上证明了国内计算机视觉相关算法已达到国际顶尖水平。

  今年 ILSVRC 2016(全称是ImageNet Large Scale Visual Recognition Challenge)分为五大部分,包括:目标检测、目标定位、视频中目标物体检测、场景分类、场景分析。在昨天,全球最为权威的计算机视觉大赛 ILSVRC2016(大规模图像识别竞赛)公布了算法排名结果,HikVision(海康威视)夺得场景分类第一名。

  那么,今年的ImageNet的比赛为什么由这5部分组成?HikVision(海康威视)是如何在场景识别一项中夺得冠军的?今天雷锋网(搜索“雷锋网”公众号关注)请到了海康威视首席科学家、海康威视研究院常务副院长蒲世亮先生为我们讲解ILSVRC2016相关的详细细节。

  

【图】赛后专访:如何在 ImageNet 比赛中获得冠军?

  浦世亮,法国国家科学研究院(CNRS)博士、浙江大学博士,现任海康威视首席科学家、研究院常务副院长、海康威视博士后科研工作站负责人、博士后导师、公安部重点实验室技术负责人,全面负责推进海康威视在视频监控领域的前瞻性、战略性基础技术研究,致力于为公司中长期战略规划提供核心技术保障。其曾获第十九届求是杰出青年、浙江省有突出贡献中青年专家、浙江省科学技术进步一等、公安部科学技术二等奖、杭州市131中青年人才等多项荣誉。

  浦世亮作为负责人及主要研究人员完成国家核高基重大专项、国家科技支撑计划、国家物联网应用示范项目、国家高端软件及应用系统产业项目、浙江省重大科技专项等多个国家、省部级科研项目。作为主要发明人,已申请发明专利90多件,获得授权发明专利11件,并在《中国公共安全》期刊、国际知名会议ICDAR、ICPR等发表发表多篇论文。

  ▎今年 ILSVRC 比赛为什么是这5部分,跟往年有何变化?

  今年 ILSVRC分为

  任务目标检测(object detection)

  目标分类与定位(object localization)

  视频中的目标检测和跟踪(object detection / tracking from video)

  场景分类(scene classification)

  场景分割(scene parsing)

  与去年相比今年增加了一项场景分割任务。这五类任务都是计算机视觉领域基础的人工智能任务,有广阔的工业应用前景。与去年相比,今年增加了一项场景分割任务。

  ▎简单介绍一下 ILSVRC 2016五大部分的参赛规则?

  鉴于这个参赛规则相对复杂,请参考ImageNet官网权威说明。,这是访问地址。

  大致来说,五项任务提供了基础的训练集和测试集,各参赛队伍在训练集上训练,在测试集上完成测试,提交测试结果,然后,由组委会统一评估性能,并给出排名。

  ▎请仔细回顾一下,你们在场景识别比赛中最终获得表现最佳经历了什么?

  先说一下,场景识别比赛的主要的难点是训练数据的极度不均衡,而且数据标签具有二义性。在训练过程中,我们做了以下工作。

  借助于我们组建的M40 GPU大规模训练集群,我们在过去两个月内训练了20多种不同结构的模型,包括常见的VGG,Inception,ResNet及其变化形式。

  同时通过实验我们发现,在非常深的ResNet(101/152/200层)上对场景数据进行精调,无论是训练还是预测,都非常耗费时间,而且性能上还略差于更快的Inception结构的模型。基于这个观察,在模型结构上,我们主要采用了比较深的Inception模型和相对较浅的ResNet。

  此外,我们还在训练和预测环节进行了多项改进,比如说,我们提出了一种的数据增强方法,可以更好的利用图像中的目标物信息。

  我们还采用了标签洗牌(label shuffling)和标签平滑(label smoothing)技术,以更好地应对数据不均衡问题。

  最后,我们的模型在28支队伍的92次结果提交中,脱颖而出,获得了第一名,top5 的分类准确率达到了91%。

  ▎你们如何取得这个比赛冠军的。表现出色的核心是什么?

  海康威视研究院所在的海康威视,本身就是以视频为核心的物联网解决方案和数据运营服务提供商。连续五年蝉联IHS全球视频监控企业第一位。

  我们在计算机视觉领域已经投入了十几年时间,深度学习技术的研究也开展了相当长时间了。在长时间的研究工作中,我们打造了一支经验丰富的人工智能算法团队,现在有接近200人,开奖,对于计算机视觉领域的基础技术有比较深刻的理解。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容