本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【组图】演讲 | BOT大赛计算机视觉赛题经验分享:赛题详解与思路分析(9)

时间:2017-01-20 16:11来源:本港台直播 作者:j2开奖直播 点击:
YOLO 的出发点是什么呢?在刚才这个检测流程当中,我通过这里得到一个 Feature Map 之后,先要在这个 Feature Map 上面得到一些候选区域,又要针对这些候选

YOLO 的出发点是什么呢?在刚才这个检测流程当中,我通过这里得到一个 Feature Map 之后,先要在这个 Feature Map 上面得到一些候选区域,又要针对这些候选区域,再从这个 Feature Map 上面提一遍特征。这里会造成对每一个候选区域要做两次预算,这里等于是不需要的。下面的方式就是直接从图片得到最后分类检测的框。YOLO 就是把一张图分为很多的区域,对于一张图有一个狗,怎么对应呢?我的中心框如果对着这里,这里就负责解决这个问题,这里得到最后的结果。这个自行车对应到这个点,轿车对应到这个点,最后直接通过这个网络得到一个输出。这里要注意的是,这个输出可以看到是 7×7×30 的矩阵。首先要判断是什么物体,在这个检测当中是 20 倍,在这里有 20 维去表示是什么物体。还有 8 维,要对这个框的位置进行修正,这 8 维是负责对这个框的区域进行修正。

下面是它的整个网络的设计图,这里一共有 24 层的卷积,这里直接通过图片,448×448,最后得到 7×7×30。通过这 30 维,就直接可以算出一个 49 个格子当中,每个格子可能包含什么物体,在什么位置。这样的话,我一次运算就得到了最后的检测结果。这里训练还有一些细节,就比如说这个网络的初始化,会先把一些卷积层在更大的范围内预训练一下,采用 RCNN 的方法,最后再拿到检测训练。这个后面还做一些改进,大家有兴趣的话也可以关注一下。(附该结构的 Github 代码地址: https://github.com/xingwangsfu/caffe-yolo)

报码:【j2开奖】演讲 | BOT大赛计算机视觉赛题经验分享:赛题详解与思路分析

报码:【j2开奖】演讲 | BOT大赛计算机视觉赛题经验分享:赛题详解与思路分析

SSD

下面是 SSD 的结构,SSD 是这个比赛当中用的很多的一种方法。它解决的是什么问题呢?刚才 YOLO 看上去是非常暴力的,一个图片直接分为 49 个格子。这样的话,如果是这种小的物体的话,可能检测效果会更好。SSD 做了这个改进,比如说看这个网络当中,这里前面是一个 16 层的,到这里如果是 300×300 的话会输出一个 38×38×512,针对这 38× 38 我们会在每一个点上预设一些默认的框,这个地方和前面 FasterRCNN 的 Anchors 有点像,YOLO 只在这个地方输入了一个。SSD 是在网络当中不同的层都有输出。这样的话,其实也相当于一些特征的磨合。当然这个 SSD 在实际的训练当中还有非常多的训练的策略,比如说一个图片是 300×300,之前要做一些图像的增强,可以剪切一些区域去做训练,如果大家对这个感兴趣的话可以看一下这个论文。这里是 SSD 的一个检测效果。我们刚才把这个网络定位一致的话,都用 VGG16 的话 FPS 是 7。这个 SSD 做检测的时候有一个地方,这里是一个 Match 的检测,每次可以处理 8 张图片同时做检测,如果大家去测这个速度的话可能会有损失。(附该结构的 Github 代码地址: https://github.com/zhreshold/mxnet-ssd)

报码:【j2开奖】演讲 | BOT大赛计算机视觉赛题经验分享:赛题详解与思路分析

3. 所述框架总结

Deep Learning 的运用 CNN 的方法去提取物体的特征,比传统手动设置的特征更好,这样带来检测的准确度更高。我们引入了回归的方法,对于检测的位置做一些修正,这样的话检测的位置是更准的。刚才我介绍的这几个框架都是端对端的,这样的话,可以让我的检测速度非常快,而且可以用到 GPU 加度。

Ⅴ 现场精彩问答

1. 视频检测相关的内容问答

提问:您刚才提到了很多解决方案,我想问的是解决的过程是什么样子?以及在这个过程当中,比如申请数据集的时候,有训练数据集、开发数据集和测试数据集,在选择数据集的时候需要注意到什么?还有就是在选取框架的时候需要注意什么?以及在迭代的过程当中需要注意什么?

王金桥:我觉得整个的基于图像视频的模式,也是一个科学和工程深度结合的一个事情。它的数据就是你必须要对这个方法理解得非常深刻,你才能够针对这个方法去选取适合方法的数据,就是你的方法是解决哪个问题的,你根据这个问题去发现什么样的数据更适合它,你当前的这个方法对那些数据不适合。另外就是数据的清洗非常重要,你在准备数据的时候,这个需要大量经验的积累,因为它也是一个实验性的科学,就是说你在数据标注的时候,这个框是不是要标得特别紧凑,比如说你这个目标遮挡三分之一还是露出来一点,这个都是需要经验积累的。所以说包括这次 BOT 比赛他们数据标注里不是特别有经验,我们都会对数据进行一个清洗。数据清洗对最后算法性能的影响大概在 10% 到 20%。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容