本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【组图】演讲 | BOT大赛计算机视觉赛题经验分享:赛题详解与思路分析(11)

时间:2017-01-20 16:11来源:本港台直播 作者:j2开奖直播 点击:
还有另外一点,SSD 的输入是 300300,其实这个图片的大小和处理速度也是有很大的影响。比如说如果你要检测一个很大的物体的话,我们觉得在计算的时候

还有另外一点,SSD 的输入是 300×300,其实这个图片的大小和处理速度也是有很大的影响。比如说如果你要检测一个很大的物体的话,我们觉得在计算的时候并不需要像 FasterRCNN 那样有成就感。如果你去看卷积的运算过程的话,这个图片大小是和运算量有一个关系的。就是你实际做检测的话,可以尽量的去压缩输入的大小,得到速度的提升,另外一方面就是这种网络结构。最近谷歌有专门讲检测的速度和精度的平衡。

提问:如果只考虑精度的话,是不是 FasterRCNN 比 SSD 要好一些?

陈朝才:我觉得这个问题和场景有关系。因为 SSD 很多训练的策略是非常有效的,因为 FasterRCNN 已经出得非常久了,这个检测效果我觉得可以针对实际场景去看一下这几个框架在做训练的时候采用了一些数据增强的方法,包括一些训练之类的,我觉得这个对于检测效果影响也非常大。像 SSD 最开始其实效果并没有这么好,并没有这么高。但是它通过一些策略,让它训练的精度达到了这个效果。

提问:刚才看到 FasterRCNN 有两个改进,其中一个改进是 Feature Map 的改进,有没有一种方法是这两个改进的融合?

陈朝才:也可以,这个论文里面针对的,你去做论文的话是针对一个主要的点。我觉得你个人做实验的话,你可以去尝试把这两种方法结合,这个也很方便,因为这两种方法并没有冲突。

提问:有人做过这两种方法的融合吗?

陈朝才:目前没有。但是我个人认为,这两种方法,RFCN 侧重的是用残差网络,后者是得到了检索的,服务的提升也是很大的。

提问:选择这些的依据是什么?是计算量吗?

陈朝才:这是很基础的,残差网络分类的效果是非常好的,我觉得你在世及应用当中,可能并不会用到残差网络这种特别强大的网络,这种网络还是非常复杂的。在这个论文当中是为了做标准的对比,所以采用的是相同的网络做对比。

提问:你的意见主要还是从计算量来考虑选择分类器是吗?

陈朝才:我觉得如果你追求精度的话,像 SSD 里面做了非常多的数据增强,包括一些针对这种特别小的物体的优化,这都是非常细的,我这里没有涉及到。

提问:这次竞赛当中好多人都选择 SSD 是为什么?

陈朝才:因为 SSD 的话,我个人认为其实是 RFCN,因为 SSD 的效果我觉得可能在训练的过程当中根据输入的图片做了一些采样。给出的分辨率都是非常大的,3000×200,他是随机采一些小块做的。我在训练 RFCN 的时候并没有采用这种方法。

提问:是不是 SSD 相对来说是做好训练的?其他的这些网络训练难度有什么区别?

陈朝才:这个我觉得区别并不大,是两种不同的思想。如果应用在你的场景当中可以都去看一下,测试一下。

提问:还有一个问题就是,如果我想检测,比如针对一个现有的,增加一个新的内部检测,从原理上直接是重新训练分类器再训练网络?还是说整个都是你自己写的?

陈朝才:像一般的标准数据,如果你自己想加一个的话,我觉得可以这样做,先在上面训练一个 20 倍的检测器,针对你的图片,先把 FasterRCNN 的检测结果标在你的数据上面,我就把这个检测出来的框当做我的标准方式去训练,这样相当于做一个检测的迁移。然后你再用这种标出来的结果去训练另外一个 FasterRCNN 的网络,这样的效果是很好的。

©本文为机器之心编辑,转载请联系本公众号获得授权

  ?------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容