根结构已经被应用于一些优秀的神经网络结构中,如google提出的Inception结构等。实验结果表明,stem结构可以有效地保护输入图片信息的丢失,从而训练出更加鲁棒的检测器。 以下是DSOD在PASCAL VOC 2007数据集上各部分有效性验证实验: 表2. 网络各部分有效性验证实验 更多细节大家可以去阅读原文。 表3是DSOD 在 PASCAL VOC 2007数据集上的“物体检测”对比实验结果(包括模型参数量,运行速度,输入图片大小,模型精度等): 表3. VOC2007 test set上的实验结果对比 从表中可以看出DSOD不仅模型参数更小 (仅为SSD的1/2, faster-rcnn的1/10),而且性能优于相同设置下的YOLOv2、SSD等。更重要的是DSOD模型不需要在ImageNet预训练,也就是说该模型训练图像其实比其他state-of-the-art的方法少用了120万张预训练图片! 下面是DSOD算法的一些实际的检测结果: 图2. 检测结果示例图 总结 在DSOD这篇论文中,作者首先分析了深度网络training from scratch存在的问题以及如何才能构建一个可以从零开始训练的检测器的网络,同时给出了非常详细的指导和设计原则帮助读者去构建这样的网络。 基于这些原则,作者提出了DSOD模型,该模型不仅参数更少(适合于手机、无人机等资源受限的设备)、性能更强,更重要的是不需要在大数据集(如ImageNet)上预训练,使得DSOD的网络结构设计非常灵活,根据自己的应用场景可以设计自己所需要的网络结构。 DSOD模型打破了传统的基于预训练+微调的检测器训练的藩篱,在有限数据集下,从零开始训练就能得到state-of-the-art的目标检测器,在自动驾驶、监控、医学图像、多谱图像等领域将会拥有非常广阔的应用前景。返回搜狐,查看更多 (责任编辑:本港台直播) |