本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【Kaggle冠军分享】图像识别和分类竞赛,数据增(2)

时间:2017-07-10 04:46来源:报码现场 作者:118KJ 点击:
我们在早期注意到,夜视图像真的很容易识别——只需检查绿色通道的平均值是否比红色和蓝色通道两者相加的均值更亮就行了,加权系数为 0.75,在所有

我们在早期注意到,夜视图像真的很容易识别——只需检查绿色通道的平均值是否比红色和蓝色通道两者相加的均值更亮就行了,加权系数为 0.75,在所有情况下都适用。观察典型正常图像和夜视图像的颜色强度直方图,可以清楚地发现差异,因为常规图像的颜色分布通常彼此相近,这可以从下图中看出。虚线表示近似这些分布的最佳拟合高斯。

我们想要增加更多的夜视图像。因此,最终的一个模型,也是最后成绩最好的单一模型,随机分配了一些训练图像,并且扩展了直方图,使其更接近于夜视图像。这是针对每个颜色通道分别完成的,并假设是高斯的(实际情况并不是高斯的),并且相应地修改了平均值和标准偏差——基本上就是缩小红色和蓝色通道,从图中可以看出。之后我们也分别对每个颜色通道进行了随机的对比度拉伸。因为夜视图像本身可能是非常多样的,而固定变换无法体现这种变化。

因为这个模型性能非常好,我们还添加了一个不单独使用夜视图像的模型,但却加长了所有图像的对比度。因为这是分别在每个通道上完成的,可能会改变鱼类或周围环境的颜色。由于数据中海洋里光照条件变化多端,真实图像中的颜色不太稳定,所以这种方法结果看上去还是很好的。

wzatv:【Kaggle冠军分享】图像识别和分类竞赛,数据增

比赛中,关于数据方面,你们最重要的看法是什么?

首先,必须具有包含来自不同船舶的图像的验证集,而不是训练集中的图像,否则模型可以根据船舶特征学习分类鱼类,这虽然不会在验证分数上有所体现,但可能会导致 stage2 测试集的精确度下降。

其次,整个数据集中鱼的大小都非常不同,因此对这一点进行处理显然是有用的。

第三,有大量的夜视图像具有不同的颜色分布,因此用不同的方式处理夜视图像也提高了我们的分数。

更重要的是,其他团队在论坛上发布的附加数据似乎包含了很多这样的图像,其中的鱼看起来与放在船上的鱼看起来不一样,因此过滤掉这部分数据很重要。

最后,我们对原始训练图像进行了多边形注释,这有助于我们在旋转图像上实现更准确的边界框,否则图像将包含很多背景(如果旋转框的边框被视为基本真实的)。

wzatv:【Kaggle冠军分享】图像识别和分类竞赛,数据增

参赛工具及硬件配置

你们使用了哪些工具?

我们使用从定制的存储库 py-R-FCN(包括 Faster R-CNN)代:https://github.com/Orpine/py-R-FCN 。

你们在这次比赛中都做了哪些事情?

我们花了一些时间注释数据,从论坛上发布的图像中找到有用的附加数据,找到正确的扩充来训练模型,查看生成的验证图像预测,然后查看模型可能学到的任何虚假模式。

你们的硬件设置是什么样的?

两台 NVIDIA GTX 1080,一台 NVIDIA TITAN X

你们获胜解决方案的训练和预测运行时间分别是多少?

非常粗略的估计,GTX 1080 训练大约 50 小时,预测每个图像 7-10 秒。我们最好的单一模型其实比整个系统更加精确,可以在 4 小时内训练,需要 0.5 秒进行预测。

对刚入门数据科学的人有什么建议吗?

先阅读介绍类的材料,然后逐渐开始阅读论文,尝试自动动手解决机器学习问题,培养直觉,检查训练好的模型,努力去了解出了什么问题。计算机视觉问题对于练手来说相当不错。学习享受机器学习过程要付出长期的努力,保持兴趣才能保持动力。Kaggle 是学习机器学习的完美平台。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容