本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?(2)

时间:2017-05-01 14:11来源:天下彩论坛 作者:www.wzatv.cc 点击:
在我的实验过程中,有一种网络结构在训练时间等方面都具备最优的性能。这种网络有着较大的图像尺寸(288x288)和较浅的U-NET网络深度(3组2 x conv层+

  在我的实验过程中,有一种网络结构在训练时间等方面都具备最优的性能。这种网络有着较大的图像尺寸(288x288)和较浅的U-NET网络深度(3组2 x conv层+ maxpool)。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图3:不同类别的U-NET结构

  最终,我创建了40多种不同尺度、宽度和深度的网络模型,来训练数据子样本和选择最佳频段。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图4:10类对象的全部网络模型表1

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图5:10类对象的全部网络模型表2

  在交叉验证方面,我根据不同类别,使用了10%到20%的随机图像块,大样本类别比例更高。对于过采样的小样本类别,只使用5%的随机图像块。这样,整体上减少了模型的运行时间。

  训练集的图像(包括图像和标签)通过旋转45度、缩放15-25%、剪切操作、切换频段(仅针对某些网络)和垂直+水平翻转等图像增强操作,增加泛化能力,网络的训练时间也随之增加。对验证集或测试集不进行上述操作。

  在优化策略方面,NAdam优化器效果不好,直接使用Adam作为优化器,用Jaccard Loss作为训练指标。我的学习率优化方法是,每经过30次迭代,学习率减小为原来的0.2倍。

  在处理网络输出上,大多数类直接使用标签算术平均,对于积水区和大型车辆类别采用相加方法,仅在使用NDWI指数和CCCI指数的河流上使用了交叉选取的方法。

  对于数据,最重要的洞察力是什么?

  我的理解是,大多数参赛者在积水区和两种车辆对象的识别率都比较低,在这一块,我花了很多功夫来进对图像进行预处理和后期处理。我相信,只要提高这三类对象(积水区,小轿车和大型车辆)的识别率,就能领先其他参赛者,提高我的最终成绩排名。

  积水区与河流

  对于积水区,积水区的主要问题之一是会与河流相混淆。如前所述,对积水区和河流进行过采样,有助于U-NET网络在积水区预测时解决河流的伪影问题,但仍然有大量河流对象的旁支干扰,下图为积水区预测的最初效果。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图6:积水区的伪影问题

  从常识上来说,河流总是会延伸到图像的边界,而积水区一般只有小的重叠区域,这是解决问题的关键。此外,为了检测河流而建立的NDWI指数可能与原始的积水区预测结果相重叠,并且两者间非常相似的断裂边缘可以被合并成凸包,形成一种触及图像边界的完整轮廓。总之,检查积水区和河流的图像边界轮廓,是后期处理流程的一部分工作,能将一些错分为积水区的图像转变为河流类。

  大型车辆和小轿车

  此外,我也花了大量时间用于分类两类车辆对象。我注意到,无论是在训练数据中,还是根据常识来判断,车辆往往停放在道路上或道路附近,以及建筑物的周围。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图7:在道路上和建筑物周围的小轿车

  我们只对包含有建筑物和道路的车辆图像块进行训练和预测,同时对车辆图像样本进行过采样,并缩小网络中的卷积核大小。此外,我只采用RGB图像作为输入数据,因为在其他的频段中,车辆对象不可见或明显移位。

  其次,许多车辆在图像模糊和处于标记区域时,都很难区分大型车辆和小轿车。作为参照,这些训练数据的标记区域大小显示在下面的直方图中,并且在大型车辆和小轿车之间,大约有50-150像素点的大面积重叠。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图8:小轿车和大型车辆的标记区域像素点数量对比

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容