本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

时间:2017-05-01 14:11来源:天下彩论坛 作者:www.wzatv.cc 点击:
王小新 编译自 Kaggle 量子位 出品 | 公众号 QbitAI 在2016年12月至2017年3月期间,Kaggle网站举办了一场对英国国防科学与技术实验室(DSTL)提供的卫星图像进行场景特征检测的图像分割比

  王小新 编译自 Kaggle

  量子位 出品 | 公众号 QbitAI

  在2016年12月至2017年3月期间,Kaggle网站举办了一场对英国国防科学与技术实验室(DSTL)提供的卫星图像进行场景特征检测的图像分割比赛。

  主办方所提供的训练集里包含了25个1平方公里大小地区的高分辨率卫星图像,具体任务是通过算法进行识别10个不同类型的对象,分别是:

房屋和楼房;

混杂的人工建筑;

道路;

铁路;

树木;

农作物;

河流;

积水区;

大型车辆;

小轿车。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

Kyle的Kaggle主页

  比赛结束后,冠军Kyle Lee接受了Kaggle网站的采访,详细地介绍了他在这次比赛中的获胜之道。其中,耐心和坚持是关键因素,他花费了大量的时间,为不同的类别开发了独特的处理技术、采样策略和U-NET结构。

  以下内容节选自Kaggle对Kyle的采访:

  你的整体策略是什么?

  总而言之,我的解决方案主要有以下几点:

  1.将多尺度图像块与滑动窗口生成方法相结合,利用区域块重叠技术覆盖到整个图像的边缘。最初将尺度为256x256和288x288的图像块相结合,后来又加入了尺度为224x224和320x320的图像块;

  2.组合不同的频段(bands)和尺度(scales),来训练和融合网络模型,得到最优的U-NET网络;

  3.对小样本类别进行过采样。过采样在小样本图像上以较小的步长来滑动采样窗口,开奖,在大样本图像上以比默认值更大的步长来滑动采样窗口;

  4.作用于河流对象的指标法,组合无差别水分指数(Non-Differential Water Index)和顶端叶绿素含量指数(Canopy Chlorophyl Content Index)这两个指标来辨识河流;

  5.对道路、积水区、河流、小轿车与大型车辆这些对象进行后期处理。这种后期处理办法解决了积水区和河流之间的类别混乱,同时去除道路上的伪影,并在计算大型车辆得分时设置附加权值;

  6.大型车辆识别。在这里我用了一些技巧来训练用于预测道路和房屋的网络。我只使用RGB频段的图像数据,取平均值,并训练多个融合网络,对大型车辆进行分割

  7.农作物。我先将图像的尺度降低为1024×1024,然后利用滑动窗口重叠采样,得到尺度为256x256的图像块。

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图1:辨识所有类别的完整网络示意图 你是如何进行特征提取和数据预处理?

  我使用不同大小的滑动窗口,对A频段和M频段的图像分开处理。另外,我还在一些融合模型中对小样本类别进行过采样操作。关于滑动窗口的详细参数如下:

  

码报:【j2开奖】Kaggle冠军告诉你,如何从卫星图像分割及识别比赛中胜出?

  图2:各类过采样的详细参数

  同时对积水区和河流进行过采样是一个不错的方法。因为过采样能减少积水区的伪影,降低了积水区和河流的类别混乱。

  就网络所用的数据频段来说,我主要使用灰度图、RGB图像和多光谱M频段,也使用了短波红外A频段。对于A频段,我没有使用所有的通道,而是随机选择几种通道,以节省训练时间和内存占用。

  在上面也提到过,我仅对道路和建筑物周围的车辆进行滑动窗口采样,用于网络训练和预测,这有助于减少训练所需的图像数量,并允许对车辆图像块进行针对性的过采样。该方案也应用于测试集,你可以从流程图中看出一系列结果。

  最后,在预处理中,将训练集的图像减去平均值,并标准化偏差。也就是说,训练集、验证集和测试集的图像块都需要减去全局平均值,再除以训练集的标准偏差。

  你使用了哪种监督学习方法?

  U-NET网络经常用于“超声神经分割”(Ultrasonic Nerve Segmentation)比赛和其他的分割比赛中。在此次比赛中,我也大量使用了这种网络,因为这是目前扩展性最好的完全卷积网络(Fully Convolutional Network)。事实上,如果我没有猜错,大多数参赛者都使用了升级版U-NET网络。

  我对原始的网络结构进行了调整,在下游路径添加了BN层(batch-normalization),在后合并路径上添加了dropout层,所有激活层都使用的是指数线性单元(ELU)。通过交叉验证评分,对于不同的类别使用不同的网络深度和图像尺寸,如256 x 256,288 x 288等。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容