本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

时间:2017-04-30 23:06来源:668论坛 作者:本港台直播 点击:
王小新 编译自 Medium 量子位 出品 | 公众号 QbitAI 卷积神经网络(CNN)不仅能用来对图像进行分类,还在图像分割任务重有着广泛的应用。 Dhruv Parthasarathy就职于Athelas,一家专注于深度

  王小新 编译自 Medium

  量子位 出品 | 公众号 QbitAI

  卷积神经网络(CNN)不仅能用来对图像进行分类,还在图像分割任务重有着广泛的应用。

  Dhruv Parthasarathy就职于Athelas,一家专注于深度学习技术的医疗健康公司。他在Medium上发布了一篇博客文章,介绍了在具体的图像分割任务中如何应用卷积神经网络,来得到更好的效果。

  以下内容编译自Parthasarathy文章:

  自从深度学习鼻祖Geoff Hinton与他的研究生Alex Krizhevsky和Ilya Sutskever在2012年ImageNet大规模视觉识别挑战赛中获得冠军,卷积神经网络(CNN)已经成为了图像分类的黄金标准。从那时起,卷积神经网络一直在改进,现在已经在辨别ImageNet数据集的1000类日常对象上超过人类了。

  

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

  图1:CNN在ImageNet挑战中超过人类,图中y轴是ImageNet辨识的错误率。

  虽然网络分类结果令人感到欣喜,但在人类真实生活中的视觉理解要远比图像分类复杂多样。

  

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

  图2:ImageNet分类挑战中所使用的图像实例:图像边缘完好,且只有一个对象。

  在分类任务中,一张图像通常只具有单个焦点对象,任务是说出这个对象的类别。但是在实际的世界中,我们会看到往往不止一个物体对象,这是一项更复杂的任务。

  

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

  图3:现实生活中的情景通常由许多不同且重叠的对象、背景和动作组成。

  在一个复杂的情景中,通常有多个互相重叠的对象和不同的背景,我们不仅要对这些不同的对象分类,而且也要识别对象间的边界、差异和彼此的关系。

  

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

  图4:在图像分割中,其任务目标是对图像中的不同对象进行分类,并确定对象边界。

  卷积神经网络可以帮助我们处理这个复杂的任务吗?对于更复杂的图像,我们可以使用卷积神经网络来区分图像中的不同对象及其边界吗?Ross Girshick和他的同事们用最近几年的研究工作,给出了一个肯定的答案。

  本文目标

  这篇文章将会介绍一些用于对象检测和图像分割的主流技术,并了解其网络状态的演化过程。

  具体来说,我们将介绍首先解决了这个问题的R-CNN网络,以及后来发展出来的Fast R-CNN和Faster R-CNN。另外,我们还将介绍Mask R-CNN网络,这是Facebook Research组最近发布的一篇文章,其扩展了这种对象检测技术,且提供了像素级分割的技术。以下是这篇文章所引用的论文:

  1.R-CNN:https://arxiv.org/abs/1311.2524

  2.Fast R-CNN:https://arxiv.org/abs/1504.08083

  3.Faster R-CNN:https://arxiv.org/abs/1506.01497

  4.Mask R-CNN:https://arxiv.org/abs/1703.06870

  2014年:R-CNN - 将CNN用于对象检测的起源

  

报码:【j2开奖】卷积神经网络在图像分割中的进化史:从R

  图5:R-CNN网络的对象检测算法可以分析图像并识别图像中主要对象的位置和类别。

  受到多伦多大学Hinton实验室研究工作的启发,加州大学伯克利分校Jitendra Malik教授领导的团队,提出了一个在如今看来好像是不可避免的问题:

  能否将Krizhevsky等人提出的网络模型泛化应用到对象检测上?

  对象检测技术是一项通过标出图像中不同对象并对其进行分类的任务。在对象检测挑战赛PASCAL VOC上,由Ross Girshick,Jeff Donahue和Trevor Darrel组成的这个团队,发现这个问题可以通过Krizhevsky的研究成果来进行解决。

  他们写道:

  这篇论文首先说明一个事实,与基于更简单的用方向梯度直方图(HOG)类特征构建的系统相比,卷积神经网络可以显着提高PASCAL VOC上的对象检测性能。

  接下来,我们将会深入了解他们的Regions With CNNs (R-CNN)架构是如何运作的。

  理解R-CNN

  R-CNN的目标是分析图像,并正确识别图像中主要对象,通过边界框标出对象的具体位置。

  输入:图像

  输出:图像中每个对象的边界框和标签

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容