本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:10 大深度学习架构:计算机视觉优秀从业者必备(3)

时间:2017-08-11 20:10来源:本港台现场报码 作者:118开奖 点击:
ResNeXt 据说是解决目标识别问题的最先进技术。它建立在 inception 和 resnet 的概念上,并带来改进的新架构。下图是对 ResNeXt 模块中的残差模块的总结。 图

ResNeXt 据说是解决目标识别问题的最先进技术。它建立在 inception 和 resnet 的概念上,并带来改进的新架构。下图是对 ResNeXt 模块中的残差模块的总结。

报码:10 大深度学习架构:计算机视觉优秀从业者必备

图 1. 左:ResNet 块。右:基数=32 的 ResNeXt 块,复杂度大致相同。层显示为(# in channels, filter size, # out channels)。

论文:Aggregated Residual Transformations for Deep Neural Networks

链接:https://arxiv.org/pdf/1611.05431.pdf

代码实现:https://github.com/titu1994/Keras-ResNeXt

6. RCNN (基于区域的 CNN)

基于区域的 CNN 架构据说是所有深度学习架构中对目标检测问题最有影响力的架构。为了解决检测问题,RCNN 尝试在图像中所有物体上画出边界框,然后识别图像中的物体。工作原理如下:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

RCNN 结构如下:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

链接:https://arxiv.org/abs/1506.01497

代码实现:https://github.com/yhenon/keras-frcnn

7. YOLO (You Only Look once)

YOLO 是当前深度学习领域解决图像检测问题最先进的实时系统。如下图所示,YOLO 首先将图像划分为规定的边界框,然后对所有边界框并行运行识别算法,来确定物体所属的类别。确定类别之后,yolo 继续智能地合并这些边界框,在物体周围形成最优边界框。

这些步骤全部并行进行,因此 YOLO 能够实现实时运行,并且每秒处理多达 40 张图像。

尽管相比于 RCNN 它的表现有所降低,但在日常实时的问题中它还是有优势的。下图是 YOLO 架构的示图:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

论文:You Only Look Once: Unified, Real-Time Object Detection

链接:https://pjreddie.com/media/files/papers/yolo.pdf

代码实现:https://github.com/allanzelener/YAD2K

8.SqueezeNet

SqueeNet 架构是在移动平台这样的低宽带场景中极其强大的一种架构。这种架构只占用 4.9 MB 的空间,而 Inception 架构大小为 100MB。这种巨大的差距由一种名为 Fire Module 的特殊结构引起。下图是 Fire Module 的表示图:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

SqueezeNet 的完整架构如下:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

论文:SQUEEZENET: ALEXNET-LEVEL ACCURACY WITH 50X FEWER PARAMETERS AND <0.5MB MODEL SIZE

链接:https://arxiv.org/abs/1602.07360

代码实现:https://github.com/rcmalli/keras-squeezenet

9.SegNet

SegNet 是一个用于解决图像分割问题的深度学习架构。它包含处理层(编码器)序列,之后是对应的解码器序列,用于分类像素。下图是 SegNet 解析图:

报码:10 大深度学习架构:计算机视觉优秀从业者必备

SegNet 的一个主要特征是在编码器网络的池化指标与解码器网络的池化指标连接时,分割图像保留高频细节。简言之,直接进行信息迁移,而非卷积它们。在处理图像分割问题时,SgeNet 是最好的模型之一。

论文:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

链接:https://arxiv.org/abs/1511.00561

代码实现:https://github.com/imlab-uiip/keras-segnet

10.GAN

GAN 是神经网络架构中完全不同的类别。GAN 中,一种神经网络用于生成全新的、训练集中未曾有过的图像,但却足够真实。例如,以下是 GAN 工作原理的解析图。

报码:10 大深度学习架构:计算机视觉优秀从业者必备

论文:Generative Adversarial Networks

链接:https://arxiv.org/abs/1406.2661

代码实现:https://github.com/bstriner/keras-adversarial

原文地址:https://www.analyticsvidhya.com/blog/2017/08/10-advanced-deep-learning-architectures-data-scientists/

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容