新智元启动 2017 最新一轮大招聘:。 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。 简历投递:j[email protected] HR 微信:13552313024 【新智元导读】谷歌团队日前提出了一类被称为 MobileNet 的高效模型,用于移动和嵌入式设备的视觉应用。研究人员多次实验的结果,与 ImageNet 分类任务的其他流行模型相比,MobileNet 显示出很好的性能,同时也证明了 MobileNet 在一系列应用和使用情况中的有效性,包括对象检测,细粒度识别,人脸属性提取,以及大规模地理定位。 论文下载地址:https://arxiv.org/pdf/1704.04861.pdf
开奖,效果超越众主流模型" src="http://www.wzatv.cc/atv/uploads/allimg/170504/031555B34_0.png" /> 摘要 我们提出一类被称为 MobileNet 的高效模型,用于移动和嵌入式设备的视觉应用。 MobileNet 基于一个流线型的架构,该架构使用 depthwise separable convolution 来构建轻量级的深度神经网络。我们引入了两个简单的全局超参数,有效权衡延迟和准确度。这些超参数能让模型搭建者根据问题的限制为其应用选择适当规模的模型。我们在资源和准确率的不同权衡条件下进行了广泛的实验,与 ImageNet 分类任务的其他流行模型相比,我们的模型显示出很好的性能。 然后,我们证明了 MobileNet 在一系列应用和使用情况中的有效性,包括对象检测,细粒度识别,人脸属性提取,以及大规模地理定位。 引言 自 AlexNet 在 ILSVRC 2012 利用深度卷积神经网络赢得 ImageNet 挑战赛以来,卷积神经网络(CNN)已经被计算机视觉应用普遍使用。这方面的应用总的趋势是用更深、更复杂的网络实现更高的精度。但是,考虑到模型大小和速度,精度的提高不一定会让模型更高效。在机器人、无人驾驶汽车、增强现实等许多现实世界的应用中,识别任务需要在计算力有限的平台上实时地进行。 本论文中,我们提出一个高效的网络架构以及一组两个超参数,以构建非常小,低延迟的模型,能够轻松适应移动和嵌入式设备的视觉应用的设计要求。
图1:MobileNet 模型可以应用于各种识别任务,实现高效的设备上智能。 实验 本节中,我们首先调查了 depthwise convolution 的影响,以及通过减小网络的宽度而不是减少层数来选择压缩的模型。然后,我们基于两个超参数来权衡收缩网络:width multiplier 和 resolution multiplier,并将其结果与一些流行模型进行比较。我们的研究证明 MobileNet 可以应用于许多不同的任务。 模型选择
首先,我们比较了 depthwise separable 卷积的 MobileNet 和完全卷积的模型,如表4所示,使用 depthwise separable 卷积的 MobileNet 和完全卷积的相比,在 ImageNet 的精度只降低了1%,但大大节省了 mult-adds 和参数。表5显示,在计算和参数数量相似时,更浅的模型比更小的模型结果精度低3%。 任务1:细粒度识别
我们在 Stanford Dogs 数据集上训练 MobileNet 进行细粒度识别。结果如表10所示,MobileNet 在大大减少计算量和减小模型大小的情况下实现了[18]的结果。 任务2:大规模地理定位
PlaNet 用于确定一张照片拍摄于哪个地理位置的分类问题任务。它的方法是将地球划分为一个网格,用数以百万有地理标记的照片训练卷积神经网络。PlaNet 已经能够成功将各种各样的照片标记地理位置,并在处理相同任务上优于 Im2GPS。 我们使用 MobileNet 架构在相同的数据上重新训练 PlaNet。如表11所示,atv直播,MobileNet 版本与 PlaNet 相比,规模小了很多,性能只低一点点,但也比 Im2GPS 更优。 任务3:人脸属性提取 (责任编辑:本港台直播) |