新智元启动 2017 最新一轮大招聘:。 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。 简历投递:j[email protected] HR 微信:13552313024 【新智元导读】英伟达创建的基于 CNN 的无人驾驶系统 PilotNet,可以根据前方路面的图像输出转向角度。这项由谷歌研究院、英伟达和纽约大学的研究人员联合参与的研究描述了一种方法,用于在 PilotNet 中找到进行转向决策的输入图像中的区域(称为显著物体)。结果显示,PilotNet 确实能够学习识别道路上的相关物体。除了学习车道标记、道路边界以及其他车辆这样明显的特征,PilotNet 还能学习更难以预料和被工程师编程的微妙特征,例如灌木掩映的道路边界和非典型的车辆。 论文下载地址:https://arxiv.org/abs/1704.07911
摘要 作为无人驾驶完整软件堆栈的一部分,英伟达已经创建了一个称为 PilotNet 的基于神经网络的系统,该系统根据前方路面的图像输出转向角度。PilotNet 使用道路图像进行训练,该图像与有人驾驶数据采集车产生的转向角度配对。它通过观察人类驾驶来获得必要的领域知识。这消除了人类工程师预测图像中重要内容和预见所有必要的安全驾驶规则的需要。道路测试表明,PilotNet 可以在各种驾驶条件下成功执行车道保持,无论车道标记是否存在。 本研究的目标是解释 PilotNet 的学习内容以及它是如何做出决策的。为此,我们开发了一种方法,来确定道路图像中的哪些元素最能影响PilotNet 的转向决策。结果显示,PilotNet 确实能够学习识别道路上的相关物体。 除了学习车道标记、道路边界以及其他车辆这样明显的特征,PilotNet 还能学习更难以预料和被工程师编程的微妙特征,例如灌木掩映的道路边界和非典型的车辆。 引言 此前有研究描述了一种用于无人驾驶汽车的端到端学习系统,该系统根据前方道路的输入图像训练卷积神经网络(CNN)以输出转向角度。这一系统现在称为PilotNet。训练数据来自数据采集车中前置摄像机的图像,以及人类驾驶员记录的同步转向角度。使用PilotNet的动机是消除手工编码规则的需要,代之以创建一个通过观察进行学习的系统。初步结果令人鼓舞,尽管该系统还需要进行较大改进,才能在不需要人为干预的情况下上路。为了深入了解学习系统如何决定要做什么,并进一步改进系统,且建立其系统将安全驾驶放在首位的信任,我们开发了一种简单的方法来突出显示在确定转向角度方面最显著的图像。我们把这些突出的图像部分称为显著物体。 PilotNet 训练数据包含从汽车前置摄像机的视频采集的单张图像,与相应的转向指令(1 / r)配对,其中r 是车辆的转弯半径。训练数据用额外的“图像/转向命令对”增强,模拟车辆处于不同偏心角和偏心方位的状态。对于增强图像,目标转向命令被适当地调整为将车辆驶回车道中心。 一旦网络被训练完成,它可以用于为给定图像提供转向命令。 PilotNet 网络架构
图1 PilotNet 架构 PilotNet 架构如图1所示。该网络由9层组成,包括归一化层,5个卷积层和3个完全连接的层。输入图像被分割成YUV平面并传递到网络。网络的第一层执行图像归一化。归一化器是硬编码的,在学习过程中没有调整。 卷积层被设计用来执行特征提取,并通过一系列改变层配置的实验来选择。 五个卷积层之后是三个完全连接层,输出反转弯半径的控制值。完全连接的层被设计为用作转向的控制器,但是须注意,通过端对端的系统训练,网络的哪些部分作为特征提取器,哪些部分用作控制器,之间没有硬性的边界了。 识别显著物体 识别显著物体的中心思想是找到图像中的某一部分,其对应于上述特征图具有最多 activation 的位置。 使用下面的算法,较高级别特征图的 activation 成为了较低级别 activation 的掩码: 1. 在每一层中,特征图的activation 被平均化了。 (责任编辑:本港台直播) |