本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】赛灵思推出reVISION堆栈,进军广泛的视觉导向机器学习领域(3)

时间:2017-03-18 03:28来源:香港现场开奖 作者:j2开奖直播 点击:
同时,reVISION?堆栈开发流程从熟悉的 C、C++、OpenCL 语言及相关编译器技术的基于 eclipse 的开发环境(即 SDSoC 开发环境)启动。在 SDSoC 环境中,软件工程师

同时,reVISION?堆栈开发流程从熟悉的 C、C++、OpenCL 语言及相关编译器技术的基于 eclipse 的开发环境(即 SDSoC 开发环境)启动。在 SDSoC 环境中,软件工程师和系统工程师能以 reVISION 硬件平台为目标,并采用大量的加速就绪型计算机视觉库,atv,很快还能采用 OpenVX 框架,允许开发者快速构建应用。

  

wzatv:【j2开奖】赛灵思推出reVISION堆栈,进军广泛的视觉导向机器学习领域

  reVISION?堆栈软件定义流程

针对机器学习算法,可以利用 Caffe 等流行的框架来培训神经网络,用 Caffe 生成的.prototxt 文件对基于 ARM 的软件调度器进行配置,从而驱动专门为可编程逻辑预先优化的 CNN 推断加速器。

对计算机视觉和其他专有算法来说,用户可对软件代进行特征分析,发现瓶颈,并在代码中标出希望加速并进行「硬件优化」的特定功能。「系统优化编译器」则用来创建加速的实现方案,atv,包括处理器/加速器接口(数据移动器)和软件驱动器。结合计算机视觉和机器学习功能,该编译器能创建优化的融合实现方案。

  

wzatv:【j2开奖】赛灵思推出reVISION堆栈,进军广泛的视觉导向机器学习领域

  reVISION?堆栈易用性

赛灵思嵌入式视觉及 SDSoC 高级市场经理 Nick Ni 表示:「我们的目的就是让更多软件工程师和系统工程师无需掌握或只需掌握一点硬件设计专业技术,就能够更轻松快速地开发出智能嵌入式视觉系统,包括将机器学习和计算机视觉算法的超高效实现方案整合到高响应性系统中。以 OpenCV 为例,OpenCV 库函数对于开发许多计算机视觉应用来说是比较重要的。目前我们可以提供部分已经进行优化好的库,不需要开发者自己来写硬件代码,可以直接用我们的工具库进行生成。利用 reVISION?进行计算视觉的设计流程是:在 Zynq 平台上交叉编译 OpenCV application,列提纲并确定瓶颈函数,最小化代码变动并将函数烧入硬件中,将生成的 SW/HW 图片复制到 SDCard 并在 Zynq 开发板上运行。五月份,我们将会发表约 50 个优化好的库,未来会结合用户的需求对库进行更全面的优化,致力于为客户提供 80% 的解决方案,而剩余的 20% 则是用户的 100%,是用户将独特创意实现的过程。」

reVISION?堆栈叫板 CPU/GPU

除了 FPGA,时下主流的人工智能算法,深度学习计算硬件平台还包括 CPU、GPU、ASIC。CPU 作为最初用作硬件平台的通用处理器,通用性好,模块功能多,逻辑处理能力强,可以完成复杂度高的计算,但是在执行深度学习算法时计算性能一般。GPU 不同于 CPU 的单线程处理,结构简单,提供了大量的计算单元,更能适应深度学习大量的矩阵、卷积运算,英伟达公司就一直在 GPU 领域占主导地位。ASIC 作为一种为专门目的而设计的集成电路,是面向特定用户的需求的,具有不产生冗余、计算性能高、功耗低的特点,比如 Google 的 TPU。

Steve Glaser 为我们展示了带有 reVISION?的典型 SoC 与传统 CPU 和 GPU 以及典型 SoC 的比较结果。从图中可以看出,reVISION?不但能支持从推断到机器学习推断和互联控制的优化,系统响应时间最快,还能为硬件优化的算法加速提供所需的可重配置性,并具备能升级更新到最新传感器和连接性的需求。

  

wzatv:【j2开奖】赛灵思推出reVISION堆栈,进军广泛的视觉导向机器学习领域

  从响应时间和可重配置性方面,对带有 reVISION?的典型 SoC 与传统 CPU 和 GPU 以及典型 SoC 进行性能比较

仅针对响应时间而言,CPU 和传统 GPU 针对的是机器学习的训练过程,而赛灵思则着手于从传感器到推断和控制的最低时延来实现最快响应性。嵌入式 GPU 和典型 SoC 需要从传感器到视觉、机器学习和控制处理频繁访问外部存储器。相比之下,赛灵思基于 Zynq SoC 的 reVISION?部署了使用可编程逻辑和较多的内部存储器实现的优化和流线型数据流。在与英伟达先进处理器 NVIDIA Tegra X1 进行基准对比时,基于 reVISION?的流程在机器学习方面单位功耗图像捕获速度提升 6 倍,在计算机视觉处理的帧速率提升 40 倍,时延仅为 1/5(以毫秒为单位),这些确定性的响应能力指标正是对于实时应用十分重要的。

用于推断和控制的最低时延传感器

作为一切技术创新、落地的基础,半导体芯片产业持续升温,各公司对于半导体芯片领域的研发是一场没有硝烟的战场。近年来,各巨头公司为扩大、占领半导体芯片市场战略举动层出不穷,竞争也愈发激烈。赛灵思 reVISION?堆栈的发布,无疑将让机器学习开发平台市场的竞争进一步加剧,然而对于创意不断的用户市场,有一个强大新平台可以选择,无疑是一个振奋人心好消息。

©本文为机器之心原创,转载请联系本公众号获得授权

  ?------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容