语音技术+自然语言处理可以让机器听清、听懂、满足用户需求,视频分析、人脸识别和增强现实技术让机器“看懂世界”,除了发布新开放的核心技术能力,百度杰出科学家徐伟批露了PaddlePaddle 的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个深度学习开放平台,PaddlePaddle将与开发者一起繁荣AI生态,引领行业发展。 02、对话式操作系统 ┇“唤醒万物”的核心三要素: “听清、听懂、满足” 听清:在AI时代,我们希望把语音放到真正的场景里面,麦克风阵列、回声消除、语音唤醒等,都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求; 听懂:数据多、技术深是打造对话系统的必然条件,百度是具备数据量最大的公司,我们有百亿的支持、十亿的图谱。在AI时代,要做到听懂用户,实时图谱数据的力量将是一个非常重要的支撑; 满足:听懂并满足“听一首歌”这样的用户需求还不够,真正用户想要的是复杂得多的需求,比如“电影《爱乐之城》里女主角第一次和男主角跳舞得歌曲是什么”,只有把用户在真实场景中表达的复杂请求做好,才能真正满足用户自由的表达、满足他们的需求。 ▲ 沉浸式体验DuerOS DuerOS 将为开发者提供最容易上手的软硬件一体化方案,包括多样化的开发套件和完全开放的参考设计: 1、搭载树莓派的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。 2、轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。 3、标准版。两麦、四麦、八麦的标准版都可以即刻申请。 4、一体化完整设计的参考设计。如开放的链路设计、开放的音响设计等等。 03、智能驾驶 Apollo 开放平台完整的技术架构包括软件平台、云端服务平台、参考硬件平台、参考车辆平台四大部分,通过四层架构全方位构建能够实际运行的自动驾驶系统,并将通过开放代码、开放能力和开放数据三种形式逐步赋能开发者及生态合作伙伴。 ┇Apollo 的核心技术平台 一、中间是软件平台。Apollo 开放了一系列重要模块,重点是以下四大模块。 1、自定位模块:使用百度业内领先的高精地图,加上多种传感器融合,让每一辆车都可以低成本、全天候地精准定位。 2、感知模块:感知是当前自动驾驶工业创新的重点,运用顶尖的人工智能技术能看清和看懂路况,包括每一个障碍物、行人、车辆。 3、车辆规划控制:Apollo 模型运用AI和大数据,采取最安全的驾驶策略做到精确的车辆控制,也能适应不同国家的交通路况。 4、运行框架:这是Apollo 的基石。核心是安全、可靠、实时控制,并能同时支持Intel和NVIDIA的芯片。 二、上面是服务平台。Apollo 一系列重要的开放能力都汇聚于此。重点包括: 1、高精地图服务,这是自动驾驶的千里眼。 2、仿真引擎。百度在快速累积海量的数据,能让开发者日行百万公里。 3、安全服务。百度将给开发者持续提供高度的安全服务。 4、DuerOS 服务:为每一辆车提供智能化的车内体验。 三、参考硬件平台和参考车辆平台。 Apollo 硬件平台支持从CPU 到GPU 到FPGA 各种计算硬件,也支持从GPS、IMU、摄像头,到激光雷达等各种传感器。同时,Apollo 提供的黑盒子能够记录和保存所有的数据信号,使得合作伙伴可以更安全、有效地预防和处理车辆事故。 目前Apollo 生态合作伙伴联盟已辐射OEM、Tier1、地图公司、芯片公司、基金投资、个人开发者、创业公司、研究机构及政府机构等,成为全球涵盖产业最为丰富、最为全面的自动驾驶生态。 04、智能云 (责任编辑:本港台直播) |