百度成立了AR Lab(增强现实实验室),这是继硅谷人工智能实验室、北京深度学习实验室和北京大数据实验室之后,百度又一力作。元旦期间,百度利用AR技术复原朝阳门后,这次,百度全面提升AR技术,对老北京九大城门进行了文化名城的全部复原。“人工智能(AI)技术是增强现实(AR)的核心”,这是百度首席科学家吴恩达在解读AR时反复强调的话。对于深耕多年,并宣布将AI成为战略发展目标的百度来说,这一次的试水,将成为业界的里程碑。 昨天,百度首席科学家吴恩达亮相北京地铁二号线,吸引了大批市民围观,更重要的是,他身体力行,体验了一把百度最新的AR技术。 细心的圈友会发现,在西直门的2号线和13号线换乘大厅、地铁2号线的一辆百度AR专列上,老北京内城九大城门的100年前老照片正在展示。使用手机百度App拍照老照片,就可触发百度AR,展现对应的城门以及语音讲解该城门的历史和典故。用户亦可以通过手机百度App搜索城门关键词(正阳门、德胜门、崇文门、朝阳门、西直门、东直门、阜成门、宣武门、安定门),搜索结果为信息卡片(阿拉丁卡片),直接点击即可在任何纹理丰富的物体上展示AR,这也是百度的核心搜索技术与AR的首次打通,对于AR的体验可以做到随时随地,同时大幅提升了用户搜索的体验,从信息、服务的搜索,立体到了三维空间的搜索结果展示。 机器人SLAM技术融入最新AR中 同时定位与地图创建 ( Simultaneous Localization and Mapping,SLAM) 是移动机器人研究领域中一个关键技术,比较经典的就是“卡尔曼滤波算法”。SLAM是在未知环境中通过自定位过程获取周围环境信息,并在行进过程中逐步构建周围环境的增量式地图,同时不断地重复观测已构建的地图来消除不确定因素,进而完成自身位姿的精确估计。SLAM 问题一直是移动机器人研究领域的一个热点问题,也被认为是移动机器人能否实现完全自主控制的关键。因此,不论是智能移动机器人(比如扫地机器人)、还是无人机等,都是SLAM技术良好的承接载体。 本次百度发布的AR技术,则成为SLAM技术的又一应用场景。现场,百度的工程师给记者展示了正阳门的实景触发。传统AR技术呈现时,虚拟人物和建筑角度一般是不可变化的,但百度通过SLAM技术,更为震撼地展现了正阳门旧时风貌。 由于机器人上搭载的SLAM技术,往往要依赖于各种复杂的传感器,成本也较高。百度自主研发的SLAM技术,可以在手机单目摄像头上做到实时追踪,将最为先进的手机端SLAM技术落地到AR应用里。 AR的核心是AI AI对于百度的战略性意义不言而喻,作为百度研究院的掌舵人,吴恩达到底是怎样对其理解的呢?现场,他也给出了答案。 “百度大脑(Baidu Brain)就是把我们最核心、最领先的人工智能技术放在一起,包括机器学习、语音、图像等等,atv,我们的AR技术能够与现实场景实时融合。”吴恩达将人工智能视为新电能,很多行业都会带来巨大的改变。同时,他也感慨,这样的人工智能技术可以更好地将中国历史还原。 那么,百度AR最核心的人工智能是什么呢?吴恩达认为是图像技术,因为AR需要使用图像技术来理解每张图里的内容,也需要图像技术来视觉定位,才可以实时把虚拟技术融合进去。吴恩达还透露,未来,AI的很多技术还将会继续对AR产生价值。同时,他认为,现在百度的AR技术已经将历史还原,未来还将有更多的领域加入到AR队伍中来,比如教育、医疗、旅游等等。 成立第四大实验室AR Lab 目前,百度研究院旗下已经拥有硅谷人工智能实验室、北京深度学习实验室、北京大数据实验室,加上本次披露的增强现实实验室,atv,百度研究院成员正式增加到4个。 那么,百度的AR技术到底怎样组成的呢? 百度AR架构 百度的AR架构包括,传感器、场景理解、三维感知、虚实融合、用户交互五大部分。以目前的应用为例,AR通过摄像头识别场景中的物体,触发相关AR,并在云端找到相应的虚拟物体与信息;然后通过自主研发的相机追踪算法为AR提供快速稳定的相机姿态估算结果,适应AR技术在移动设备上的运行要求;跨平台的三维渲染引擎可以将虚拟三维物体渲染到现实环境中,从而实现虚实融合效果;更好的用户交互,比如语音识别等,可以减少用户的触屏操作。 (责任编辑:本港台直播) |