本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

腾讯AI Lab计算机视觉团队负责人刘威博士详解(3)

时间:2017-08-11 20:24来源:668论坛 作者:j2开奖直播 点击:
论文中首先讨论了基于单张图片的物体三维结构重建,并证明了仅用曼哈顿结构信息即可恢复图像的摄像机矩阵;然后结合对称性约束,可唯一地重建物体

论文中首先讨论了基于单张图片的物体三维结构重建,并证明了仅用曼哈顿结构信息即可恢复图像的摄像机矩阵;然后结合对称性约束,可唯一地重建物体的三维结构。在单张图像重建中,遮挡和噪声等因素会对重建结果造成很大影响。所以论文后半部分转到了多张图像基于运动恢复结构(Structure from Motion, 简称 SfM)及对称信息的物体三维重建中。事实上,SfM 算法涉及到对二维特征点进行矩阵分解,而添加对称性约束后,我们并不能直接对两个对称的二维特征点矩阵直接进行矩阵分解,因为这样不能保证矩阵分解得到同样的摄像机矩阵以及对称的三维特征点坐标。所以,论文通过进一步利用对称性信息进行坐标轴旋转解决了这个问题。实验证明,该方法的物体三维结构重建及摄像机角度估计均超出了之前的最好结果。

七、关于团队

机器之心:能否介绍一下目前腾讯 AI Lab 计算机视觉团队的现状?

刘威:目前我们的团队有十多位基础研究科学家,大多拥有国内外院校博士学位,并与一个较大的应用工程师团队紧密合作。我们很注重对青年研究者的培养,团队中应届毕业的博士接近半数,也将继续在海内外招募不同级别的优秀研究者。另外,我们的项目也吸引了哥伦比亚和清华等海内外知名大学的优秀实习生参与。

机器之心:如何看待目前计算机视觉领域技术的发展以及未来在哪些领域具有较大的潜力?

刘威:2012 年深度学习技术的兴起,让计算机视觉自此有了长足发展。除了物体检测与识别这类经典的中层视觉问题,在图像去噪、去模糊、超分辨率和语义分割等低层视觉问题解决上也有了很大的飞跃。从最近两届 CVPR 广受关注的论文来看,未来 CV 领域的研究除了会继续提升经典视觉问题的算法性能,伴随着新数据集设计及细分研究领域上的新挑战,一些有趣且有挑战的研究问题也将会受到更大关注。我个人认为,视觉+NLP 的交叉将持续升温,视频分析理解(包括视频分类、视频物体分割等)的研究将再上一个台阶。

IJCAI 2017期间,腾讯联合机器之心在墨尔本举办↓↓↓

腾讯AI Lab计算机视觉团队负责人刘威博士详解

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容