本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:CVPR 2017完全指北:深度学习与计算机视觉融合的(3)

时间:2017-08-06 20:00来源:天下彩论坛 作者:j2开奖直播 点击:
2. 循环 3D 姿态序列机(Recurrent 3D Pose Sequence Machines)。由于人类外观变化多端,而且还有各种各样的相机角度和视线阻挡,再加上固有的模糊性,3D 姿态估

2. 循环 3D 姿态序列机(Recurrent 3D Pose Sequence Machines)。由于人类外观变化多端,而且还有各种各样的相机角度和视线阻挡,再加上固有的模糊性,3D 姿态估计是比 2D 问题远远更有挑战性的问题。这篇论文提出了一种全新的循环 3D 姿态序列机(RPSM)模型,可以使用多个阶段的序列优化来循环式地集成丰富的空间和时间长程依赖。

但是,在日常生活中人们被相机对准时,隐私又变成了另一个热门主题。一位学者表达了自己的担忧:「我看到有很多研究工作出现,而这些可能会成为监管部门的巨大挑战。对于人物识别这样的任务,个人隐私可能会承受风险。」

研究趋势和观察

1. 计算机视觉领域的机器学习和深度学习。也有不同的声音,一位来自 EE 的学者说:「我认为计算机视觉和深度学习的结合并不是非常好,尽管它得到了许多成功的应用和论文。传统上,从信号处理的角度看,我们知道计算机视觉的物理含义,比如尺度不变特征转换(SIFT:Scale-Invariant Feature Transform)和加速的稳健特征(SURF:Speeded Up Robust Features)方法,但深度学习无法得到这样的含义,你只需要更多数据就可以了。这可以被视为向前的一大步发展,也可以被看作是向后的一步倒退。从基于规则到数据驱动,我们需要重新评估我们的方法。」

2. 数据驱动的模型。模型不再由人工设计模式设计(这种方法通常只能覆盖一个特定数据集的一两个特征,但在其它数据集上则表现很差),而是重在数据驱动的模型,这意味着特征是从馈送给模型的成千上万张图像中学习到的。一些图像可能是高度对应的(但可能是不同的角度),所以该模型可以通过测量这种对应关系(对于定位问题)来自己学习相似度。简而言之,大规模数据可以得到更好的结果。但一个带有大量数据的简单算法不会是未来最好的方法。成功的模型源自足够的强大的算法以及高质量和足够大的训练数据集。此外,还需要找到适用的场景。

3. 数据集

问题:在 2D 和 3D 视觉领域,许多新类型的研究往往会遇到没有合适(足够)的训练数据的问题。

方法:

寻找生成或增强训练数据的新方法,一些是弱监督学习或自监督学习;

将需求放在 Amazon Mechanical Turk 等平台上。

结论:自 2009 年以来,ImageNet 主导了计算机视觉研究,大部分模型都是在 ImageNet 上训练的。现在,数据已然成为了先进算法的瓶颈,研究者不可避免地需要构建更大的通用数据集。此外,数据的质量也很重要,因为低质量的数据可能会严重拉低模型的表现,即使模型本身可能已经足够好了。有监督方法无法满足数据需求,社区需要找到新的出路。比如,利用不可靠的数据、应用弱监督方法和在环境中主动学习可能是下一波浪潮的可行方向。

4. 弱监督方法。今年有近 30 篇论文谈及了弱监督方法。这一趋势和数据不足问题紧密相关。「弱监督」这个术语是指带有不完整标签的图像。标签在图像中的物体上没有很好的划分,比如一个带有汽车标签的边界框没有圈到汽车,但也未经处理就被输入了模型。这一趋势说明靠人力标注数据集是不可行的。

5. 数据与模型的结合。这会是未来的一大趋势。当前研究中本质的问题是:在特定应用上再也无法为先进的算法或模型提供足够的数据。所以很多研究者的研究结果不仅有算法或架构,还包含了数据集或积累数据的方法。

教程、研讨会和挑战赛

在所有的研讨会中,有至少 14 个都是针对某个挑战赛的。许多企业实验室和大学研究团队已经参与到了这些挑战赛中。除了发表研究论文,这些挑战赛也已经变成了研究团队和企业展示自身研究和工程实力的地方。

CVPR 2017 上的挑战赛

ActivityNet 大规模活动识别挑战赛 2017,链接:

Beyond ImageNet 大规模视觉识别挑战赛,链接:

第二届 NTIRE:图像恢复与增强新趋势之超分辨率研讨会和挑战赛,链接:

计算机视觉的明暗面:隐私与安全的挑战和机遇,链接:

DAVIS 视频目标分割挑战赛 2017,链接:

视觉问答挑战赛 2017,链接:

YouTube-8M 大规模视频理解挑战赛,链接:https://research.google.com/youtube8m/workshop.html

群体场景中对人类的视觉理解与第一届 Look Into Person (LIP) 挑战赛,链接:https://vuhcs.github.io/

关于计算机视觉在汽车技术与自动驾驶挑战赛的联合研讨会,链接:

自然环境中的人脸问题研讨会-挑战赛,链接:https://ibug.doc.ic.ac.uk/resources/first-faces-wild-workshop-challenge/

关于场景理解和 LSUN 挑战的联合研讨会,链接:

交通监控研讨会和挑战赛,链接:

PASCAL IN DETAIL 研讨会挑战赛,链接:https://sites.google.com/view/pasd

通过从网络数据学习的视觉理解挑战赛,链接:

连接 3D 视觉研讨会与 NRSfM 挑战赛,链接:https://sites.google.com/view/cvpr2017-bridges-nrsfm/home

...

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容