晚宴的重要时刻即大会颁奖,本次的最佳论文及提名,和最佳学生论文均授予了传统计算机视觉研究问题,而非深度学习。一则可以看出深度学习相关研究目前难度日益加大,欲做出有突破性进展的工作不易;二则可以看出 CV 大佬有意扶持传统研究问题,维护 CV 生态平衡,不致 DL 一家独大。
另外,开奖,Koenderink Prize(ECCV「十年最佳论文」)授予了著名的 SURF: Speeded up robust features (ECCV 2006) (Herbert Bay, Tinne Tuytelaars and Luc Van Gool) 和 Machine learning for high-speed corner detection (ECCV 2006) (Edward Rosten and Tom Drummond)。值得一提的是,在宣布 SURF 获奖之际当即引来一片欢呼,可见其工作深入人心之甚。PAMI Everingham Prize(CV 领域的最佳贡献奖)分别授予了 ImageNet 数据集团队和 Ramin Zabih 以表彰其在开源数据集,和服务 Computer Vision Foundation 上的卓越贡献。 干货时间 开会数日,笔者有心记录了一些会议观察,在此与君共享。不过受个人研究兴趣影响,以上内容不免有所偏颇,望诸君选择性参考。 1. 这次会上大佬们如 Jitendra, Cordelia 在力推 self-supervised learning(基于 robot 反馈机制,例如,机械手臂戳一下物体,从 sensor 或视频中获得反馈,可以看作是用 robot 来探知世界吧),最近 arxiv 也有一篇类似的 https://arxiv.org/abs/1605.07157;另外,很多利用 side information,如利用声音辅助视觉,这样的工作在本次 ECCV 上也屡见不鲜; 2. 冠名弱监督学习(Weakly supervised learning)的工作非常多了,但是「弱监督」的内涵却是个圆其说,不像机器学习中有明确的定义;因此,以后基于弱监督设定的计算机视觉问题还应该有做的空间; 3. 底层视觉(Low-level vision)问题/任务极少,几乎没有,不像 ICCV 2015 还有若干篇的样子;而且一些工作开始用 DL 去做 low-level vision 的东西,比如 Ming-Hsuan Yang 在这次会上的两篇利用 DL 技术学习底层视觉中的滤波器(Filters)。( 和 ) 4. 传统细粒度图像相关工作几乎没有,只有一篇做细粒度图像任务的新问题,即细粒度场景图像分类(Fine-grained scene classification)(https://arxiv.org/abs/1607.07614); 5. 有两篇 image colorization 作为 oral paper,不知是否是巧合; 6. Question answering 这类问题相比 ICCV 少了很多,但隐式做 visual-text 的工作还是占了一定比例; 7. 下面几篇文章做的问题比较有趣: a) Amodal instance segmentation, Ke Li and Jitendra Malik.(构造新数据集,做了新问题) b) Automatic Attribute Discovery with Neural Activations, Sirion Vittayakorn, University of North Carolina at Chapel Hill; Takayuki Umeda, NTT; Kazuhiko Murasaki, NTT; Kyoko Sudo, NTT; Takayuki Okatani, Tohoku University; Kota Yamaguchi, Tohoku University c) Pixel-Level Domain Transfer, Donggeun Yoo, KAIST; Namil Kim, KAIST; Sunggyun Park, KAIST; Anthony Paek, Lunit Inc.; In So Kweon, KAIST (根据衣服生成买家秀,或反过来,在真实场景下,从模特照片中生成产品照片) 最后,总结来说,这次参会最明显也是最微妙的一个感受就是,多数工作在开会前都没有看过。而不像前两年参加顶会时发现绝大多数文章已经是 arxiv 上读过很久的工作,甚至已经跑过源码,去开会也只是和作者当面聊聊天,甚至当时还有一种顶会更新速度落后于 arxiv 的感受。ECCV'16 这一现象恰恰说明深度学习研究的发展慢慢从当初的白炽化走向正常化,从着急忙慌的在 arxiv 上占坑走向踏踏实实的顶会发表。另外也从侧面显示了深度学习研究难度的提升,就拿 arxiv 举例,一年前几乎每天都能看到有令人 exciting 的文章更新出来,而近期不仅发布文章的数量有所下降,重要的是有趣的文章更是难得一见。这次会上也与众多老友把酒言欢,同时也认识了很多新朋友,期待下次的 CV 大趴,我们 CVPR'17 再见。 10 月 30 日于澳大利亚阿德莱德 (题图为笔者摄于 Zaandam 风车村) 作者简介: 魏秀参:南京大学计算机系机器学习与数据挖掘所(LAMDA)博士生,研究方向为计算机视觉和机器学习。曾在国际顶级期刊和会议发表多篇学术论文,并多次获得国际计算机视觉相关竞赛冠亚军,另撰写的「Must Know Tips/Tricks in Deep Neural Networks」受邀发布于国际知名数据挖掘论坛 KDnuggets 等. 微博 ID:Wilson_NJUer ©本文为机器之心专栏文章,转载请联系本公众号或作者获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |