本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

Adobe首席科学家王珏加盟Face++,主管旷视美国研究(3)

时间:2017-08-12 21:10来源:118图库 作者:开奖直播现场 点击:
在和王珏博士的交流中,“落地”这个词出现了好几次。“要做研究,首先要研究清楚自己”,王珏博士这样说。“研究分为很多种,有理论研究,基础技

在和王珏博士的交流中,“落地”这个词出现了好几次。“要做研究,首先要研究清楚自己”,王珏博士这样说。“研究分为很多种,有理论研究,基础技术研究,基于好奇心的探索性研究,也有面向应用的研究。每个人的喜好和特长是不一样的,应该选择适合自己的研究道路。我是一个比较纯粹的实用主义者,所以特别喜欢应用驱动的研究,通俗的讲,就是能落地的研究。”

在王珏博士看来,能落地首先是选题的问题。“伟大的实用技术都有一个最基本的要素,就是他们解决的问题一定是用户的刚需。要做能落地的研究,首选需要理解和关注用户的痛点。工业界实验室之所以能诞生很多实用技术,是因为他们更贴近用户,理解什么是真正对用户有价值的问题,而不是闭门造车。” 在进入 Adobe 规划第一个项目之前,王珏博士花了一个月的时间走访了多家使用 Adobe 产品的影视机构,观察他们的工作流程,倾听他们对现有产品的吐槽,这才将动态视频去背景这个全行业的痛点作为首要研究的课题。

落地是一个艰难的过程。在王珏博士看来,一篇优秀的学术论文最多只解决了一半的问题,在落地过程还有大量的细节难关需要攻克,而攻克这些问题既需要灵感和巧妙的解决问题的思路,也需要大量的工程经验与实践积累。有的时候,甚至需要全盘推翻学术论文里面提出的解决方法。在2016年做全景图拼接的边缘正则化这个项目中,王珏博士带领团队在研究了学术界最新研究成果后,提出了一种巧妙的替代算法,实现了计算速度百倍的提升,也使得这个研究成果成为今天 Adobe Lightroom 里面广受欢迎的新功能。

“有一次在一个国际会议上遇到一家大公司 AI lab的manager, 聊天的时候我感叹我自己参与的项目只有大概 25% 的成功产品转化率,那位 mananger 很惊讶,因为他们那里这个数字只有大概 10%。” 王珏博士未来的目标,就是将这个转化率翻一倍,希望能达到 50%。

新智元对50%的成功产品转化率感到好奇,王珏博士进一步解释说,要达到这个目标,核心还是在团队的构建。如果单单是把10个顶级视觉专家放在一起,那么这个目标是没法达到了。一方面是团队必须包含从初期研发到最终落地所需要的全部人才,更重要的一点,是每个团队成员都要认可研究落地这个共同目标,并为之努力。特别是对科学家来说,能够放下身段,倾听客户的声音,从客户需求中去寻找自己的研究课题,才能保证研究的实用性。这也是华为精神在旷视内部广受推崇的原因。

计算机视觉的未来:有必要跳出视觉的圈子,从大系统的角度来看视觉,才不会有“只缘生在此山中”的错觉

作为在计算机视觉技术上有着多年积累的资深研究者,atv,王珏博士也与新智元分享了他对当下这一技术发展趋势的看法。

首先,今年的CVPR上,ImageNet大规模图像识别比赛被宣布终止,有专家解读说,未来业界会朝向视觉理解进军。那么,王珏博士如何看待计算机视觉的未来?

他说:“计算机视觉近几年发展很快,也有很多人预测未来的发展方向,我觉得他们说得都很有道理。我只想提一点,有的时候有必要跳出视觉的圈子,从大系统的角度来看视觉,才不会有“只缘生在此山中”的错觉。最近比较火的无人车和无人店就是很好的两个例子,两个都是系统工程,视觉是重要一环,但是如何将视觉技术和其他技术有效融合,才是其是否能成功的关键。”

从视觉本身这个领域来看,王珏博士觉得基于视频的视觉理解是一个重要的中长期方向。他说,现实世界中没有生物是通过一张静态图片来认知的,这个世界的很多规则和信息都包含着时序序列中。举个简单例子,你和一个人面对面交谈,他的复杂情绪变化你很容易从微小的面部表情感知。而拍一张图片,大家喊一句“茄子”就可以蒙混过关。对于视频的精细化理解,目前还处于起步阶段,还有很长的路要走。

计算机视觉在中国存在过剩吗?

计算机视觉技术在中国非常火热,有资料统计,几乎一半以上的AI公司都在这一领域发力,那么,在中国市场,这一技术存在过剩吗?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容