本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【j2开奖】新智元专访CVPR2019程序主席微软华刚 :arXiv让双盲评审形同虚设,单纯刷分把研究机械化,暴力(8)

时间:2017-05-14 23:35来源:香港现场开奖 作者:本港台直播 点击:
至于单个公司是否能赚钱,实际上当前人脸识别的技术门槛并不高,这样技术壁垒就很难建立起来。单纯通过增加训练数据和加深网络深度已经对进一步解

  至于单个公司是否能赚钱,实际上当前人脸识别的技术门槛并不高,这样技术壁垒就很难建立起来。单纯通过增加训练数据和加深网络深度已经对进一步解决人脸识别这个问题和进一步的商业应用并不能提供更多的帮助。即便有技术基础的公司,如果没有找到合适的商业应用场景,没把握住市场发展的趋势,那么碰到困难的可能性也很大。

  不过,作为一个研究领域,计算机视觉正处于上升趋势,在研究领域一年后应该会继续蓬勃发展。无论在中美,政府部门对这个研究领域的投入也在加强,例如美国政府IARPA的JANUS计划,这是美国政府最近资助的无限制条件式人脸识别的研究。Facebook在2014年时首次推出了DeepFace,那是他们结合从2006年就开始做的让他们的用户在自己的在线相册里面标注他们的朋友,这么多年积累下来的一个人脸数据库——当然,在2014年时他们的技术并不完美,但DeepFace无疑将整个人脸识别往前推进了一大步。2007年,我开始在微软做人脸识别的研究并在2008年创立并奠基了微软的第一个完整的人脸识别引擎,现在已经持续发展并整合成为微软智能云平台认知服务里的Face API。

  新智元:从您的专业角度看,这几年的CV发展趋势是怎么样的,近5年,近10年,近30年?您对未来3~5年计算机视觉领域的发展有什么期望吗?

  华刚:这是一个很大的问题。计算机视觉作为一门科学最早于1955年提出。真正意义上现代计算机视觉的研究实际上是从20世纪70年代年末80年代初开始的。美国政府DARPA当时设立了一个图像理解研究项目(DARPA Image Understanding Research Program),早期很多计算机视觉研究者都接受并得益于DARPA的资助。当时DARPA的Image Understanding Workshop也是早年计算机视觉研究从业人员的一个主要平台。可以说是DARPA的这个图像理解研究项目奠定了现代计算机视觉研究的基础。随后第一届CVPR在1983年举办,ICCV则是1987年,为全世界的计算机视觉研究者提供了更大的交流舞台。

  计算机视觉实际上是一门涵盖很广的学科,主要分为4个层次的任务:①图像获取,比如各种成像方法,怎么制作摄像头获取图像,包括红外摄像头、深度摄像头;②图像处理,这也是通常所说的低级视觉的问题,主要在像素级上进行处理,比如图像变换、滤波;③图像分析,这算是中级视觉的问题,通过分割和特征提取,将像素图像描述转变为比较简洁的描述,常见的纹理分析、运动、分割、3D视频,都属于这类;最后是④图像理解,也是通常所说的高级视觉的问题,包括物体识别,行为识别,和语义分割等等。

  一直以来,计算机视觉研究者都致力于从下往上打通这套系统(pipeline)。过去10年,大部分研究集中在物体识别(object recognition),主要的方法是统计机器学习的方法和大规模图像数据库的结合。虽然我不喜欢用“热门”这个词,但过去5年,深度学习确实很热门,在ImageNet 图像数据库也取得了很好的成果。不过,计算机视觉有过很多种“流行”方法:2001年到2007年,Boosting和SVM是最受欢迎的方法;2007年到2012年则是基于稀疏表征的识别;2012年以后,深度学习的潜力被充分发挥出来。这些其实都属于统计机器学习,统计模式识别的方法。作为计算机视觉研究者,我不希望大家一提到“计算机视觉”就只想到“图像分类”。这些年,计算机视觉的每个领域都在向前发展,比如微软的Kinect Camera,能在成像过程中自动获取像素的景深。希望大家综合了解整个领域的发展,不要把计算机视觉的研究机械化成为是机器学习的一个简单应用。我不觉得单纯增加数据库或神经网络层数是解决高级视觉问题的正确途径。任何方法,必须要结合计算机视觉的领域知识(domain knowledge),充分利用图像,视频数据本身的特性,才能在计算机视觉研究方面取得真正的进展。

  至于未来的发展,这并不好“预测”。我个人的观点,图像理解仍然会是近期关注的热点。再长远一些,计算机视觉实际上是人工智能的一个分支。早些年,计算机视觉也好、自然语言处理也好,大家都是投稿到AAAI。经过一段时间的发展,各个分领域都有了各自的会议,比如计算机视觉有了CVPR、ICCV,自然语言处理有了ACL……俗话说“天下大事合久必分,分久必合”,我相信未来语音、视觉、包括自然语言等再度融合的可能性很高。因为如果我们的目标是要做一个AI系统,它必定是多模态的,多个层面多种模块的结合。所以,在CVPR未来我们可能看到AI子领域相互融合,或者说朝着通用AI这个方向的研究会越来越多。

  ©?本文为新智元原创文章,未经授权请勿转载。在新智元后台回复“转载”了解转载规则。

新智元招聘

  

职位:客户总监

  职位年薪:30 - 60万(工资+奖金)

  工作地点:北京-海淀区

  所属部门:客户部

  汇报对象:COO

  下属人数:8 人

  年龄要求:25 岁 至 40 岁

  性别要求:不限

  工作年限:5 年

  语 言:英语 + 普通话

  学历要求:全日制统招本科

  职位描述:

热爱人工智能,在行业内有一定的人脉资源和影响力;

为客户制定媒体关系策略和公关活动策划,达成客户的市场或传播目标;

负责监督公关项目的计划和实施,使项目能按期在预算内完成;

积极拓展客户资源,开发公司业务,与既有客户保持紧密的业务联络和沟通;

监督、管理及考核客户服务团队,全面提升公司客户服务质量;

理工科背景优先,有知名企业或知名媒体机构工作经验者优先。

  应聘邮箱:[email protected]

  HR微信:13552313024

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容