华刚博士的研究重点是计算机视觉、模式识别、机器学习,人工智能和机器人,以及相关技术在云和移动智能领域的创新应用。他是通过对语境建模使用弱监督或者无监督方法解决无限制环境下计算机视觉问题的倡导者,其研究在学术界和工业界都产生了广泛的影响。华刚博士在2008年创立和奠基了微软的人脸识别引擎,现在已发展成为微软认知服务(Cognitive Services)中的人脸识别应用程序接口(Face API)。 在学术方面,华刚博士已在国际顶级会议和期刊上发表了130多篇同行评议论文。他将担任CVPR 2019的程序主席,以及CVPR 2017和ACM MM 2017的领域主席。不仅如此,华刚还担任过CVPR 2015、ICCV 2011、ACM MM 2011/ 2012/ 2015、ICIP 2012/ 2013/ 2015、ICASSP 2012/ 2013等十多个顶级学术会议的领域主席,以及IEEE Trans. on Image Processing(2010-2014)的编委。目前,华刚博士还担任着IEEE Trans. on Image Processing、IEEE Trans. on Circuits Systems and Video Technologies、IEEE Multimedia、CVIU、MVA和VCJ的编委。 2011年,华刚博士在国际顶级期刊IEEE Trans. on Pattern Analysis and Machine Intelligence(IEEE模式分析和机器智能汇刊)领导组织的“现实世界人脸识别”专刊,对推动无限制环境下人脸识别的研究产生了深远的影响。因其在图像和视频中无限制环境人脸识别研究所做出的杰出贡献,2015年华刚博士被国际模式识别联合会(International Association on Pattern Recognition,IAPR)授予“生物特征识别杰出青年研究员”。2016年,华刚博士被评选为IAPR会士(IAPR Fellow) 和 ACM杰出科学家 (ACM Distinguished Scientist) 人才流失?微软能自己培养AI人才 新智元:微软被誉为“AI黄埔军校”,当前巨头间人才竞争激烈,微软成为“挖角”最佳目标,腾讯甚至把研究院开到西雅图的微软对面。您为什么选择继续留在微软?在人才的吸收、培养和保留方面,您认为微软如何保有竞争力? 华刚:我选择留在微软,主要还是喜欢这里耐心、包容、重视人才的氛围。能在一个开放、多样化的环境里工作,每天都能学到新的技能,我觉得很开心。在微软的研究院,年轻人成长速度一般都比较快,这也是因为院里对员工重视程度很高, 给予员工比较大的自由成长的空间,和各方面技能培训的机会。我是“70后”,觉得研究是高尚的职业,但现在年轻人成长环境不同,选择也跟我们当初有很大变化。例如,很多年轻人毕业就选择出来创业,这也许是社会、经济发展的必然,这是正常的现象。不过,微软研究院的优势在于能够自己培养人才,这个核心能力很关键,我们能吸引和培养对研究真正感兴趣的人。当然,我们也跟产品部门有深入的沟通——计算机视觉是微软研究院成立最早的一个研究方向,微软会在计算机视觉方面的研究和相关产品的开发上持续投资。微软亚洲研究院的计算视觉组也会两条腿走路,对学术界和对微软本身视觉相关的产品持续地做出贡献。作为一名研究员,能看到自己做的事情产生影响(impact),比如用在了产品里,或者获得了某个会议的最佳论文,又或者技术被很多人使用,这些都让人充满成就感。 arXiv让双盲同行评议形同虚设 新智元:您怎么看以arXiv为代表的这类非同行评议的论文库,以及将论文上传到arXiv这种行为?媒体应该如何对待arXiv上的论文? 华刚:在2015年以前,我是从来没有把论文发布到arXiv上的。实际上,我所认识的很多稍微传统,或者“老派”(笑)一点的研究员,都不会将论文在同行评议完成之前过早的发布到arXiv上。不过,2016年起,我和一些同事也会把尚未发表但相对成熟的工作发布到arXiv上。这样确实加快了交流讨论的速度,但由于没有经过同行评议,所以,arXiv上论文的质量鱼龙混杂,其中有些论文的观点是不一定正确的,或者带有偏见的。如果媒体希望报道arXiv上没有经过同行评议的论文,而编辑部本身没有专业领域的研究人员,我的建议是综合作者提供的信息,以及各个论坛像Hacker News、Reddit、Twitter的讨论,如果有条件还应该邀请几位相关领域的专业的研究人员写评论,尽可能的将信息客观、全面的地传达给读者,避免产生误导。 新智元:最新一期Science封面论文Deep Stack,也是很早就上传到arXiv了。 (责任编辑:本港台直播) |