颜水成:我认为对创新还是非常有价值的。任何一个领域,原创和创新需要一个平台去展现去证明,就像比武一样,需要一个正式的、外界所认可的场所,如果在这个场所做的比较好,那么就能很好的证明你的能力。算法也是一样,如果各自收集各自的数据做测试,就没有可比性了。现在有一个固定数据集,别人已经做了实现了,我只需要把自己的实现做出来,就可以证明有效性了,省去了研究者重现别人算法的困难。所以这种竞赛对于创新和原创的速度起到了促进作用。 边缘计算模型的“内功”、“兵器”和“暗器” “网络好...这是硬功夫,是内功;低精度表示...就像武器;巧妙去掉不需要计算的部分网络:就像暗器。这三种方法是相辅相成的” 新智元:DPN是高性能、低资源的一种模型,是否适用于移动终端? 颜水成:任何一种网络结构都可以用在移动端,只不过会针对移动端特点对网络结构进行特殊的设计,例如ResNet,AlexNet、GoogleNet,我们都在移动端用过。 新智元:DPN的计算量降低了很多,是否因为这种网络拓扑结构更好?本质上,改善性能或者减少资源消耗是否主要在于优化网络的拓扑结构? 颜水成:在移动端,加速有很多方式,我个人偏向总结成三种: 1. 网络好:设计一种结构好的网络,少量参数取得很好的结果,这是硬功夫,是内功; 2. 低精度表示:把数据从32/64位表示降到更少位的表示,就像武器; 3. 巧妙去掉不需要计算的部分网络:就像暗器。 就像我们的论文《More is Less: A More Complicated Network with Less Inference Complexity》里面的工作,专门为移动端做的设计。我们把网络结构变得更复杂,用low cost的网络去决定哪些位置的卷积不用算,降低了线上推理时候所需要的计算量。 这三种方法是相辅相成的,一种可以帮助另外两种,大家从不同维度降低计算量。 新智元:最近边缘计算比较火热,您怎么看待AI模型往移动端发展,这是否是一个真实的趋势? 颜水成:趋势完全是由人工智能发展的需要决定的。大家都希望最终能落地,一种是2B,一种是2C,2B的量暂时不是特别大。 你想每年的移动终端例如手机的量有多少,要人工智能落地的话,最好在手机上。这样就要满足计算资源的限制要求,充分利用硬件计算的特点,为专门的硬件做定制化加速。 计算机视觉的十几载,研究的问题没变太多 “新加坡国立大学候任校长陈永财曾问我在工业界怎么样,我的回答是:tiring but exciting” 新智元:您是什么时候开始进入计算机视觉领域?可以谈谈这些年研究CV,您的最大体会嘛? 颜水成:我做计算机视觉是从2001年开始,十六年整了。我的第一位导师是李子青教授,后来跟张宏江博士做计算机视觉和多媒体,在微软亚洲研究院待了差不多三年半。 新智元:十六年最大的体会是什么? 其实计算机视觉研究的问题变化不大,比如人脸分析的所有问题,十六年前都在研究了。但是方法起码经历了三代发展:最早是做子空间分析和流行分析,那个时间段出现了很多子空间学习算法,例如很多PCA+LDA的变种。第二代就是由马毅教授引领的,稀疏和low-rank。最后就是深度学习的出现,把整个领域带到了另一个新的level。 新智元:您入职奇虎360已经将近两年了,你对这段经历有什么感受?有没有达到您当初进入产业界的目标或者是否符合您的预期? 颜水成:我当年加入360最吸引我的是智能硬件这一块,软硬件结合是计算机视觉的一个大方向。 企业界和学术界的差异很大,我也花了不少时间来适应。新加坡国立大学候任校长陈永财曾问我在工业界怎么样,我的回答是:tiring but exciting。过去的这段时间大部分都是九点半之后才回家,一周大多工作六天。 特别前沿的至少半年以后才会考虑落地的研究领域我们会跟学术界合作,通过联合实验室做研究。例如跟新加坡国立大学Feng Jiashi教授组立联合实验室,在企业研究院的团队主要关注业务线上具体的需求,用AI给现有业务赋能,同时跟业务部门一起孵化新的AI产品。 新智元:我们了解到您有很多优秀的学生,可以介绍一下他们嘛?有哪些您认为特别优秀的? (责任编辑:本港台直播) |