根据老顾的师兄、数届国际计算机视觉和模式识别大会(CVPR)主席、加州大学洛杉矶分校统计学和计算机科学系的朱松纯教授提出的计算机视觉科研范式:模型、算法和实现,我们用模空间的黎曼几何层面给出了曲面配准问题的理论模型。从算法角度而言,将抽象的纯粹数学理论转换成离散的算法,这本身就非常具有挑战性。经过多年的努力,老顾与其众多合作者们,特别雷诺铭教授、曾薇教授、Mayank Goswami教授在丘成桐先生的指导下系统地发展了计算拟共形几何方法,提出了拟共形映射,泰西米勒映射的算法[1][2][3]; 近期和雷娜教授发展了全纯二次微分和曲面叶状结构的算法,郑晓朋博士起到了关键的作用[4]。在医学方面,三维人脸配准对于牙齿整形、颅面整形、美容手术、皮肤黑色素瘤预防诊治等领域都会有所帮助;在动漫动画领域,三维人脸配准对于表情捕捉、特效制作等极具潜力。 虽然三维人脸配准问题的近期解决方案依赖于微分几何方法,但是从长远来看,机器学习的方法不可或缺。模空间理论给出了所有可能出现的曲面形状,和所有可能的微分同胚。但是所有真实的人脸,和真正能够物理上实现的表情变化应该只是其中的极小部分,有可能是一个子流形。我们需要一个定义在模空间上的概率密度来刻画物理可实现的人脸曲面和人类表情,更为精细地,atv,我们需要得到正常人脸表情和反常表情(例如自闭症患者的表情)的概率描述。这些概率密度的获取一方面依赖于物理建模和力学模拟,但是更为切实可行的方法是应用机器学习来获取。 综上所述,我们看到对于三维人脸曲面识别、配准、表情分析而言,微分几何方法和机器学习方法,各有千秋,相辅相成! 后记 2016年是深度学习方法迅猛发展的一年,更是资本全面介入这个学术领域的一年。机器学习方法正在颠覆传统计算机视觉领域的科研范式,取而代之的是一种基于海量数据,统计算法和计算资源的暴力范式。在这种暴风骤雨般的革命狂潮下,许多经典计算机视觉问题都已经接近解决,至少是突飞猛进,渐渐逼近了商业实用的成熟程度。 学术成果的迭代周期从数年缩短至数周,传统的学术会议和学术期刊的审稿周期远远长于迭代周期,因此绝大多数论文都提交到无审稿的公开archive。因为学术界的计算资源和数据资源匮乏,许多新颖的神经网络模型的验证工作直接交给工业界的巨无霸公司,例如FaceBook,来直接验证。学术空气中充满了躁动亢奋的荷尔蒙气息,数十年的学术经验的积累让位于初出茅庐的骇客精神,理论修养的积淀难敌参数调节的技巧。机器学习的狂潮几乎席卷了几乎所有年轻学子的心灵,很少有人会愿意花费数年学习微分几何的理论,而是热衷于短期就可以掌握机器学习的技能,从而早日投身到工业界的人工智能革命之中。 与全民狂热的氛围相反,老顾身边的同事和朋友们表达了各自的隐忧。老顾的同事Dimistris Samaras教授说道:“现在的孩子们上来就学机器学习,遇到任何问题就套用机器学习的范式:准备数据、训练网络、调整参数。他们学会了机器学习,同时头脑被僵化,用机器的蛮力代替了智力的分析。”老顾的另一位同事,医学图像领域的大师Allen Tanenbaum教授说:“在医学领域,精准医疗的宗旨是同样的病症,针对不同的病人的遗传密码和后天发展情况,要用不同的药物治疗。基于大数据统计的机器学习方法无法反映不同病人的特质,无法揭示药物疗效的因果律,因此机器学习方法近期内在医疗领域难以被广泛接受并应用。”医学图像领域的知名学者王雅琳教授这学期教授计算共形几何,他向老顾抱怨道:“做机器学习的学生压根就不想花功夫学习几何,下功夫的也很难短时间学会。这实在是一个困境,这么难学的东西,学会之后也很难进一步发展新的成果,所以我的硕士生全都要跟我学机器学习。” 老顾的师兄朱松纯教授在前不久发布的檄文《正本清源:初探计算机视觉的三个源头,兼谈人工智能》中重新强调了传统计算机视觉的研究范式:模型、算法和实现。朱教授是计算机视觉大师芒福德的高足,在计算机视觉领域,更是继承了芒福德的衣钵。当年,老顾初到哈佛的岁月,同在芒福德的门下,朱师兄给予了无微不至的关怀和照顾,在计算机视觉的学术方面,更是老顾的启蒙人。朱师兄对于视觉有着狂热的热爱,和成熟的哲学体系,并且投射成卓有成效的计算体系。 (责任编辑:本港台直播) |