机器之心:就像很多杜克大学人一样,您也信奉贝叶斯定理吗?您认为当一个人思考和研究机器学习的时候会大多数时候用贝叶斯思维吗? Lawrence Carin:杜克大学非常崇尚贝叶斯定理,其中有一个非常有意思的原因。杜克是一个非常年轻的学校,虽然并不是像昆山杜克大学这么年轻,但仍然还是非常年轻的。杜克始终都在排名前十的大学内,而这些排名前十的学校里,大部分都有很长的历史,有些已经建校超过百年。而仅仅只有八十年历史,仍非常年轻的杜克大学,考虑到凡事不能尽善尽美,所以我们必须要有侧重点。 二三十年前,杜克决定向贝叶斯定理发展。我们不可能所有事都有伟大的成就,那么专注并专长于某一方面就尤为重要。恰好当时,贝叶斯定理还没有成为主流。在那个贝叶斯定理还没有传遍世界各地的情况下,使得将贝叶斯定理做到最好就变成了可能。10 年或 20 年前,贝叶斯观点和优化观点或者称之为频率论者观点之间有着非常严峻的竞争,事实上,这两个观点一直都处于斗争中。 然而现在,人们意识到,这两个观点各有千秋,j2直播,他们各自扮演着不同的角色,发挥着不同的价值。两者的竞争也在逐渐消失。在机器学习中,优化观点和贝叶斯观点之间的分歧也并不像曾经那么引人注目,而且也不像在统计学中那么显眼了。在任何情况下,贝叶斯观点在机器学习中都是非常强的。 机器之心:您在机器学习领域展现了极强的数学能力,您也同样很关注理论方面的东西,您对于深度学习的效率方面是怎么看的呢?数学的哪个方面能够解释深度学习?在您心中,哪一个理论能用来解释深度学习呢? Lawrence Carin:我们没有一个明确的理论支撑。正如我所说,两年前我决定开始了解深度学习时,我的目标不是来写论文而是纯粹的理解。所以我认为,渐渐地,深度学习不会再神秘,这也是我一直在向学生们传达的东西。我在之前发表的公开演讲提到了深度学习,用图片和图形来解释了深度学习,这些都是毫无疑问地想向听众传达为什么深度学习是成立的。 和深度学习最接近的是小波。小波是几年前由杜克大学的 Ingrid Daubechies 教授发现的数学领域内的一个理论。小波是一个多角度的数据表达,深度学习也正是如此,多角度的表达。这两者既有区别又有联系。这很有意思,因为深度学习能很好地解决现实问题。所以然和领域都是一个阶段一个阶段发展起来的。大概在七年前,在深度学习还没有出现之前,在机器学习领域最流行的是理论,你必须有证据,你必须有理论支持。那时对于理论是很强调的。结果就是出现了压缩传感。压缩传感在深度学习出现之前是有很大意义的。 压缩传感流行的时候,我很想去理解压缩传感,所以我们研究了压缩传感。大概在 5-7 年前,做研究必须要有理论支撑。有一次有一些研究深度学习的人来找我,他们没有理论,没有定理,但他们有很好的结果成绩。他们真正的改变了机器学习的范例。现在,研究的重心都在于得到好的结果,在于做一些在现实中有意义的事情。当你研究理论的时候你要估计要猜测,但这些可能在现实世界中并不适用。但无论何时我们解决很大规模也很复杂的实际问题的时候,人们是没有耐心研究定理的。就像「好吧,你去研究你的定理吧,做完了告诉我一下。我要去解决实际的问题了。」所以在这就有了一个心态上的变化,这种变化在我看来是很有益的。我觉得之前太侧重理论了,但之后肯定还会出现侧重理论的时候。 有意思的是,当 Yann LeCun 和其他团队研究深度学习的时候,他们说「深度学习真好啊」,他们当然会说深度学习好因为他们就是研究这个的。但无论什么时候别人,就像我,不是第一代开创深度学习的人来研究深度学习的时候,深度学习是成功的。我们就像是独立的验证程序一样,都说深度学习是成功的。你研究的越多,就能得出越多的例子,当你把深度学习应用到实际问题的时候,你会得到很好的结果。当你一遍一遍看这些结果的时候,你就会意识到,深度学习并不是一种转瞬即逝的潮流,而是会一直存在,成为我们的工具箱里的一种工具,不会消失,它是非常真实的。经过一段时间,我们会有一些理论,但这些理论很可能也不会脱离现实。有一些很有意思的故事如果有时间我会讲给你。但是在理论和实践之间肯定有一些妥协,但现在实践是占了上风的。 (责任编辑:本港台直播) |