我们可以给出一种解释:那就是投影子空间选得不够,因此即便是在这些子空间上边际概率分布相似,但是联合概率分布依然相差很大。深度神经网所得到的训练集是自然图像,图3这些图像都在自然图像空间之外,但是投影在所选择的子空间后,自然图像和非自然图像无法进行分别。由此,引发了深度神经网络脆弱性。
图4. 视网膜到大脑皮层的映射是保角变换。(A. Fazl, S. Grossberg and E. Mingolla, Visual Search, Eye Movements and Object Recognition) 讨论 人类的低级视觉在很大程度上依赖于统计特性,因此可以归结为对概率分布的处理和演算。人脑是否真的在计算最优传输映射、计算Wasserstein距离?在历史上,人类经常首先发现某些数学原理,然后又发现这些原理在生物器官上早已应用。例如,人类首先发现了傅里叶分解原理,然后发现人类耳蜗神经结构就是在对声音信号进行傅里叶分解;又如,人类首先发现了保角变换(共形变换),后来发现从视网膜到第一级的视觉中枢就是保角变换,如图4所示。这项工作曾经获得过诺贝尔奖。因此,如果若干年后,人们证实大脑的确在计算概率分布之间的距离,老顾也不会觉得意外。 因此,我们相信在一些视觉应用中,深度神经网络隐含地构建概率模型,我们可以直接用概率的工具,例如最优传输理论及其各种降维近似,直接取代神经网络,从而使得黑箱透明。 ©本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |