Now, what wrong with TrueNorth? My main criticism is that TrueNorth implements networks of integrate-and-fire spiking neurons. This type of neural net that has never been shown to yield accuracy anywhere close to state of the art on any task of interest (like, say recognizing objects from the ImageNet dataset). 简单的说,问题出在Spiking Neural Networks。Spiking的中文可以叫做脉冲,用现代的生物医学技术发现,spike是人脑中信息传递的真实电学过程。下图就是人脑中一个神经元附近测到spike信号: 医学上,也叫这个信号为细胞膜动作电位(Action Potential)。事事以脑科学为准绳的TrueNorth,自然在这基础理论上一定是向生物学看齐的。可是,问题便在于,在神经网络被提出来的前几十年,就是这spike NN的英魂不散,才导致了其早期“食之无味,弃之可惜”的尴尬地位。 就像那个最有名的比喻:因为鸟的翅膀,让人类渴望飞翔;但放弃对翅膀的模仿,才让飞机真正飞上蓝天。很多事物只能赐予灵感,却无法100%照搬,否则下场就是那些个鸟人。(这话也不是我这种小辈敢说的,同样来自Yann大人) Memristor,吴下阿蒙? 一方面,如果spike完成神经信号的传递与运算真的有问题,那人类为什么聪明? 另一方面,如果SpikeNN真的100%模仿了我们的脑子,为什么连个ImageNet分类都分不清楚?一定是哪里出了问题。答案是后者。 首先,在我们通常使用的神经网络里面有个假设——系数(Weight)在训练完成后是固定,不改变的。这个假设在CNN/RNN等一系列架构中显得天下太平,因为系数位宽大么。但是到了SpikeNN就是个大麻烦,所有的信号是二进制的,所谓的系数只改变链接关系、延时,不改变幅度,自由度大大衰减。那我们的脑子真的是这样的么? 唉,生物课又来了。 虽然我们的大脑的神经元看上去是二元的,但是神经元通路还有一个可塑性维度,叫STDP (Spike Timing Dependent Plasticity),就是突触的连接强度(Plasticity,可塑性)收到输入输出脉冲(Spikie)间的时间先后(Time Dependent)关系,其本质核心如下图。 如果输入将将早于输出,代表输入输出间是完美的因果关系,神经元联系会被增强;如果输入的脉冲稍晚于输出,那么他们之间是果因关系,神经元的联系应该要减弱。STDP被认为是我们大脑的主要学习机制,而且在不同动物上都经过了实验验证。 问题来了,这种学习机制和CS里面主流的学习机制——Stochastic Gradient Descent (SGD,中文叫做随机梯度最速下降?) 的后馈算法有着天壤之别。小编觉得这也是目前神经网络算法与神经科学的最大分歧。 没有STDP的真北就这样陷入了SpikeNN的坑。但话说回来,STDP这么高级的操作模型,用传统模数混合集成电路实现是非常浪费面积,且不划算的。好巧不巧,人类突然造出了一个除了电阻电容电感之外的第四类电学器件——Memristor,忆阻器。仿佛是上帝要有光,就有一缕阳光照进SpikeNN的黑暗的胡同里。 对于一个电阻,两端的电压和电流成正比,对于一个电容,两段的电荷和电压正比,对于一个电感,两端的磁通量和电流正比,对于一个忆阻器,就应该是两端的磁通量和电荷成正比。虽然很抽象,但是忆阻器的实际效果就是其电阻(导通强度)受流过的电流调制。这个效果已经非常接近STDP了。 试想,连在忆阻器两端的突触,当设定为上一层的神经元先发生spike,而下一层后发生spike,atv,那一个正向的电路流过忆阻器,减小忆阻器阻值,加强链接。反之,负向电流流过忆阻器,增大阻值,减缓链接。 于是,大家逐渐开始相信,在真北架构上如果能用可随摩尔定律减小的微纳尺寸忆阻器,或许才是Brain Inspired Computer真正焕发春天时候。 于是,兼容先进集成电路的高性能忆阻器就成了问题的关键。但是,直播,作为memristor的发明者和最努力的推广者——HP,最近好像有点无奈。 (责任编辑:本港台直播) |