同时, Deep Patient也让人困惑。它在预测精神分裂症方面出奇地出色。但是医生诊断精神分裂症比较困难是众所周知的,Dudley想知道,它是怎么做的。但他失败了。这种新的工具,没有给他提供任何线索,它是怎么做到这一点的。像Deep Patient这样的程序,如果实际上我们是想要它来帮助医生,那最理想的模式,仍然是给出预测理由,来保证结果是准确的,并且作为证明,例如,来修改患者用药。“我们可以建立这些模型,”Dudley沮丧地说,“但我们不知道它们是如何工作的。” 人工智能并不总是这样。从一开始,就有两个关于AI应该如何理解和解释的学派。很多人认为,根据规则和逻辑推理机器是最有意义的,即它们的内部工作对任何想检查某些代码的人来说,都是透明的。另一些人则认为,如果机器是从生物学中获得灵感,那么通过观察和体验学习,智力就会更容易出现。这意味着对计算机编程的颠覆。不是程序员编写命令来解决问题,而是程序基于数据,在自己的算法的基础上,生成结果输出。机器学习后来演变成今天最强大的AI系统,遵循的就是后一种途径,机器就是程序。 起初,这种应用还是有限的。在20世纪60-70年代,它还主要是集中在一些边缘领域内。但覆盖众多行业的电子化和数据化进程,激发了更强大的机器学习技术的发展,特别是神经网络技术。到了上世纪90年代,神经网络已经可以将手写字符转化成数字字符。 然后直到最近10年,经过多次调整和改进,“大”而“深”的神经网络在自动感知方面获得了巨大的进步,深度学习成为今天的AI爆炸的主要推动力。它赋予计算机非凡的能力,比如说几乎可以像人一样熟练地识别出语言的能力。深度学习改变了计算机视觉,大大改进了机器翻译。它现在已经被用于指导医学、金融、制造业和其他领域的各种关键决策。 任何机器学习技术的运作本质上是不透明的,对计算机科学家来说也一样。但这并不是说所有的人工智能技术,在未来都将同样不可知。但从本质上看,深度学习还是一个特别黑的“黑箱”。 你不能从神经网络内部看出它是如何工作的。神经网络由成千上万个神经元构成,它们排列成数十甚至上百个错综复杂的互连层。第一层中的神经元各自接收输入信号,j2直播,例如图像中像素的强度,然后在输出新信号之前进行计算。这些输出在复杂的网络中,被再下一层的神经元所接收,直到产生一个整体结果输出。此外,还有反向传播,通过反馈调整单个神经元,达到期望输出。 深度神经网络中的许多层使它能够在不同的抽象层次上识别事物。例如在识别狗的系统中,较低层识别简单轮廓或颜色;更高层识别更复杂的东西,如毛皮或眼睛;最上层将它作为狗标注。简单地说,同样的方法也可以应用于机器引导自己的其他输入:在语音中构成单词的声音,在文本中创建句子需要的字母和单词,或自动驾驶所需的方向盘运动。 为了尝试去捕捉和解释在系统中发生了什么,研究员们应用了巧妙的策略。2015年,谷歌的研究人员修改了一种基于深度学习的图像识别算法,这样就不会产生照片中的对象,而是生成或修改它们。通过有效地反向运行该算法,他们可以发现该程序用于识别,例如,鸟或建筑物的功能。 由此产生图像的项目,被称为Deep Dream,它能表现出各种怪诞的图形,云彩和植物中出现像外星人一样的动物,在森林和山脉中绽放出幻觉一样的宝塔。这些图像证明,深度学习并不是完全不可思议的,它们显示出算法也需要熟悉的视觉特征,比如鸟喙和羽毛。但这些图像也暗示了深度学习与人类感知的不同之处,比如它可能会让放大我们知道但是忽略的东西。谷歌研究人员指出,当它的算法生成哑铃的图像时,它也生成了一个人的手臂,因为机器断定手臂是这东西的一部分。 从神经科学和认知科学借鉴来的思路已经使得研究取得了进一步的进展。怀俄明大学助理教授Jeff Clune带领的团队,采用光学错觉的AI测试了深度神经网络。2015年,Clune团队展示了他们的发现,某些图像可以愚弄网络,让它们感知到不存在的事物,因为图像利用了系统搜索的低层次模式。Clune的一位合作者,Jason Yosinski,还建立了一个工具,就像一个探针插入大脑,针对网络中的任何神经元,搜索最激活它的图像。这个图像被发现是抽象的(想象一个写意的火烈鸟或校车),这更突出了机器的感知能力的神秘性。 纽约布法罗,大约1960年的康奈尔航空实验室,早期的人造神经网络 (责任编辑:本港台直播) |