从艺术的优势点来看,这个实验中是否保留了说话者的含义、知识或正确的语法等并不重要,我只关心声音、材料内容或介质本身。一些神秘的生成文件(uncanniest generated files)几乎是没有声音的,其中仅仅产生介于呼吸和单词之间的细微声音。当神经网络自身内转时,这种咿呀,或称「梦呓」,是突出纯语音元素的一个极佳方法。它还能明白对于一种语言来说,什么是独一无二的特质;因此如果一门语言消失了,那么对于问题可能的答案也就消失了。 最后,我不会标榜我实验的成功。它们只是一个想法的基本草图,充其量是概念的证明。在我对音乐材料的实验中,我感兴趣的并非音乐结果的质量,而是在没有人类意识制定计划或程序的情况下产生的声音中的外部存在感或差异性(otherness)感觉。我认为这是我经历过的任何「深度」艺术经验的核心部分,有一些奇异而未知的方法或秘密的自主算法在乐曲内起作用,使它万分迷人。简而言之,这个作品变成了一个角色——一张你面前的面孔,但不一定是人类的面孔。 用图灵测试测量一个像我创造的那样一个人工智能。在我的例子中可以使用略微修改的版本——艺术类图灵测试。在初始测试中,人类受试者要辨别他或她是否被机器愚弄以决定它是否有人类意识。对于这样简单的测试,有很多可以反对的地方,但我认为其最大的缺点在于,它在根本上是以人类为中心的方法。为什么人类可以判定什么是智能?如果我们在任何时候都在这种「强烈」的意义上满足人工智能的某种形式,那么它会被赋予总差异性(total otherness)的特征,也不是以任何一种能与我们的思考方式相媲美的方式;它将像有多个深度学习层的黑盒子,在那里我们将永远不能将它的多维结构可视化。与动物能否像我们一样思考或感觉的问题类似,整个智力问题在范围上会变得太过狭窄。重要的是我们的自然反应和情绪。 最终生成版本:点击阅读原文在原文中听取 这便是本文章发表之前实验的进展——在云基础的 CPU 服务器上对 Akkala Sámi 进行一个半月 24 小时深度学习的结果。我感觉最近几日发生了什么,仿佛声音合成口吃的频率变小了——相较 Schwitters 的「Ursonate」来说更加娴熟,也许它的愤怒和喊叫也变少了?还是说这些都是我的心理作用?判断什么时候该停止是最大的挑战之一:再多学一小时就好……再改变一次代码,重新试一次就好……我的实验最主要的弱点便是源材料数量有限,我需要访问一个更大的语言类数据语料库来得到进展。这强调了档案在未来会愈发重要,世界也会更加「以数据为中心」。人工智能如何改变以同质性和破坏多样性为特征的世界?它能否寻得使世界保持独特与奇异的新方法,通过使其存在于我们周围来保存过去? 为了推进这个想法,我的实验的下一个逻辑步骤是与语言学家和计算机科学家合作。但我运用有限的专业技术知识能够运行这类实验,这仍旧能成为一个范例 [6]。当快速 GPU 处理器的价格下降至消费者水平时,该技术将变得更加平民化。人工智能如何协助艺术的创作?它会成为一种新形式的后人类艺术吗?而更大的问题是:深度学习对艺术与文化、创造力、社会研究和人文科学来说意味着什么。这个未来将由我与许许多多其他人士在今后的发现和参与中塑造。 [1] https://deepmind.com/blog/wavenet-generative-model-raw-audio/ [2] https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html [3] [4] 请参阅网址: 和 [5] 欲了解更多实例,请参阅网址: https://soundcloud.com/user-614303604/sets/deep-learning-dead-languages [6] 关于我的实验中通过使用开源 wavenet 做出的实现,请参阅 https://github.com/ibab/tensorflow-wavenet ©本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |