我们之所以认为世界是真实的,正是因为有从古到今、上天下地、物理数学等一系列证据链层层叠叠着互相印证。但是,所有的客观证据链都是间接的:照片是投影在纸上的,证词是别人的经验。普特南说,如果你不愿接受间接的证据,那你就不能证明丘吉尔也真正存在过;如果你接受间接证据,那么照片、音频、录像都可以伪造。而人工智能的内存足够大,逻辑性也足够强——可以在瓮中造成所有虚拟的证据链,无论天文地理、物理定律,分毫不差。人类是不是过不了这个坎了? 广义图灵测验 利用证据链让人类消除怀疑的过程,叫做“广义图灵测验”(Turing test)。图灵测验已经被很多人科普过,就是让人类在网上与计算机聊天,提各种刁钻古怪的问题。如果计算机都能妥善回答,让所有人都不能判断聊天对象是人工智能还是人类网红时,计算机就算是通过了图灵测验。而广义的图灵测验不再仅限于与计算机打情骂俏,而是是人与机之间的斗心眼,看看谁更像人。作为人类,优越感总是很强烈的。我们假定自己在现实生活中打拼,积累了各种知识经验,而计算机只是人写的程序,日常经验远不如人,所以当面对一些刁钻问题时,人类能坦然面对,而计算机就会露馅。 今天的互联网在大量应用着图灵测验。不但人要测验对方是不是计算机,而且计算机也需要测验对方是不是人。为了防止计算机自动注册僵尸账号,需要让每个人类注册者填写验证码,比如让人看一个稀奇古怪的图像,然后把图中扭曲的字母和数字填在下面的格子里(下图)。这种广义图灵测验的前提是假设计算机在图像识别方面不如人类。如果计算机能通过这种图灵测验,互联网上绝大多数用户就会是僵尸,人类在网上能发现另一个人类都很难。
各种网站用于防止计算机僵尸注册用的“CAPTCHA”码。CAPTCH是“全自动产生的公用图灵测验以便区分人和计算机”的缩写。主旨是生成对人类容易、对计算机很难的测试。CAPTCH也被称作计算机测验对方是否是人类的“反向图灵测验”[3]。 几十年前,普特南已经透过历史迷雾看到今天,用扩展的图灵测验来支持他“瓮中之脑不可辨”的理论。普特南的广义图灵测验就是“证据链的图灵测验”(Turing test for reference),其过程就是穷尽一切办法进行考察,消除所有疑问,证明“苹果树是真的”,“你妈是你妈”。看破脑在瓮中的唯一希望是利用大脑在入瓮之前在现实世界中的大量经验,并利用这些层叠的证据链对控制脑的计算机进行图灵测验。如果计算机能通过测验,人类就不可能破瓮而出。普特南作为哲学家并不考虑技术层面的问题,因此认为计算机通过瓮中脑的图灵测验并无理论障碍。虽然过去不断有人对此怀疑[4],但随着技术进步,怀疑应该不断减少。下面用两个例子说明一下今天的图灵测验,其技术进步是普特南时代难以预料的。 2011年,IBM的计算机华特森(Watson)赢了人类的知识大赛[5],这也是一次广义的图灵测验。与传统的键盘打字图灵测验不同,这次华特森与人类一起聆听主持人的人类语言提问,并以抢答的方式挑战人类,最后赢得冠军。但是,计算机虽然赢了大奖,却输了图灵测验,揭示了很多机器与人类的不同。比如一次主持人错误地把“少一条腿”说成“少一只手”,另一次是主持人的口语中出了个方言性的语法错误。当这些微小错误出现时,人类都能下意识地忽略错误而识别问题,华特森却是个死心眼,抓住错误不放,暴露了逻辑强,经验差的弱点。为了进一步改进华特森,IBM让它走进大学校园,除了处理那些高精尖的科研项目,也跟那些捣蛋学生一起混日子,撩妹、坐吧台、听教授的“五道口英语”(注释1)。把计算机放在生活中,它也会积累大量口语经验。计算机学得快,过目不忘并可以同时与多人交流。因此下一个版本的华特森也许会学到远多一般人的世俗经验,待人处事的能力会比一般人更强(注释2)。 另一个例子是最近谷歌的AlphaGo对战韩国围棋手李世石。这个广义的图灵测验的目的是看看那台机器究竟只是人编的程序还是具有创造性思维的人工智能。结果是大家都见证了的:AlphaGo在第二盘执黑时第37手时下了一步五路“尖冲”,现场许多观棋的高手们先是吃了一惊,随即热泪盈眶,解说员麦克雷蒙九段高呼“吴清源大师的英灵再现”[6]。这个例子生动地说明,非智能的机器中可以“涌现”(emergent)出“看起来”像,甚至让人惊呼的“智能现象”。而图灵测验正是用于测量这种智能涌现的工具。 互联网的请君入瓮 (责任编辑:本港台直播) |