人类试图用机器作诗的冀望由来已久。从最原始的“词语沙拉法”,到基于模板和模式,基于遗传算法,再到基于摘要生成和基于统计机器翻译,为了让机器创作的“诗歌”更像诗歌,人类可谓用心良苦——如今,受益于深度学习,机器写诗水准突飞猛进,甚至以假乱真。 其实无论是藏头诗抑或任何query写诗,都是基于计算机海量存储,神经网络机器翻译,自然语言处理等技术的支持,对用户表达深度分析和联想,预先规划每一行诗歌的主题,强化诗歌与主题的相关性。拆解来看,通过数据优势,百度首先获取到海量古体诗歌(包括网上的模仿作品),再利用大规模 GPU 集群构建一个深度神经网络机器翻译系统,通过对数据的深度学习,系统自动学会对仗,押韵,比兴等技巧。 我参加过几次百度在现场进行的类似“图灵测试”的活动:同一主题,两首诗分别出自机器与某位大家,对于大多数人,明辨二者颇为艰难。 嗯,也正因如此,我个人建议,当你把用机器写的藏头诗赠予Ta时,最好还是如实招来……因为对大多数人来说,“为你写诗”确实是“不可能的事”。 人工智能:中国的机会 事实上,无论“测桃花运”还是“为你写诗”,本质上都是人工智能更宏大未来的两个相对微小的脚注。 如你所知,不久之前,《纽约时报》在采访大量美国政府官员和硅谷精英后得出结论:中国的AI将与美国齐头并进。其实在业内,这并非是一个多么令人错愕的判断,几乎达成的共识是——中国确实拥有孕育人工智能温润的社会土壤。 譬如李开复就认为:首先,中国每年毕业上百万的工程师,没有任何其他国家能做到这一点——要知道,在全世界人工智能的论文作者中,43%是中国人;“其次,中国社会可以快速训练勤奋的年轻人,一名特别优秀的数学和计算机专业应届毕业生经过6个月培训,就可以进入人工智能行业,成为合格的人工智能工程师。” 另一方面,就像中国“互联网+”的市场红利正是“得益于”传统基础产业的赢弱,人工智能亦如此。中国有很多传统企业需要通过人工智能完成产品升级,“如果有AI技术和大数据技术想卖给美国银行,可能它们已经打磨的很好了,但是在中国的很多银行,却能够非常快速的产生价值,帮助他们赚几千万上亿的营收,j2直播,他们当然愿意花钱来买这样的服务。” 更重要的是,在中国,数据的获取相对容易,罗振宇就曾在跨年演讲中感叹到:“全世界没有任何一个国家的人民像我们中国人一样乐于向互联网贡献数据。”——而这一轮人工智能的主战场正在切换到大数据上,在深度神经网络的帮助下,人们发现,机器可以用对数据的广度解决人类认知的深度。而根据收益递增原则,以数据为血液的人工智能产品,越多人使用它,它就越聪明,从而就有更多人使用。 这正是百度这种科技巨头在未来的最大机会。事实上,在语音技术,自然语言,用户画像,机器学习,增强现实,自动驾驶等诸多方面,百度都有着广泛且深度的布局。通过多年深耕,这家巨头已建成超大规模神经网络,拥有万亿级参数,千亿样本,千亿特征训练,从底层数据和算法架构等方面均已成为人工智能领跑者。 在更乐观的期许中,所有从业者都希望错失前两次工业革命的中国,能够在正在来临的人工智能革命中弯道超车。 未来的“爱情” 最后,在情人节这一天,让我们说回诗歌和爱情本身。 如前所述,至少从结果来看,机器作诗已难辨真伪,但倘若“诛心”,必须承认,“数据规律”和“理解诗意”是两个意思。作家刘慈欣甚至为此写过一篇名为《诗云》的科幻小说:一个热爱艺术的超级文明为了写出比李白更动人心魄的诗歌,将穷举法推至极致,不惜摧毁太阳系,排列所有汉字组合,最后却悲伤地宣布:超过李白的诗歌已经诞生,但我找不出来。 嗯,现阶段的共识是:机器还无法理解人类细腻的感情。虽然诗歌形式可以简化为算法与数据,但“爱情”似乎不能。但是,未来呢?要知道,《未来简史》就为人们描述了一个一切皆算法(当然包括“爱情”)的世界,到那时,依托于更大的数据关联,如百度这样的人工智能巨头,又将怎样改变你的爱情? 就拿择偶举例。在中世纪,牧师与父辈有权决定你的伴侣;在人文主义充当主流的现代社会,择偶权力拥有者是“你的内心”,但在《未来简史》作者尤瓦尔·赫拉利看来:就在本世纪,“数据主义(Dataism)”极有可能替代“自由主义”成为人类信奉的“新宗教”,在数据主义的大纲里,当采集到海量数据(尤其是人类生物数据),加之日趋强大的计算能力,外部力量将比“你的内心”更了解你——换句话说,人工智能在择偶对象选择上将变得更有发言权。 (责任编辑:本港台直播) |