名古屋大学教授佐藤理史说,“星新一”文学奖初评入围的标准比较低,“把不出现奇怪的日语放在第一位,暂时不考虑是否生动有趣”,这也是机器人小说能够入围的原因。 日本科幻小说作家长谷敏思则表示,“能够完整写出小说太令人震惊了。如果100分满分的话我打60分,未来令人期待。”不过他同时也认为,机器人小说目前“对角色的刻画还很粗,情节的转换也不够自然、对于故事的交待也不够巧妙。不能算很好的小说,距离星新一奖得奖的距离还很远。” AI写作的原理和“不可能” 看过了AI的新闻报道、诗歌创作和小说片段,也许你会对文字工作者的未来产生一丝担忧。但是,正如各个创作领域的专家所说的,AI的写作更像是在海量文字数据之中进行的“填词游戏”,或者说始终还是在“做数学题”。 以擅长创作古诗的度秘来说,它的创作过程充满了理性的统计和运算:百度度秘首创诗歌规划模型,根据一个关键词,“联想”出主题,进而创新作出诗句。度秘的作品因此拥有人类的情感和意境。依托大数据与机器学习,度秘分析整合古诗词的韵脚和语境,重新生成新的诗句,甚至还能写出“藏头诗”哦!
需要重点介绍的是,度秘的创作过程不同以往: 首先,我们不限制用户的输入。它可以是一些关键词、短语、句子甚至文档。以前的方法只能支持一些关键词或必须提供诗的第一行。 其次,我们会根据用户的输入确定这首诗的主题,每一行都有一个特定的子主题,保证生成的诗是连贯的、有条理的。而之前的方法基本上只能够保证第一行是符合用户意图的,下一行可能就会文不对题。 第三,节奏和语调控制方面,我们的模型可以自动地从训练语料中学习约束。 最后,我们的诗歌生成模型较之其他方法,拥有更简单的结构。 百度度秘所采用的模型 Chinese Poetry Generation with Planning based Neural Network 不需要专家知识,是一个端到端的模型。它试图模仿人类开始写作前,先规划一个写作大纲的过程。整个诗歌生成框架由两部分组成:规划模型和生成模型。 规划模型:将代表用户写作意图的 Query 作为输入,生成一个写作大纲。写作大纲是一个由主题词组成的序列,第 i 个主题词代表第 i 句的主题。 生成模型:基于 encoder-decoder 框架。有两个 encoder, 其中一个 encoder 将主题词作为输入,另外一个 encoder 将历史生成的句子拼在一起作为输入,由 decoder 生成下一句话。decoder 生成的时候,利用 Attention 机制,对主题词和历史生成内容的向量一起做打分,atv,由模型来决定生成的过程中各部分的重要性。 从传统方法到深度学习,诗歌生成技术有了很大发展,甚至在一定程度上,已经可以产生普通人真假难辨的诗歌。但是目前诗歌生成技术,学习到的仍然只是知识的概率分布,即诗句内、诗句间的搭配规律,而没有学到诗歌蕴含的思想感情。因此尽管生成的诗歌看起来有模有样,但是仍然感觉只是徒有其表,缺乏一丝人的灵性。 显然,在AI写作这种“撞大运”似的排列运算之下,读者最看重的“创造力”似乎在AI身上并不能看到太多的展现。在“创作”中,AI挑选了它认为很不错的这些词语,安放在故事的各个位置组成了一个“完整”的故事结构。 关于AI终究难以逾越文学创作的症结何在,知名作家马伯庸的一段话似乎可以很好地解答: 文学最大的价值在于朦胧感、在于隐晦、在于隔靴搔痒,我举一个文学著作《金瓶梅》的例子,《金瓶梅》里面有一段描述潘金莲与武松对话:潘金莲说:你若有心,吃我这半盏儿残酒。这句话表面看非常平常,但是蕴含的隐晦意味是 AI 很难模拟出来的。 想到一个前人所未想到的内容来隐晦的描述,这就是 AI 难进行文学创作的原因之一,AI 或许会比赋前人,但是很难实现独创性。第二是 AI 能不能把好的原创识别出来,AI 可以有别出心裁、有创意的修辞手法或者文学技法么?我觉得可以有,但是问题在于那么大的数据量,它能不能从中提取出来,我觉得这也是一个需要思考的问题。 你可能更多想了解的内容
百度AI微信号栏目索引 ▎AI 头条 ▎· ▎百度大脑洞 ▎· ▎AI 内参 ▎ 微信号:baidubrain 微博:@百度AI 网站:ai.baidu.com (责任编辑:本港台直播) |