迁移学习的最终目的就是实现AI for Everyone。比如我们利用一个由训练三万个的对话模式获得的大对话模型可以迁移到个人的小型对话中,这种基于强化学习所获取的个性化效果非常具有实用性,因为我们不用繁琐地问用户很多同样的问题。此外,杨教授在会上曾提到一个愿景——利用迁移学习,即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用,从而克服数据“寡头”现象。不论怎样,迁移学习是一种极具潜力的解决方案,将在未来大显身手。 运用“魔镜对话系统”实例阐释人工智能成功的五个必要条件 此外,杨教授用一个人工智能技术应用的热点——对话系统,清晰地阐明上述五个条件对人工智能技术发展所产生的推动性作用。 现有对话系统的应用原理 一般来讲,市场上现有的对话系统可以分为两类:闲聊类与功能类。
在上图中,我们可以看到:60年代的Eliza与微软的小冰属于闲聊类对话系统,百度的小度与微软的Cortana介乎闲聊类与功能类之间,Facebook的M与HKUST最新的Magic Mirror系统属于功能类对话系统。杨教授讲到,我们大家应该都有体验,微软小冰很幽默,但是也只能止于闲聊;功能类对话系统则给我们的生活带来了很多便利,例如,我们打电话到酒店预定房间,在银行办理个人业务,不过,在一定程度上,目前的功能类对话系统依然存在一些不太便利的地方,例如,在使用过程中,我们要根据系统提醒依次按服务键,这可能导致用户体验下降。 从技术层面上进行分析,杨教授提到对话系统可以大致分为两种:基于原则的系统与基于学习的系统。最早的对话系统是基于原则的,有很多专家来制定这些规则,其优点在于准确性高,但是却难以扩展,与数据无关,对数据的灵敏度不高。此外,基于原则的对话系统的由于无法扩展,通常情况下不能应对不同的意外事件,所以现在大家关注较多的是基于机器学习算法研发的对话系统。 三层结构算法模型将为对话系统带来革新
杨教授透露说,香港科技大学实验室正在研究如何运用新技术来改进现有的对话系统。在大会上,杨教授向我们展示了一个三明治式的三层结构算法模型: 第一层是我们熟知的深度学习神经网络——递归深度神经网络(RNN) 第二层是一个策略学习器——强化学习(RL) 第三层是迁移学习(TL) 在演讲中,杨教授特别强调了强化学习(RL)中最难的阶段:人工智能机器人只能部分观察周围的世界,研究者用一个奇怪的名字来描述这种现象——基于部分观察的马尔可夫决策过程。迁移学习(TL),正如在前面讲到的,能够将一个已经做好的模型迁移应用到一个新的领域中。杨教授讲到,希望利用这样一个三层结构赋予对话系统以下功能,比如说闲聊、推荐、引导、提醒、学习,如果一个对话系统能够具备这些功能,它就像一个真人一样。 但是,如何达到这个目的呢?
根据杨教授的观点,首先,对话系统应当具备基本的对话功能,即自然语言生成能力,这种能力主要依赖RNN来实现。 其次,我们需要一个策略,用这个策略引导对话的对象来完成一个特定的任务,即对话控制,主要通过RL实现。 最后,要实现个性化,满足用户不同的需求指令,主要依靠TL实现。
为此,杨教授给我们提供了一个实例,香港科技大学现在和一个O2O的公司合作,用真是的数据训练这个对话系统,上图中绿色代表用户所提的问题,白色代表系统的回答,该系统的中文名字叫做“魔镜系统”,就是童话故事白雪公主里面的魔镜,当然这是一个好的魔镜。“魔镜系统”是个性化学习的一个实例。 (责任编辑:本港台直播) |