基于我们设计的模型的通用性,理论上,只要我们持续深入下去,我们就可以做到全场景对话,甚至多语言对话。但是从当前用户的接受程度,相关产品的成熟度,还有商业模式上看,我们更倾向于在车载和家居环境中突破。也就是说纯语音对话的方式现在还只是一种非主流手段,只有当人双手被占用的情况下,这种方式才会变得有用和有效。但是,随着语言理解和对话技术的快速发展,这一情况正在变得越来越普及,有望在数年后成为一种主流的人机交互方式。 读者提问 ▎NLP在人机交互上的应用现状能否介绍一下?在AR/VR场景下能做到怎样的程度?例如游戏中的NPC能够像微软小冰一样进行复杂的随机交流吗? 首先要说明的是我个人觉得小冰根本没有什么复杂的技术,虽然可能用了深度学习,用了句子生成方法。但其核心还是通过大量聊天语料(问答对)训练一个新问题在当前上下文下最“相关“的一个已有问题,从技术上其更近似于检索的方式,只是选用不同的模型对上下文的描述能力可能不同,效果也有所差异。但总体上,这种对话和“语言理解”无关,也就说和推理没有半点关系,还只是一种纯统计上的相似度计算而已。所以要问的或许应该是:游戏中的NPC可否像真正的游戏玩家一样和电脑前面的游戏玩家进行自然对话。 其实特定的某个游戏是一个非常细分的场景,我个人觉得这这种受限场景下,人机对话可以做得更接近于人与人之间的对话,但是需要考虑的是游戏中角色很多,不同角色的设置也不同,需要真正比较通用且能快速实现个性化的对话模型,而且这种模型的冷启动也需要针对不同角色有所差别。 ▎当前深度学习在NLP方面的使用以及它与传统方法的区别与集成,对于从业者来说应该如何选择? 还是和问题本身相关,如果把问题看做是一个模式识别问题,输入和输出都很明确,而且也能够获取到大量的训练样本(包括用人工可以大量标注的方式),此类问题一般适合用端到端的方法来解决,深度学习是一个很好的选择。NLP中的序列标注,统计机器翻译都可用此类方法。如果问题本身就是一个目标并不能明确地用具体标签描述,而是需要根据其所处的环境,做出一系列明确的动作,比如规划问题,任务决策问题等,这类问题暂时还不适合用深度学习来处理,需要深度学习和逻辑相结合。 关于“传统NLP方法”这个说法,我个人有不同的看法。对于NLP技术来说,其研究的是逼近语言现象本质的方法,或者说针对语言建模的方法,最早大家是从逻辑的角度来研究,然后加入了统计和机器学习,语言问题是个足够大的问题,这些不同流派揭示的只是语言问题的不同侧面而已。如果从应用的角度来看,当然合适的方法是要考虑语言问题的各个侧面,融合逻辑,知识和统计的力量才能获得有效的进步。很多所谓采用NLP技术的产品大都把眼光停留在文本分类,词汇标注,甚至分词这样的单点任务上,其实离理解NLP技术的作用还差得很远。 ▎用自然语言进行的“交互式搜索”取代传统搜索形态的可能性有多大,业界对此趋势的应对现状和目前面临的主要难点是什么? 随着终端的多样化,设备的逐渐微型化,这是个必然的趋势,我无法给出一个具体的时间预测,但我相信这一天肯定不会太远,移动时代的到来就已经开始肢解搜索了。当前的搜索引擎不久后将会蜕化成“交互式搜索”后面的一个并不那么重要的服务,就像分类目录式搜索被现在的搜索引擎取代一样。 难点还在于自然语言理解,更具体一点说就是机器如何去“理解”人类语言。机器至少要理解人的意图,并且能支持推理,推理本身必须也是一种计算,然后才能谈对话,谈交互,否则都是无源之水无本之木。 ▎ 自然语言处理技术在教育领域里值得注目的发展趋势有哪些? 教育是一个很大行业呀,这方面我不专业,所以只能随便说说。 从我们交互与决策引擎的角度来看的话,机器辅助教育可能是一个很有意思的点,让机器人帮助完成教育过程中的一些机器更擅长的环节,比如改卷,不厌其烦地讲解基本演算方法,理科类的答疑等。 (责任编辑:本港台直播) |