开放领域对话是指与人进行事先未知话题的讨论。这里的挑战包括语言理解、对话语法和探索世界。任务的版本包括口头和书面对话,并可扩展至多模式交互(例如姿势输入和多媒体输出)。可能成功的标准包含有用性以及执行对话贴近人类对话的能力(“ 图灵测试 ”)。(译者注:图灵测试是图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。) 测试 对话系统通常由人工进行评估。此过程已实现的事件包括: 1. Loebner奖 (译者注:纽约的慈善家Hugh Loebner组织了首次正式的图灵测试。从1991年起,每年举行一次这样的竞赛,其中机器反应与人类反应最难区别的计算机将获得100000美元的奖金和一块金牌。) 2. 机器人聊天挑战()(译者注:2012年起开始举办的人工智能聊天竞赛。) (2)文本理解 文本理解是一个尚待解决的问题。尽管问题解答领域已取得了显著的进展,但当需要使用超越文本的常识或世界知识去理解时,现有的人工智能文本理解系统就会面临问题。 测试 1. McCarthy(1976)提供了一个早期文本理解的挑战问题。(s) 2. Brachman(2006)提出了阅读教科书和解决教科书练习的问题。 (3)机器翻译 机器翻译是人工智能完备的,因为它包括那些有关认知世界的问题(例如下面将讨论的核心解析问题)。 测试 虽然翻译质量可以使用平行的语料库进行自动评估,但最终仍需要人工来判定测试的结果。例如当代美国英语语料库 (Davies,2008)包含了来自不同类型的文本样本。翻译质量可以使用以下样本进行评估: 1. 报纸文本 2. 小说 3. 口语翻译 (4)智能测试 人类智力和能力测试()对其设计的人类利用记忆很难或不可能实现的问题很感兴趣。人类水平的人工智能性能已经被报道用于Raven的渐进矩阵(Lovett和Forbus,2017),但人工智能系统仍然缺乏一般的推理以及同时处理各种问题的能力( Hernández-Orallo ,2016b)()。 测试 Brachman(2006)建议使用SAT(https://en.wikipedia.org/wiki/SAT)作为人工智能的挑战问题。(译者注:SAT是美国大学入学考试。) Coreference resolution The overlapping problems of coreference resolution, pronoun disambiguation, and Winograd schemas require picking out the referents of pronouns or noun phrases. Tests 1. Davis (2011) lists 144 Winograd schemas. 2. Commonsense Reasoning (2016b) lists pronoun disambiguation problems: 62 sample problems and 60 problems used in the first Winograd Schema Challenge, held at IJCAI-16. (5)核心解析 核心解析、代词消歧和Winograd构架的重叠问题需要人工智能系统能指出代词或名词短语所指代的内容。 测试 1. Davis(2011)()列出了144个Winograd构架。 2. Commonsense Reasoning(2016b)列出了代词消歧问题:在IJCAI -16举行的第一次Winograd构架挑战赛中使用62个样本问题和60个问题()。 Tests 1. “The meaning of noun phrases” at (Commonsense Reasoning, 2015) (6)复合词理解 多种语言存在具有特定含义的复合词,而我们也擅于猜测新出现的复合词的意思。比如我们知道水鸟是一种生活在水面附近的鸟类,而不是由水构成的。 测试 “ 名词短语的含义 ” (#nounphrases) 闭域问题 闭域问题是将重要的智力因素结合起来、并通过将自己限制在一个特定的知识领域来降低难度的问题。游戏玩家代理是其中的一个例子。人工智能代理已经在围棋和最近的扑克上实现了超越人类的表现。尚待解决的问题有: 1. 从描述中学习玩棋盘、卡片和砖瓦游戏 2. 根据描述生成程序 3. 源代码理解 (7)从描述中学习玩棋盘、卡片和砖瓦游戏 与专业游戏玩家不同,人工智能系统需要从对规则的描述中学习新游戏,并且不能依赖于针对特定游戏预先设计的算法。 测试 1. 在AAAI会议上,从正式语言的描述中学习新游戏的问题已经成为人工智能的一个挑战()。 2. 更具挑战性的是从自然语言描述中学习游戏; 这样的卡片和瓦片游戏的描述可从许多网站获得。 (8)根据描述生成程序 用编程语言来生成程序,例如C语言显然是实际应用中的一个兴趣点。 测试 OpenAI提出的“ Deion2Code ”(https://openai.com/requests-for-research/#deion2code)挑战中列出了Ethan Caballero收集5000个程序描述。 (9)理解源代码 (责任编辑:本港台直播) |