人工智能复杂的商业需求,正促使博弈 AI 的崛起 | AI大师圆桌会 2017-07-29 10:20 来源:钛媒体 人工智能 /人类 /德州扑克 原标题:人工智能复杂的商业需求,正促使博弈 AI 的崛起 | AI大师圆桌会 卡耐基梅隆大学计算机系教授、德扑AI之父 Tuomas Sandholm “人工智能时代,针对机器的算法是机器学习,针对人类的算法是博弈论。”这是清华大学交叉信息研究院青年千人助理教授、博士生导师、计算经济学研究室主任唐平中,在2017年7月20日钛媒体与杉数科技联合举办的“AI大师圆桌会之AI时代的博弈与行为分析”活动上提出的观点。 唐平中在加入清华之前,于美国卡耐基梅隆大学计算机系从事博士后研究工作,师从德扑AI之父Tuomas Sandholm,从事人工智能、电子商务和机制设计的研究工作。 Tuomas Sandholm是卡耐基梅隆大学计算机系教授,研究兴趣包括人工智能、机制设计、优化理论、博弈论、电子商务、多代理系统、自动谈判及合同等广泛领域,迄今已经发表450多篇论文,还是Optimized Markets和Strategic Machine两家公司的创始人。 Tuomas Sandholm 在“AI时代的博弈与行为分析”圆桌会上,分享了在他带领下完成的人工智能系统Libratus(中文名:冷扑大师)及其在今年以来击败全球德州扑克世界高手的经历。 Tuomas表示,Libratus系统结合了优化的博弈论和机器学习等算法,是迄今为止唯一击败人类德州扑克世界最顶级高手的人工智能系统,在战略推理和战略思维方面达到了超越人类的水平。 与AlphaGo围棋的完美信息场景不同,德州扑克是典型的非完美信息场景,已经挑战人工智能+博弈论数十年之久。Tuomas表示,Libratus算法无应用领域限制,可广泛应用到多种商业与经济场景中。 在此次圆桌会上,除了唐平中和Tuomas Sandholm,上海财经大学教授、奥数金牌、杉数科技科学家何斯迈与上海财经大学交叉科学研究院院长、杉数科技首席科学家葛冬冬以及不列颠哥伦比亚大学(UBC)Sauder商学院助理教授丁弋川等也进行了分享。 博弈AI大时代的崛起 直播,正促使博弈 AI 的崛起" src="http://www.wzatv.cc/atv/uploads/allimg/170729/234T450A_0.jpg" /> 清华大学交叉信息研究院青年千人助理教授、博士生导师、计算经济学研究室主任唐平中 有人的地方就有博弈。从囚徒困境到智猪博弈再到美女的硬币,博弈论一再说明一个道理,就是人类的思维不同于机器,特别由于人类的社会化属性,但凡有两个人以上的地方就充满着博弈的思想。因为有人的地方就有竞争,有竞争就有博弈。 作为数据、计算机与经济学的交叉学科,博弈论已经成为经济学的标准分析工具之一,在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其它很多领域都有广泛的应用。博弈分为合作博弈与非合作博弈、完全信息博弈与非完全信息博弈、静态博弈与动态博弈等多种类型。 唐平中表示,博弈论在西方已经有近90年的历史,而在中国则是于近5年得到了广泛的关注和应用。从2009年开始的互联网广告拍卖设计算法,使博弈论在国内经济界得到了重视,如今国内工业界对博弈AI的算法也有大量的需求。 究其原因是在研究人工智能的时候,发现仅处理针对机器的算法远不能满足实际商业的需求,在现代商业中往往是“人+机器”的复杂场景,而博弈论恰好是针对人类的智能算法。 丁弋川在解读Tuomas Sandholm对AI的观点时,强调博弈论与最优化决策的结合。正如Tuomas Sandholm所解释,博弈论本身只是一个描述性工具,并不做出具体的决策,而最优化决策则指出每一步的最优化结果,但同时并没有考虑对方的情况,AI就把二者结合起来做出二人博弈时的最优化决策平衡点。 这就是德州扑克在人工智能学术上不亚于甚至是超过AlphaGo的意义所在,它提供了一种新模型去分析在没有或缺乏信息的情况下,如何计算平衡点。 Tuomas Sandholm强调,扑克游戏本身就是非完美信息的场景,德州扑克更是非完美信息的典型场景。在德州扑克进行的过程中,缺乏甚至没有任何数据,在这种情况如何计算出每一步的最优平衡点,同时还要考虑进对手的每一步情况。德州扑克有10的161次方个决策点,是非完美信息博弈算法的标准测试场景,国际上一直有学术团队在挑战这一场景。 (责任编辑:本港台直播) |