宋教授说,这一算法的关键在于找到问题对应的评价函数Q。我们说一个评价函数Q*是最优的,当且仅当对任意一个问题具例,这个函数都能在此贪心算法下为我们找出最优解。通常情况下,寻找最优的评价函数这一任务本身就是NP难题,因此我们往往需要近似找出一个评价函数Q。解决这类问题的传统贪心算法需要算法设计人手动给出一个Q,(比如在最大割问题中,这个Q可以是节点的邻居数),而手动设计一个合理的评价函数在复杂问题中是不现实的。因此,这篇论文提出了用图嵌入寻找评价函数的方案。 具体来说,此论文使用了structure2vec这一图嵌入网络。宋教授说,通过这一网络所寻找到的评价函数Q能够整合节点和它一步两步,甚至三步以外所有邻居的信息,atv,并将这一信息压缩成一个有限维的非线性向量。具体算法如下, 最后,这篇论文提出用强化学习中的n-step Q-learning这一方法来学习图嵌入网络的参数。 n-step Q-learning的使用可实现强化学习中的延迟回报。 整体算法可被下图概括。 实证研究:远超传统算法 此论文提出的新算法实现了基于图论的组合优化问题的“自动化”解决,那么这一算法的效率又如何呢?这篇论文将提出的新算法Structure2Vec Deep Q-learning和其他基于深度学习的算法(Pointer Networks With Actor-Critic)及近似/启发式算法作比较,发现这一算法所找出的解普遍更接近最优解(在下图中,approximation ratio越小表示解越优)。尤其是在MVC中,Structure2Vec Deep Q-learning得到解和最优解几乎没有差别(approximation ratio约等于1)。 宋教授表示,他们已将这些研究成果运用到材料和医药领域(研究分子图谱,从而进行分子特征提取,从来检验药品是否有效)的问题,并预计将这一研究成果推进到包括知识图谱研究、企业运营管理在内的其他领域。除此之外,我们也有理由相信,机器学习的发展将浸入更多其他学科领域的研究。曾经困扰我们多年的难题或将被机器学习一朝攻破。 在访谈最后,宋教授也谈到了目前机器学习课程在高校的开展盛况。在佐治亚理工学院,宋教授开展的研究生阶段的机器学习课程的报名人数达到了数百人,可谓一座难求。此外,紧跟卡耐基梅龙大学的步伐,佐治亚理工也将设立全球第二个机器学习的博士生专业。宋教授认为,在机器学习大热的趋势下,更多的高校将开展机器学习相关的专业和项目。此外,宋教授提到,参与机器学习课程的学生不仅仅来自计算机,统计和数学专业,直播,更有医疗、生物、建筑等专业的学生前来报名学习。除了作为一门专门的学科而被学习研究,机器学习也将成为一项普及于其他各项学科领域的研究工具。 (责任编辑:本港台直播) |