吴唯 编译自 WSJ 量子位出品 | 公众号 QbitAI 再怎么炒,把AI用到投资上问题依然很大。 十年前,在自动投资算法突然失控,导致数十亿美金损失和高盛旗舰量化基金的最终关闭后,人们一度拔掉了计算机的插头。 如今,十年过去,人工智能和机器学习成了自动化投资领域最热门的词汇。但在那些铺天盖地的宣传之下,将AI用在投资上依然存在着三个严重的问题:运行得太“好”,难以理解,以及只知道最近的历史。更糟糕的是,随着各种不同的算法在市场上刚正面,这类工具的流行其实是在自掘坟墓。 现在的机器学习系统非常擅长发现模式。但过犹不及,计算机常常运转过度,以至于发现一些并不存在的模式。 安盛罗森堡股票的首席策略师Michael Kollo指出,一个由三名华盛顿大学研究者开发的神经网络,在分辨狼和狗的图片时其实是将狼和雪联系在一起。 “它能轻易地辨认出某些‘不妥协’的性质,并将其作为一条规则来学习。”Kollo说。如果用过去35年的市场状况对一个AI进行训练,它可能只会得出一条简单的规则:买债券。 1982年7月,当时国债的债息是13.7%;而本周一,这个数字是2.31%——从事后诸葛亮的角度看,AI的想法非常不错。然而,未来35年里债息绝不可能再下降这么多了。 在业内,识别出某些不会重复的模式被称作“过度拟合”,比如在图片中的雪与狼之间建立相关性,或者用在过去股市中发现的模式去冒未来的险。 温顿集团对冲基金的创始人David Harding说,寻求某些方式,来避免用上这些假模式是计算机驱动投资的核心。 “避免过度拟合是一种心态。”他说,“这跟避免那些一厢情愿的事情是一回事。”
△在度过了经济危机后,计算机驱动的对冲基金表现非常好,并且正在吸引越来越多新的投资。 Man AHL量化基金的首席科学家Anthony Ledford说,更高级的机器学习系统有时会更没用。“你用的模型越复杂,它对你用于训练的那些数据解释得就越好,j2直播,但它解释未来数据的能力就不那么好。“他说。一个模型需要接受这样的事实,即市场上大部分的东西都是无意义的,同时模型需要去收纳更广阔的信号,即便它会落下某些过去数据的波动。 许多量化投资者坚持,他们所采纳的任何规则,其背后必须存在一条经济或行为学上的一条基本原理,以此来避免过度拟合。如果计算机发现每月的第三个周三堪萨斯下雨时,在巴黎登记的石油公司股价都会上涨,在未来以此为依据进行投资无异于“信仰之跃”。 不幸的是,要解释系统做出某种决定的原因是不可能的。美国的国防研究机构正在资助团队试图解决的,也正是这一问题。 透明度的缺失意味着绝大部分先进的系统只能处于试运行的状态,投入的资金很少,同时需要人类的意见进行辅助。 Charles Ellis就是典型的案例。他在11月加入都柏林的Mediolanum资产管理公司,负责开发机器学习系统,为各个部门提供建议。这套系统用了与美国股市相关的1500个变量上20年的数据进行训练,并用随机森林回归模型来避免过度拟合。 据Ellis的说法,初期的结果不错。但它只被用于200亿美元资金投资组合中的一小部分,而且最终的决定依然由基金经理完成。另一种为预测经济周期而设计的系统目前也被看好。 随机森林方法的弊端是很难理解计算机为何会做出特定决策。 “这是个黑箱。你不知道它为何会产生这种效果。”他说。 Kollo说,如果难以被理解,那么在赔钱的情况下,恐怕只能将那个系统关闭。 “所有东西走到最后都不对,每个算法都有倒霉的那天。”他说,“存活与否,其实就在于它们能否解释自己干的那些事情。” 一些投资者不在乎透明度的缺失。Jeffrey Tarrant的Protégé Partners公司投资对冲基金,atv,他说“这对我来讲根本没什么”。他投资了六支使用AI方法的基金,都是典型地使用了不寻常的数据来源,同时有着非标准背景的基金经理。他估计至少有75家基金声称自己用了AI,但他觉得也就25家是真的。 长期使用计算机管理资产的投资者对最近的AI风潮不以为意。 “因为告诉别人你可以用电脑来管钱,自己已经像被对待白痴一样对待了三十年,然后现在那些人走过来又告诉我说,你可以用电脑来管钱。”Harding说。 (责任编辑:本港台直播) |