在机器学习中,给予计算机一个输入(一组变量和数据集),输出是输入变量的结果。该机器然后发现或“学习”在输入和输出之间起到链接作用的规则。 最终,这个学习任务的成功会被进行“样本外测试”,也就是,在未知的情景下,测试它所获得的这种连接变量和可能的预测结果之间的关系能力。 机器学习可以是监督的或无监督的。在监督学习中,我们试图找到一个规则,一个可以用来预测变量的“方程式”。例如,我们可能想要寻找一种能够预测未来市场表现的能力(趋势跟踪)信号。这可以通过运行先进的回归模型来评估哪一个具有较高的预测能力,并且对于regime变化最为稳定。
在无监督学习中,我们发现了数据的结构。例如,我们可能获得了市场回报,现在尝试确定回报的主要驱动力。例如,一个成功的模式可能会揭示,在某个时间点,市场受动量因素、能源价格、美元水平以及与流动性有关的新因素的驱动。深度学习是一种机器学习方法,可以分析在多个层级上学习数据(因此“深度”)。 我们经常说的自动化的目标是执行易于定义但执行起来乏味的任务,而深度学习 AI 系统的目标是执行难以定义但易于执行的任务。深度学习本质上与人们学习的方式更相似,因此是人为重建人类智慧的真正尝试。 深度学习用于非结构化大数据集的预处理(例如,它用于计算卫星图像中的汽车,识别新闻稿中的情绪等)。在假设的财务时间序列示例中,深度学习预测(或估计)了市场修正的概率。我们可以将大量的数据集输入到深度学习模型中。该模型可能首先确定一些对市场产生负面影响的简单特征,atv,例如动量崩溃,波动性增加,流动性下降等。这些因素单提出来可能不会导致市场纠正(market correction)。此外,算法可以识别这些简单特征之间的模式和它们之间的非线性关系。从这些模型中,它可以构建更复杂的特征,如EM 驱动灾难(EM driven crises),atv,财务压力,这些最终可能导致更为显著的市场纠正(market correction)甚至衰退。
上图显示了交易策略中各种机器学习/人工智能及其潜在应用。最初,先提供灰框中的步骤给算法(作为训练集的一部分),然后由机器学习算法生成绿色框中的步骤。 在另类数据中实施机器学习的主要步骤 鉴于风险和不确定的回报,许多投资者都在思考何时应该采用更具量化性的、数据驱动型的投资方法。首先我们简要概述实施过程中的主要步骤(例如有多少需要外包、内部构建大数据/机器学习所需的人才、典型的技术设置等等)。如下图所示:
首先需要识别和获取数据。数据采集团队可以直接通过数据所有者/供应商或聚合第三方数据的专业公司(并与供应商和最终用户相匹配)来获取新数据源的使用权。一旦许可协议到位,数据需要存储和预处理。大数据很少呈现出干净的形式,一般都无法直接提供给机器学习算法使用。需要专门的团队预处理数据(例如检测异常值、缺失值等)。数据科学团队由量化研究人员组成,借助机器学习、反向测试策略和可视化技术分析数据,根据数据推导出可交易信号或见解。最后,信号由投资组合经理实施,或者在某些情况下以自动化方式执行(这将涉及到系统的另一层和将信号链接到执行系统的软件专家)。 我们认为,大数据与机器学习革命将深刻改变投资环境。随着越来越多的投资者采用大数据,市场的反应将更快,并将越来越多地期待传统或“旧”数据源。这将为量化经理和愿意采用和了解新数据集和分析方法的人们提供优势。那些不学习、拒绝进化的人将面临过时的风险。不管这些变化的时间表如何,我们认为,分析师,投资组合经理、交易者和首席信息官最终将不得不熟悉大数据和机器学习的发展和相关的交易策略。 (责任编辑:本港台直播) |