英世曼 | 机器学习的方向

原创安东尼&斯蒂芬交易门

作者：安东尼雷德福德博士

斯蒂芬罗伯茨教授

翻译：雷闻

原文章来自英世曼网站，本文为原文章的中文翻译。本文仅用于交流学习使用，不得用于商业用途。如对相关著作人造成侵害，请立即联系译者及时删除

本材料仅供机构投资者、合格投资者和投资专业人士使用。不用于零售公开渠道。

英世曼 | 机器学习的方向

人工智能（AI）正在迅速发展。从无人驾驶汽车到虚拟助理，从智能供暖系统到亚马逊无人驾驶飞机，创新似乎无处不在。金融领域没有什么不同，机器学习（ML）技术——人工智能的一个分支——越来越多地被应用于投资分析。

简单地说，我们将机器学习定义为一种计算机系统，它可以使用算法识别和操作从数据中学习到的可重复模式，而无需明确指导寻找什么模式。

牛津大学和英世曼分别作为学者和实践者，在定量技术方面处于领先地位。我们都认为机器学习是我们研究领域中越来越重要的一部分。自2016年我们联合决定牛津英世曼研究所（OMI）将专注于定量金融领域的机器学习。自此，OMI增加了19名专门研究这一领域的新研究人员。这种规模的研究群体使OMI成为大学内最重要的研究群体之一。

公共的看法往往妨碍了我们对主体的正确理解。在《银河系漫游指南》中，名叫 “深入思考”的超级计算机需要750万年的时间来确定“生命、宇宙和一切的终极问题的答案”。当人们谈论机器学习时，通常会联想到一个类似的画面——向一个巨大的数据集投入巨大的处理能力，直到发现一些可以解开宇宙秘密的黄金洞察。（笔者注：大多数理工科背景的Quant习惯了物理领域具有高度解释能力的模型，所以总希望在金融中找到“圣杯”。但这不仅仅是徒劳的，甚至是有害的。但是，英士曼也承认，哪怕用上机器学习，也不要去寻找“圣杯”）

事实上，机器学习的目的往往是简单地将各种弱信息源组合成一个整体，这个整体比任何单独输入都具有更大的信号功率。（笔者注：用AI的语言来说，英士曼认为机器学习算法的价值是将弱分类器组合成强分类器）

具体来说，在投资方面，我们认为，一个无需人员约束的人工智能世界还有一段路要走。然而，我们确实认为，机器将继续使投资者从人脑难以触及的领域中获益。智人在小的同质数据集上具有很强的模式识别能力，但随着信息集越来越大、越来越多样化，智人很难做到这一点。毫无疑问，这就是金融信息的情况，它不仅在规模上迅速发展——仅英士曼每天就收到大约12.5亿个独特的数据周期，而且非常多样化，包括明显的数字和文本，还有更不寻常的信息源。

例如，在能源和作物市场方面，气象图和卫星图像（可见光和合成孔径雷达）对我们了解作物状况和库存至关重要。机器学习技术使我们能够结合多种多样的数据源，从而得出人类智能可能会错过的见解。

随着计算机在更复杂的棋盘游戏中取得一系列的胜利，人们欢欣鼓舞地期待机器学习即将在金融领域占据主导地位。2016年，我们看到谷歌（Google）的AlphaGo以四比一的优势击败了世界上获奖最多的围棋玩家之一韩国选手李世乭（围棋是一款主要在东亚玩的棋盘游戏）。2017年10月，AlphaGo Zero以100比0击败了AlphaGo。这个新发展的重要性在于，AlphaGo Zero使用了一个最初对游戏一无所知的神经网络，在三天内自学围棋。AlphaGo Zero简单地和自己下棋，从随机游戏开始，而不是研究数以千计的人类游戏。据报道，围棋下法的可能性比宇宙中的原子还多。

鉴于此，一些媒体评论员曾问，为什么同样的计算“火力”不能重新校准来应对金融“游戏”。然而，现实不太可能一帆风顺。围棋具有完全的可观察性——棋盘的设计和棋子的数量和颜色都是预先设定好的，不能改变。在投资方面，尽管有一些常量——比如你必须投资的金额——但大多数因素和“游戏规则”更加模糊，而且随着时间的推移，监管、经济或人口环境也会发生显著变化。试图在这种无定形的环境中找到正确的路径需要核心的人类语境化技能——对如何最好地应用处理能力作出定性判断。（笔者注：金融市场的因素是开放的和变化的，这阻碍了机器学习算法的使用）

此外，围棋规则不会变化，计算机能够通过重下来探索其他下法，使AlphaGo Zero能够通过数十亿回合的自我游戏来发展其游戏策略。（笔者注：金融市场中，机器学习算法只能在历史数据中寻找规律，因此可以学习的样本是有限的。但是，AlphaGo Zero却能够像实验室实验一样，通过不断自我博弈来加快学习的速度。这也阻碍了机器学习算法的使用）

试图在金融市场做同样事情的机器面临着更大的挑战。这不仅是因为金融市场固有的排列数量是巨大的（甚至相对于去），而且“游戏”的性质随着时间的推移而改变，而且因为现实生活中的金融市场只会被玩一次。这极大地限制了通过自我发挥来制定金融策略的范围。

尽管如此，我们确实看到了机器学习作为一种从越来越大、越来越多样化的数据流中吸收信息的技术在未来的巨大潜力。我们认为，机器学习自然地扩展了现有的系统数据建模方法，这些方法已经成功地为人类行为偏差提供了强有力和理性的替代。（笔者注：人类的思维充满偏见，很容易犯非理性的错误。在投资中，量化和系统化投资会一步步替代主观的投资。但是，受制于技术的发展，量化投资对于主观投资的驱逐不是一朝一夕能完成的。最开始，量化投资从最简单的单维度的技术指标开始，然后到多维但是线性和低频的股票多因子模型。随着机器学习算法和技术的进步，未来量化投资一定会在一级市场和宏观分析等领域和“大师”们扳手腕。）

然而，这一挑战仍然是重大的，因为正如我们所讨论的，金融是一个数量级的复杂和统计上的嘈杂，比许多迄今为止机器学习报告其最大成功的竞技场要复杂得多。因此，在可预见的未来，我们相信人与机器之间的关系将保持合作而不是对抗。（笔者注：所以英士曼认为机器学习算法是有前途的，但是替代人类的路还很长）

OMI处于机器学习的前沿。我们认为，通过与英世曼的牛津研究实验室的合作，OMI处于理想的位置，为支持英世曼投资研究的科学基础做出贡献，同时也为机器学习及其跨学科应用做出更广泛的学术贡献。事实上，我们越来越多地发现，一个领域的解决方案可以在其他领域产生共鸣，包括金融和投资。

其中一个例子就是“银河动物园的超新星项目”。这是一项在线活动，向志愿者提供深空图像，并要求他们根据每个图像的特征对所看到的内容进行分类。许多这样的志愿者的答案被汇总起来，以确定哪些图像含有超新星。

OMI和英世曼之间的合作使解决这一天文学问题的机器学习方法能够应用于寻求从金融界的经纪人建议中提取有用的预测信号的任务。这两个案例都涉及到基于各种潜在冲突证据的分类决策，通过处理单个天文学家或分析师的跟踪记录进行学习。随着机器学习的成熟，我们期望找到类似的技术示例，这些技术可以跨学科转移。

当被问到他将如何花费一万亿美元来解决全球变暖问题时，已故教授大卫麦凯爵士给出了一个有些令人惊讶的答案——数据分析。隐含的建议是，学者和实践者目前没有从数据中充分挖掘信息的潜力。我们相信，像OMI这样的组织，将来自不同背景的研究人员和从业者聚集在一起，可以成为解决方案的一部分。我们认为这将大大加快进展，增强对投资世界及其他领域的洞察力。

ps：点击阅读原文，即可关注雷闻知乎账号。

更多精彩

继续滑动看下一个