Redian新闻
>
量化机器学习的实验设计和常见陷阱

量化机器学习的实验设计和常见陷阱

财经


量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据领域的主流自媒体公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。


2023《因子日历》它来啦!

限量发售,快来抢购吧!


上一篇文章跟大家分享了因子投资中的事实与误解,今天我们来讨论下“量化金融中机器学习的实验设计和常见陷阱”。一共汇总了三篇非常优秀的论文:

Dixon, Matthew Francis, and Igor Halperin. “The four horsemen of machine learning in finance.” Available at SSRN 3453564 (2019).

其中第一篇论文讨论了在金融中采用机器学习的科学方法时遇到的四个障碍。


机器学习在金融行业的应用已经超过40年,但直到最近,它才在投资管理和交易领域变得更加广泛。机器学习为金融建模提供了比线性参数模型更通用的框架。尽管机器学习具有潜力,但在金融行业采用机器学习仍存在障碍。这些障碍往往是由于该领域的跨学科性质。基于与专家的讨论,以及作者在投资银行、资产管理公司和证券交易公司使用机器学习和传统量化金融的经验,本文识别了主要的危险信号,并提供了避免它们的指导方针和解决方案。并提出了在投资管理和交易中使用监督学习和强化的例子的最佳实践。


第二篇文章的重点是回测测试的规范及如何避免回测的七宗罪。通过实现这些文章中概述的研究范式,投资经理可以避免在回测测试和建立量化模型时犯七个常见错误。

Arnott, Rob, Campbell R. Harvey, and Harry Markowitz. “A backtesting protocol in the era of machine learning.” The Journal of Financial Data Science 1, no. 1 (2019): 64-74.


机器学习有可能彻底改变投资管理的世界。然而,在金融领域应用这些技术时,有几个限制需要考虑。最大的挑战之一是数据的可用性。在许多情况下,机器学习应用程序需要大量数据才能有效,但在金融领域,数据可用性往往有限。

对于长期投资策略来说尤其如此,在这些策略中,数据的可用性可能是一个主要限制。这意味着投资者必须为他们的模型谨慎选择正确的应用,并在使用这些工具时保持谨慎。

除了数据可用性带来的挑战外,资本市场的复杂性也给机器学习带来了挑战。资本市场受到人类行为的影响,人类行为可能是不可预测的,也很难建模。这意味着机器学习技术需要谨慎应用,才能在金融领域发挥有效作用。

通过仔细选择正确的应用程序并遵循严格的研究范式,投资者可以充分利用机器学习在金融领域的潜力。在这篇文章中,作者提出了一个研究框架,既适用于机器学习技术的应用,也适用于一般的量化金融。

第三篇文章讨论了定量建模中常见的七种偏差或”原罪”。计算能力的崛起和现成回测试软件的可用性,让量化投资看起来很容易。然而,投资者在进行回测和构建量化模型时往往会犯一些常见的错误。

Luo, Yin, M. Alvarez, S. Wang, J. Jussa, A. Wang, and G. Rohal. “Seven sins of quantitative investing.” White paper, Deutsche Bank Markets Research, September 8 (2014).

读者可能对其中一些偏见很熟悉,但他们可能仍然会对它们可能产生的影响感到惊讶。其他偏见在学术界和实践者的研究中非常常见,以至于它们常常被认为是理所当然的。

这项研究有一些在其他地方不常见的独特特征。我们讨论了何时删除异常值,何时不删除异常值,各种数据规范化技术,信号衰减、更替和交易成本问题,最佳再平衡频率,以及非对称因子收益模式。我们还讨论了可用性不足对投资组合业绩的影响,并回答了投资组合中应该持有多少股票的问题。我们回顾了各种因子权重和组合构建技术的权衡,并将传统的积极投资组合管理与智能beta和因子投资的新趋势进行了比较。

最后,我们提供了一个实践案例,介绍在构建多因子模型和投资组合时如何避免七宗罪,使用一个真实的例子。量化投资可能看起来很容易,但为了成功,避免这些常见的陷阱很重要。



本文参考:
https://hudsonthames.org/experimental-design-and-common-pitfalls-of-machine-learning-in-finance/


点击阅读原文,快来抢购吧!

▼▼▼

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
液基材料:固液限域复合-为新材料设计和新技术发明赋能一个举动拯救了我2个月的实验成果!一次搞定40+实验,还不快来?博士申请 | 美国休斯顿大学机器学习与医疗健康实验室招收全奖博士生CV发论文的机会来了!南洋理工项目招生(仅限深度学习,AI,机器学习,迁移学习方向)量化金融、机器学习项目实战开课!博士申请 | 香港城市大学机器学习与优化实验室刘晨老师招收全奖博士生超越核方法的量子机器学习,量子学习模型的统一框架商业分析、机器学习、数学建模训练营、量化金融项目实战2月开课预告!首次经历和理解不寒而栗博士后申请 | 西湖大学张岳课题组招收基础自然语言处理、机器翻译、机器学习等方向的博士后C++ 类设计和实现的十大最佳实践真正的贵人,表面和常人无异,但这八个特征很明显,遇到了要珍惜!​比双缝干涉实验还恐怖的实验,或许这就是世界的真相!【干货】一文带你搞懂交互设计和作品集研究生吐槽同门博士后师姐引热议:她用经费私自买实验设备并归为己用昨天我跟着去考四科了,要买糖果,人好多,数学建模、商业分析、量化金融、机器学习背景提升项目实战1月安排!世界上最大的量子化学数据集,助力新材料设计和药物发现赴美:CDC公布更多细节和常见疑问。1月5日起,中国赴美需要新冠阴性检测报告或康复证明!Neural Eigenmap: 基于谱学习的结构化表示学习1月预告!数学建模、商业分析、量化金融、机器学习项目实战开课!元宇宙风口已过?业内专家:借着机器学习的“东风”,元宇宙之火将越烧越旺中年人带翡翠,为什么和常人不同?不是迷信,请认真记住!了解学习真相,培养自主学习的孩子博后招募 | 阿里达摩院系统Al实验室招募机器学习方向博士后一觉起来,我皇登基了。。梳理机器学习常用算法(含深度学习)静闲(对联)不要看不起小师妹整理的实验protocol,她做的实验深受我导的心!Epic技术美术李文磊:气氛和调子,UE影调设计和实战解析厦门大学夏宁邵教授团队设计基于深度学习的新型冷冻电镜图像降噪与聚类模型2月预告!商业分析、机器学习、数学建模训练营、量化金融项目实战下月开课!用 Penpot 弥合设计和代码之间的鸿沟 | Linux 中国积木式深度学习的正确玩法!新加坡国立大学发布全新迁移学习范式DeRy,把知识迁移玩成活字印刷|NeurIPS 2022开车去纽约-看不尽的秋色
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。