Redian新闻
>
明汯解环宇:AI核心三要素在量化投资的应用与落地

明汯解环宇:AI核心三要素在量化投资的应用与落地

财经


2022年世界人工智能大会数据智能论坛于9月3日在上海世博中心举行。明汯投资、JPMorgan、路博迈、贝莱德建信等多家国际科技、金融头部机构参与。作为本届世界人工智能大会承办单位之一,数库科技于9月3日下午举办以“数无疆·智无界”主题分论坛

明汯投资合伙人、投资总监解环宇9月3日在2022年世界人工智能大会上发表了《未来已来——人工智能开启量化投资新篇章》的主题演讲,从AI与量化投资的发展进程谈起,再结合AI核心三要素拆解人工智能在量化投资的应用和落地,最后以如何打造高效迭代量化投资AI框架展开阐述。



在解环宇看来,人工智能核心三要素(数据、算法、算力)在量化投资中都至关重要,三要素协同有助于量化投资策略持续⾼效迭代,如某一要素出现明显短板则有可能造成错失高速发展机遇。“2021年,我们自有的高性能计算集群已经位居世界超算排名TOP500榜单前列。预计到今年底,我们的计算集群将拥有1500张GPU卡,3万CPU核、1Pb内存以及5Pb磁盘存储,在金融数据的应用场景下AI算力达到400P Flops。”


解环宇演讲中还展示了其目前实践的量化投资AI框架,在他看来一个较为成熟的量化投资AI平台应该具备两大特质:前瞻性和高效迭代,前者体现在较为完善的顶层设计上,后者体现在多项目协同推进中。


以下为演讲实录精编:


各位嘉宾下午好,我是明汯投资解环宇,非常感谢主办方的邀请,可以有这样的机会和大家分享今天的主题:未来已来—人工智能开启量化投资新篇章。

我的分享内容主要分为三部分:


第一部分是关于AI与量化投资的发展进程

第二部分我将结合人工智能的核心三要素,展开谈谈在量化投资中应用与实践

第三部分我将以图表的形式为大家呈现目前使用的量化投资AI框架。


首先我们一起来回顾下AI与量化投资的发展进程,大家看这张图:

前面这段AI发展的历史我不多做赘述,几经波折到90年代,一些实验室的学者和量化界的前辈,开始把人工智能的概念和方法论引入量化投资领域,像大家熟知的几家国际顶尖对冲基金也都在那个时间段相继成立,比如D.E. Shaw成立于1988年,Citadel成立于1990年,Two Sigma成立于2001年等。但在那个时间段,AI在量化界更多的是以概念的形式存在,实战中还是以定价模型和统计方法为主流。


但从2000年开始,统计学习,机器学习等方法逐渐被大家所认可,更多的对冲基金开始使用更加复杂的预测模型,随着技术和数据的积累便有了后面深度学习、强化学习等人工智能技术。


其中在我看来最为重要的时间点是2016年,在此之前的十年,量化同其他行业一样都非常关注神经网络,也做了大量投入,但缺少一个极具说服力的成果坚持下去。2016年谷歌DeepMind开发的AlphaGo打败世界围棋冠军李世石。这是非常轰动的事件,算是AI的一次“破圈”,深度学习(Deep Learning)、强化学习(Reinforcement Learning)等字眼被人们熟知,整个工业界,量化界加速把重心从统计学习,机器学习转到更前沿的深度学习上,也是从这个时点开始,大家真切的感受到:未来已来。


接下来再简单回顾下AI与明汯投资的发展进程。明汯于2014年4月成立,其2014-2016年是公司的起步阶段,以传统的统计方法为主。


接下来的2017,2018年,我们开始系统性地加入机器学习和深度学习技术,成为国内最早一批将人工智能技术成功应用到金融市场的量化私募管理人。


2019年开始,我们进一步加大投入,开始大规模建设高性能计算集群,每年我们都在持续投入,目前仍处在指数增长阶段。


那随之也带来一些不错的成果,比如2019年年底,明汯投资管理规模率先突破300亿;到2020年中,明汯成为国内首家管理规模突破500亿的量化私募管理人。可以看出,明汯的成长历程也是人工智能在量化领域的一次成功探索。


我们的脚步没有停下,反而不断加快。2020年,我们设立北美投研中心,从中国走向世界,持续吸收全球顶级投研人才,为明汯提供世界最前沿的技术支持。2021年,我们自有的高性能计算集群已经位居世界超算排名TOP500榜单——这对一家量化投资机构是非常难得的。


基于这样的高性能计算集群,一个成熟的量化投资AI框架应该具备哪些特质?首先要有前瞻性,体现在较为完善的顶层策略架构设计上;同时要高效迭代,需要多项目协同推进。具体来看可以归纳为五个观察维度:标准化、流程化、自动化、智能化和精细化。



那接下来我们结合人工智能的核心三要素,展开谈谈其在量化投资中落地与应用。


第一个核心要素是数据。金融数据与其他行业的数据不同,较为复杂。


1、金融数据的复杂性:

a、低信噪比

“低信噪比”意味着数据中噪音比例高,提取有效信号的难度也就比较大。模型在学习过程中,如果调整不够得当,就容易学习“噪音”。由于这一特性,我们在制造模型的时候,尤其强调避免过拟合。

同时处理金融数据时要非常注重逻辑。以A股为例,不同的股票具有不同的涨跌停规则,另外新股上市以及复牌等行为,这些都要特殊处理。所以我们要在逻辑的基础上,对信息进行合理挖掘、过滤、组合。

b、时序单调性

我们的目的是用历史数据预测未来,所以一定要避免未来信息的引入,并要合理评估历史回测。


2、金融数据的类别

a、标准化数据

比如交易所原始数据、原始行情,各类衍生出来的价格、交易量、K线图等等。你打开一个炒股软件,上面可能会有分时图、K线图等。这些其实都是基于交易所原始数据衍生出来的数据,这些比较“Clean”,我们称之为标准化数据。

b、非标准化数据

比如新闻论坛、分析师报告,券商提供的一些文本数据,或者专业的第三方机构供我们参考的一些数据。这些数据相比标准化数据会“Dirty”一些,需要对它做数据清洗。


第二个核心要素是算法。算法无疑是整个量化投资的核心,也可以称之为模型。


1、因子挖掘模型:简单来讲就是把清洗好的数据做特征工程

a、逻辑因子挖掘

举个简单例子:过去一段时间的收益率就是一个特征,描述的是过去一段时间内股票涨跌的状态,通过回测,通过评估,你可能会发现这样的特征在未来会具有一个趋势或是反转。

b、算法因子挖掘

另一类则是这样的:可能我只是把一些价格、交易量或者其他数据输入到算法里,让算法学习在目标下学习出最优参数,这种称为算法做出来的因子,这类因子更注重在预测中的表现而非逻辑。


2、预测模型

当我们做完因子工程之后,我们就要去做预测模型。其实,绝大多数的量化策略的本质就是做预测,比如预测未来一段时间的收益率,那有哪些模型呢?


a、注重可解释性的线性模型:OLS

b、统计学习、机器学习模型:Lasso、SVM、GBDT

c、可端到端的深度学习模型:DNN、LSTM、Transformer、GNN


以上三个模型也侧面反应出我们的迭代进程,复杂度逐渐递增。其实很长一段时间我们都把机器学习作为我们重点研究的对象,比如说树模型,其模型复杂度、参数相比传统统计学习模型有了很大的提升,预测效果也更好。那再到后来的深度学习模型,复杂度进一步扩展,你能调出的结果的空间自然比原来扩大许多。


总体而言,预测模型的发展是从简单到复杂、未来还要更复杂的过程。


3、组合优化及交易算法模型:

a、传统的均值方差模型(Mean-Variance Optimization)

b、比较前沿的强化学习模型(Reinforcement Learning)


第三个核心要素是算力。模型的算法依赖算力。我们从早期简单的几台CPU服务器,算是“小米加步枪”,到目前大规模高性能计算集群,其实只经历了五六年的时间。预计到今年底,我们的计算集群将拥有1500张GPU卡,3万CPU核、1Pb内存以及5Pb磁盘存储,在金融数据的应用场景下AI算力达到400P Flops。而去年同期的数字只有1/4,大家可以直观感受到:我们每一年在高性能计算集群的投入非常巨大。


未来我们会进一步扩建计算集群,现在每个月都要做一次规划,为未来半年、甚至一年算力扩张提前做好准备,这样才能为各种算法模型的训练提供充足的资源保障。


结合刚才所说的三要素,接下来分享下我们目前所使用的量化投资AI框架。


最右侧的图可以这样认为,在实盘中是真正的市场或者是交易所,各方参与交易的场景;在回测中你可以自己构建这样的机制,来模拟市场环境。


左边是底层、应用层和分析层。底层就是设施+数据,包括数据模块和各种各样的计算资源、网络资源、存储资源。


当市场数据流向底层之后,我们会先进入数据模块,经过数据清洗、标准化处理,再流向应用层。应用层主要包括刚才提到的算法,分为因子部分模型部分和交易部分,当预测模型得到结果后,就会进入组合优化和交易执行。经过组合优化和交易执行后,就会形成交易发单给市场,市场再形成交易回报,返回给交易单元。


刚才提到的这些底层和应用层形成的数据其实都可以和分析层进行交互。从底层看起,我们要对硬件和数据做监控和分析,来保证整个平台基础的可靠性。再比如应用层,因子工程要做很多因子评估,同理做出的模型也要进行模型评估。交易程序做出的交易,交易程序所得到的交易回报,要进行风险评估和交易分析。交易分析对整个量化非常重要,你的交易记录可以帮助你迭代模型、优化算法。

可以看出,人工智能体现在量化框架的每一个环节和角落,相信在未来会有更多的应用。


今天的主题分享就讲到这里。下周六(9月10日)是中秋节,提前祝各位嘉宾中秋快乐,想起《短歌行》里的一句诗“明明如月,何时可掇?”,曹操的这一千古名句更多是表达自己对贤才难得的忧思。


在我看来,量化投资与人工智能,归根结底还是“人”。这一个个工程的背后凝结的是人的才智和汗水。我希望能有更多的人才关注量化投资领域,也希望有越来越多的“贤才”加入我们,一起来完成这些有意义又有意思的工程!

谢谢大家!

  


更多阅读

明汯投资解环宇:打造国际一流量化投资机构     

茂源秘密武器揭秘

交易门对话新晋百亿致诚卓远创始人史帆

交易门独家对话启林投资创始人王鸿勇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
文因互联飞梭智能文档认知平台在金融场景的应用和实践 | 中国卓越技术团队访谈录搞定这“三要素”,创业更轻松!从蔡京鹡鸰颂题跋看莫言招骂获上海家化投资,年营收千万,本土香氛品牌节气盒子,如何打造独特的东方嗅觉体验?重构实时离线一体化数仓,Apache Doris 在思必驰海量语音数据下的应用实践微观纪元在量子编码与化学领域取得进展|左芬三六零发布三季报 优化投资结构,坚定投资未来专家总结:无创影像学检查在冠心病诊疗中的应用 | CMIT 2022把激光雷达装在量产车上,总共分几步?他靠量子力学拿了诺奖,却在量子力学上挂科,还连挂两次大话西游6:《西游记》的设定有多惊人,是个循环宇宙,先有人而有神?洛杉矶Eggslut的炒鸡蛋夹心三明治竟然如此美味!匹夫有责与匹夫有权揭秘全球量化投资之父西蒙斯兴业银行财富演播室,问道量化投资,解密盛丰衍的量化哲学!【报告】中国企业低代码/无代码产品应用与实践研究——构建数字化作业体系的变速齿轮 | 甲子光年智库兰卡资讯|投资局简化投资审批程序;兰卡位列13个最安全旅游目的地;下周二巴士罢工“女友腿软挂了科三要我赔?!”这是爷免费能看的?「纽维尔」获3000万A轮融资,为餐饮商超提供可降解环保餐具丨36氪首发即将直播|聚焦产学研|共话iPSC在细胞治疗中的应用与产业化发展美颜后的样子已成“大热门”!中国元素在平面设计中,为何如此受欢迎?独立日+扬州菜+上海美女百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限猛招一波!明汯星阔蒙玺涵德博普平方和锴量微观博弈裕锦【往期价值班精彩集锦】股票投资食物链以及价值投资三要素【深度报告】HR SaaS应用与实践研究报告:数字化工具与数字化服务并驾齐驱丨甲子光年智库他靠量子力学拿了诺奖,却在量子力学上挂科,还连挂两次|直击诺奖实在智能创始人、CEO孙林君:数字员工——AI在RPA领域的应用与落地京沪两地敦煌大展!千年壁画,玉门古城,奢享古堡与落日大对数人不会永远在量化投资领域工作!Loft与落地窗,洛杉矶多少人的终极梦想被它实现了?歷史清0【即将直播】聚焦产学研|共话iPSC在细胞治疗中的应用与产业化发展年度GMV超30亿的品牌在「视频号」抓住的3大核心要素 | 周五直播
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。