AQR的『量化寒冬』:下一个因子前沿!
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。
作者:Robin Wigglesworth、QIML编辑部
前言
五年前,AQR一度是全球最大的对冲基金,管理着高达 2260 亿美元的资金。
目前,AQR的AUM自2018年峰值以来已减少一半以上,目前约为 980 亿美元。
在近两年,AQR开始逐渐回血,Absolute Return策略结合了多种投资方式,2021年的收益率为16.8%;2022年为43.5%;2023年为18.5%。
数据来自:FT
2023年其他量化基金的表现:
数据来自:彭博
尽管被称为“量化寒冬”的现象已经过去,但它给AQR等基金经理带来的寒意仍然挥之不去。投资者仍持谨慎态度,业绩改善未能驱散2018-2020年撤资的记忆。这迫使许多量化分析师重新审视自己的做事方式。
三个多世纪以前,西法尔第的商人Joseph de la Vega写了第一本关于17世纪阿姆斯特丹兴起的金融市场新现象的书,书名叫做《Conusion of Confusion》。Joseph de la Vega阐述了在这个有趣的新领域如何取得成功的几条规则,比如耐心和平静地接受盈亏。
从那以后,一系列业余爱好者、理论家和实践者创造出了各种选股系统。比如Benjamin Graham的价值投资策略。Charles Dow的道氏理论,该理论催生了例如移动平均线、烛台、布林带以及金叉和死叉点等众多经典策略。
20世纪60年代,计算机在华尔街的出现改变了一切。突然之间,研究人员可以利用更多的数据和严谨的数学来进行复杂的实研究分析。少数人抓住了这个机会,以Harry Markowitz为首—— 将量化技术实际应用于投资组合管理,改变了游戏规则!
随后,芝加哥大学Eugene Fama提出了一个假设:成千上万的投资者不断地试图比对方更聪明,这意味着股市是“有效的”。这催生了上世纪70年代初的首批指数基金。
在一些市场营销中,这些因子有时被称为“Smart Beta”。但像Asness和Sharpe这样的人是讨厌这个词的,因为它暗示了其他形式的Beta是愚蠢的。然而,当单因子被单独捆绑在一起并通过ETF出售时,Smart Beta已成为最常用的指代方式。根据贝莱德的数据显示,仅就这一个行业,目前就规模达8380亿美元。
当然,这些因子并不总是有效的!
AQR 发布了两篇有问题的报告,声称用期权来对冲尾部风险的做法很“贵”,不管用(理论上)然后他们却没有告诉大家:
1、他们自己的风险溢价(基于因子投资的多空)策略赔了钱。
2、他们其他的那部分公开“垃圾”(共同基金产品)跑不赢大盘。
是对客户以及真实世界的侮辱(以上翻译仅供参考)。
护犊心切的Asness在塔勒布攻击了Antti Ilmanen之后终于忍无可忍,开始了疯狂回击。
上来先说一直想避开跟塔勒布正面交锋,认为他虽然有时候还挺聪明的,但是错的时候也很多,而且显然是个疯子,人品一等一的差。但是没办法,有时候这种疯子就是要来招惹你
然后他指出塔勒布拿Universa Investments尾部风险对冲产品的业绩和AQR风险平价以及其它共同基金产品之间,根本就没有可比性。(言下之意就是,你拿姚明跟刘翔比身高,欺负我咯LOL)
此外,针对塔勒布说AQR不揭自己短的问题,他强调自己写了50篇关于价值投资问题的文章,从来没有因为旗下价值类基金表现不好,而对其避而不谈。
其中点赞数最多的是这条,想必也是激起了广大网友的共鸣。
当然以Asness火爆的性格,不口吐芬芳是不可能的
他认为,像他这样的Quant的原罪在于,他们挖掘历史数据,寻找长期有效的线索,但却掩盖了市场机制的事实。这可能意味着过去有效的方法在未来可能失败。量化投资的核心是将回测试应用于未来的投资决策。但是,如果规则改变了,进行量研究和回测意味着什么呢?
不能复现就是耍流氓!
杜克大学金融学杰出教授,Research Affiliates 合伙人,Man Group投资策略顾问Campbell R. Harvey在论文《The Pitfalls of Asset Management Research》里写道:
In my 35 years as an academic, as an advisor to many asset management companies, and as an editor of one of the top academic journals in finance, I now fully appreciate the crucial importance of the role incentives play in the production of research.
激励问题,加上统计方法的误用,导致了一个不幸的结论:即金融领域大约一半的实证研究结论可能是错误的!
这个观点其实埃隆·马斯克也说过,那是在2013年可汗学院的一个采访上。
马斯克说:大多数学术论文都毫无价值!究竟有多少PhD论文被人真正用过?
针对这个问题。其实目前在业界与学界引起了大家的广泛讨论。
在Quora上,工程师副总裁Xavier Amatriain针对这问题的回答比较中肯:作为多篇论文的作者以及审稿人,Amatriain 表示:“现行的学术体系并不以提升‘实用性’为基础,一旦接受了这一设定,那么多数论文无用(useless)就毫不奇怪了……至少 useful 的部分定义是如此。” Amatriain 继续说,学术论文主要从是否有新意(novelty)、有意义(significance)和有多少原创性(originality)这几个方面考量。所以,在评论一篇学术论文的时候,真正应该问的是:这篇论文对这届学术论文是否有意义,而非问这篇论文是否对全人类有意义。
QIML之前写过一篇文章大家可以好好看:
由于Asness认为,量化策略的盈利能力主要植根于人类行为,而人类行为不会发生太大变化。AQR甚至在the Journal of Finance上发表了一篇论文,驳斥了大多数流行的投资因子无法复制的观点:
价值因子是2020年表现最差的因子,已连续4年下跌!价值的四个构成部分都在亏损:
Price to book、Long-Term Reversal、Earnings Yield、Dividend Yield
我们都知道,AQR一直是“价值”的捍卫者!
Asness在2021年洋洋洒洒写了一篇文章(23页,1.7万字)来为价值辩护,提出了另一个支持“价值”的论点。
在这篇论文中解释了:为什么长期价值预期收益率大大高于多数投资者可能认为的水平。
根据美国银行本月的一份研究报告显示,在购买大票的美国主动基金中,有70%在上个月超过了罗素1000指数,这是自2007年以来的最高水平。大型基金平均表现优于大盘85个点,创下2009年全球金融危机重创市场以来最高Alpha值。
美国银行分析师将价值型股票的上涨描述为有史以来最强劲的上涨之一!2月份,价值型股票的表现超过了成长型股票。
同时,报告中还强调,量化基金也正逐步向价值股倾斜,2月份表现也十分强劲,其中72%的基金超过基准。分析师还表示,上月成长型基金是选股者的“天堂”,这一点尤为明显!
回到主题。Asness在论文中写道:
每个人都知道,自1990年以来,在样本外,价值策略一直令人非常失望。就连Eugene Fam和Kenneth French也知道这一点。Asness主要是想表达Fam和French去年写的一篇论文,具体大家可以有空去读。
但是,尽管这听起来可能很奇怪,一个策略的实际平均收益并不一定是其真实长期预期收益的最佳估计值。
Asness解释道:
为什么?因为平均收益的主要因素之一是估值的变化!
根据Asness的说法,当估值的极端变化被纳入收益预期时,可能会导致投资者高估或低估未来的收益。他指出,来自Research Affiliates、AQR和其他机构的早期研究表明,考虑这些估值变化可以显著提高估值的精度(不仅仅是一个不同的、偏差较小的估值)。
Asness在论文中继续论证了这一论点,使用回归分析来说明估值变化对标普500指数、美国政府债券和美股相对于其他发达市场股票的实际收益率有多大影响。然后他转向了价值。
Asness发现,在1990年之后,价值的挫败很大程度上是价差变化的结果,即价值股票在这段时间内变得比成长型股票便宜得多。如果你认为这种价差不会永久扩大,那么你对真实价值预期收益率的负面程度就不会像那些只关注时间收益率的人那么严重。
Asness特别研究了2018年至2020年间“可怕的价值崩溃”,他发现:
如果不是因为低估值股票对高估值股票之间令人讨厌的大幅模贬值,价值投资者本来应该能够获得3.4%的收益,而不是实际每年11.9%的损失。
这些结果表明,过去三年的价值崩溃主要是价差扩大,而不是基本面被破坏。投资者只是为同样的基本面(估值低的股票 vs. 估值高的股票)支付了更多的钱,与2017年底相比,基本面有了根本性的改善。
总之,Asness认为:
计算估值变化使我们更确信股票市场、债券市场和价值因子的预期收益是良性的正收益(即使我们仍然必须忍受估值变化导致的现实波动)。同样,它让我们更确信全球股票的平均收益与美国股票的平均收益并没有真正的不同。所有这些都对长期资产配置具有重要意义。
我们希望这种分析使价值从历史的垃圾箱中被拯救出来,许多人则根据1990-2020年样本外(或更近的)表现将其扔进历史的垃圾箱中。价值策略比许多人想象的要好得多,我们要增强对价值因子的长期信心,以及我们在艰难时期(有时是非常艰难的时期)的耐心与坚持。
最后,Asness深情的写到:
最后,一个重要结论就是是策略本身的可持续性,它是否能像我们预期的那样持续稳定的带来预期收益,无论是持续的高收益或者是令人失望的低收益。我们所在乎的是策略逻辑的是否如我们预期的那样。但这在现实中很难实现,很多时候,你会发现你坚持了很长时间的策略,其实逻辑是错误的。然而,这就是投资的真实情况,也是我们选择这份事业所需要的面对的。
这篇论文并不能改变这些事实,坚持长期亏损的投资确实非常困难,正如避免爱上牛市的困难也是如此。确实,过去三十年估值策略的表现低于预期,且在最近三年表现非常差,这主要是由于估值的变化(你预期这不会持续),但我们也挺过来了!但是,这也并不意味着人们不会吵着要你的脑袋!我们希望这种分析可以克服这些困难,避免我们在估值低的时候放弃好的策略,或在估值高的时候超配这些策略。
然而,尽管投资业绩出现好转,投资者仍在继续从AQR撤出资金,这一点很说明问题。今年,AQR的AUM自2017年以来首次出现增长,但这主要归功于业绩的改善。
下一个因子前沿
AQR:机器学习相关论文推荐
对于大多数非结构化数据集,数据历史很短。例如,使用社交媒体,你可能有十年的数据要处理。有限时间序列对有意义的回测提出了挑战。由于历史较短,对策略表现形成准确的估计就更加困难,这最终意味着,即使是非常强烈的信号,在投资组合中也可能只会谨慎地获得很小的权重。
另类数据更多的应用于偏股票型的量化对冲基金。近于实时的另类数据流有助资产管理公司提前获得大量股票买入或卖出的信号。除此之外,传统资产管理公司也已经开始使用另类数据来帮助提升人工制定长期投资决策的质量。例如,英国资产管理公司Schroders在2014年推出了一个“数据洞察部门”(Data Insights Unit,以下简称“DIU”)。DIU拥有30名数据科学家,他们分析各种另类数据,帮助投资组合管理团队制定中长期投资决策。
欧美市场也正在形成包括使用另类数据的资产管理经理、数据所有者和供应商的另类数据生态系统。例如,Orbital Insights和Prattle两家另类数据供应商,前者利用卫星图像估计原油库存,后者根据文本数据定量分析主要国家货币政策情绪。
投资机构为了获得超额收益,不断寻找新的市场阿尔法,但主动型基金在寻找市场阿尔法这个核心竞争力上的优势越来越弱:
1、因为市场有效性不断增强,基金经理很难找到被错误定价的资产;
2、因为大部分基金经理能得到的信息同质化,导致很难找到独特的信息优势和额外信息;
3、因为调研高度人工化导致人才的费用越来越高。
目前国内使用另类数据的多为对冲基金、二级市场基金及部分一级市场基金。另类数据可以给基金经理带来五点优势:
更大体量的数据和信息
新的洞察力
竞争优势
可靠性
效率
虽然基金经理使用另类数据寻找到新的阿尔法只是时间问题,但并不是所有另类数据都有潜力可以帮助基金公司获取市场阿尔法,因此另类数据公司在收集、清洗数据的同时,需要基金经理来评判数据是否有价值,同时高效的处理和应用将是降低成本和提升效率的关键,因此另类数据公司应当具备机器学习等技术开发能力和高效的产品策略。
另类数据 (Alternative Data) 包括传统数据之外的新的数据,主要成分如下图。
个人数据
个人数据 (Individual Data) 是由个人网上行为产生的,它还可细分为
社交网络数据 (social media data): Twitter, LinkedIn, 微信
新闻舆论数据 (news & reviews data): 新闻、产品舆论
网页搜索数据 (web search data): 谷歌搜索、百度搜索、邮件
案例:
iSentium 提供交易股票时用到的 Twitter 上的情绪数据指标
RavenPack 提供交易债券、外汇和股票时用到的新闻情绪数据指标
商业数据 (Business Process Data) 是由商业流程产生的,它还可细分为
交易数据 (transcation data): 主要是消费者交易数据 (Square,Intuit, Xero 等)
公司数据 (corporate data): 主要是行业数据 (AROQ, Edmunds, SNL Financial, Smith Travel 等)
政府机构数据 (government agency data): 国际级别(IMF, WTO, World Bank),国家级别(美联储, 人民央行)
案例
Eagle Alpha 提供交易个股时用到的用户电子邮件收据。
传感数据 (Sensor Data) 是由手机、无人机、卫星上的传感器产生的,它还可细分为
卫星图像数据 (satellites images data): 卫星、无人机
地理定位数据 (geolocation data): GPS、手机 APP
天气数据 (weather data)
案例:
Advan Research 提供交易个股时用手机记录的地理位置数据 (根据人流量预测零售)
RSMetrics 提供交易个股时用无人机拍的停车场和仓库图像数据 (根据车位占满率预测员工)
使用「另类数据」有利有弊
优点是没被处理过,也没有为其他使用者提供,因此有很高的价值等待发掘,深度学习里的「计算机视觉」和「自然语言处理」的技术可以用来处理图像和文本数据
缺点是「获取昂贵」和「隐私忧患」
另类数据并非神秘的、完全新生的事物,而是人类扩展信息边界的漫漫过程中的又一次量变性突破。之所以这么说,是因为另类数据完全是一个具有相对性与变化性的概念。将历史拉长来看能更好理解:两百年前,地缘政治事件是另类数据;一百年前,股票价格数据是另类数据;五十年前,路透社公司首次将公司报表数字化之前,公司财务报表数据是另类数据。当时的这些数据和当今的网页数据等等很相似,都对于投资决策有重要意义,但其获取成本还未降低到足以使其普及。随着后来技术的不断进步,这些数据逐步被正式纳入投资决策数据,构成了今天的我们所认为的传统数据。而随着今天和未来技术的发展迭代,越来越多之前无法利用的有效信息、当下我们所称的“另类信息”也将逐步常规化,成为未来的传统数据。
微信扫码关注该文公众号作者