多少因子才管够?
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。
来自:Factor Zoo (.zip)
作者:Alexander Swade、Matthias X. Hanauer、Harald Lohre、David Blitz
在一个以因子数量多少论英雄的时代,多少因子才管够?
在本文中,我们发现,在不影响对可用Alpha的解释的情况下,大量的因子可以被压缩到仅仅 15 个,这表明目前在资产定价模型中许多因子之间存在显著的重叠和冗余。
本文核心发现如下:
使用美股数据,15个因子对Alpha的解释能力就能替代所有测试的153个因子。 基于特定因子筛选逻辑的动态因子模型,在与比较基准(即普通的学术因子模型)的因子数量相同的情况下,它们也击败了普通的学术模型。 在动态因子模型中,我们经常发现新发表的因子会取代旧的因子,说明因子持续创新的重要性。 以上发现,在美国以外的市场也同样成立。
为了从Alpha角度确定一个能够复制整个因子动物园的简化因子模型,我们遵循一种非常直观和有效的嵌套模型方法:
我们迭代地向因子模型中添加新因子,直到新增的因子再也不能解释剩余的alpha。我们的起点是CAPM,然后我们添加了两个能够解释最多Alpha的因子(通过最低GRS统计量来测量)。请注意,此选择标准相当于为现有模型选择具有最大alpha t-stat的因子。一旦确定,该因子将永久地添加到因子模型中,并且我们重复该过程,直到没有重要的因子留下(详细步骤可参考原文)。
在整个筛选过程中,有两个值得注意的地方:
1、用什么指标判断该因子是否该被加入到模型中?
Gibbons, Michael R., Stephen A. Ross, and Jay Shanken (1989). “A test of the efficiency of a given portfolio.” Econometrica, 1121–1152.
2、筛选的迭代过程如何停止?
我们使用一个简单的标准,要求剩余有效因子Alpha的总数为零。也就是说,一旦确定了新的因子模型,我们就根据该模型测试所有剩余的因子,并确定剩余候选因子的Alpha值。如果新增加的因子是显著的,则在此过程中剩余显著因子α的数量应该减少。
本文使用了Jensen, Kelly, and Pedersen(2023)的全球因子数据库,总共有153个因子,覆盖93个国家。
下表给出了基于美股因子,因子筛选迭代的过程,第一列为迭代的次数。可以看出迭代到第15次,t大于3的因子数量就为0了,也就是说153个因子中具有显著Alpha解释能力的15个因子已经筛选出来了。
请注意,15个选定的因子来自13个定义的因子样式类别中的8个,并且没有考虑其余5个类别中的因子,请参见图2中突出显示的因子条。此外,所选择的因子不一定是在给定因子风格集群中具有最高CAPM alpha的因子;事实上,这只适用于价值、质量、短期反转和季节性集群。值得注意的是,虽然8个代表性因子集群中有5个仅具有单个因子,但价值,低风险和投资集群由3到4个因子代表。
下图突出显示了随时间变化的相关因子,并以其相应的因子样式簇为颜色。也就是说,每当在相应年份的因子模型中选择一个因子时,它就会在时间轴上突出显示。虽然绝大多数因子要么从未被包括,要么很少被包括,但表1中全样本证据中的最重要因子却非常突出,尤其是在过去10-15年里。我们观察到,一旦一个有代表性的因子被发布,在大多数情况下,许多因子风格集群都被包含在模型中。例如,大多数时候都存在价值集群,但自Jegadeesh和Titman(1993)发表以来,动量集群也不断出现。其他持续性因子类别包括应计项目、投资、季节性和短期逆转。
以上的分析基于全部历史,接下来基于180个月的滚动窗口看一下因子筛选的情况。下图可以看出所代表的因子风格集群随着时间的推移而缓慢变化,并且通常存在一些具有低波动性、季节性和质量集群代表性的因子。有趣的是,经典的规模因子很少被选择,而且似乎与跨越其他因子的Alpha无关。
下表记录了基于全球因子数据的迭代因子选择。尽管使用了全球因子和较短的样本周期,但与表1中美国的结果相比,我们观察到所选因子有很好的重叠。在前十个选择的因子中,有三个是相同的(cop_at, resf3_12_1, cowc_gr1a),两个选择的投资因子是美国的很相近。
微信扫码关注该文公众号作者