Risk-Return Tradeoffs (I)
作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。《因子投资:方法与实践》领衔作者,《机器学习与资产定价》译者。
封面来源:https://www.pexels.com
未经授权,严禁转载。
摘
要
隐性多因子模型如何成为研究资产定价的重要范式?且听 Kelly and Xiu (2023) 娓娓道来。
上期公众号介绍了 Giglio and Xiu (2021) 提出的 three-pass estimator。它在 Fama-MacBeth regression 的基础上加入了 PCA,是近年来通过 PCA 研究隐性因子模型的代表之一。
在隐性因子模型中,因子暴露和因子都是不可观测的,而是需要通过统计手段估计得到(因此按照 FF 方法构造的 HML 就不是隐性因子)。在这方面,对(大量)资产的协方差矩阵进行 PCA 就是最重要的工具之一,而这背后的理论基础正是源自 APT。这样得到的因子也被称为统计因子(statistical factors)。
当然,如果仅仅是从资产的协方差矩阵出发,那么能够利用的信息将会十分有限(即只用了收益率信息)。为了利用到更多的信息(例如 firm characteristics),可以将因子暴露直接建模为特征的函数,即
铺垫了这么多,是因为今天我想翻译一下 Kelly and Xiu (2023) 的第四章(Risk-Return Tradeoffs)—— 对,我把第三章跳过去了。第四章中涉及的最重要两篇文章就是 Giglio and Xiu (2021) 以及 Kelly et al. (2019) 的 IPCA 模型。此外,由于原著的第四章内容过于丰富,本文只覆盖到其中的 4.3 节。后面的三小节将会在后续推文中介绍。
再次感谢王熙和刘洋溢对内容的反馈。本翻译仅供学习交流使用,禁止一切商业行为,未经授权,禁止转载。
最后,祝各位中秋、国庆节快乐。
以下是正文部分。
上一章主要关注于监督预测模型而没有考虑风险和收益率之间的权衡,因此它们并不是资产定价模型。本章将通过无监督和半监督学习方法提出因子定价模型,它们明确地考虑了风险和收益率之间的权衡问题。
4.1 套利定价理论基础
Ross (1976) 的套利定价理论(APT)为数据驱动的和基于机器学习的因子模型分析奠定了基础。它表明,通过部分模型设定 —— 本质上只需假设线性因子结构,因子数量固定,以及无套利这一基础的经济假设 —— 我们便能方便地通过研究因子组合来学习资产定价模型,并了解收益率中哪部分是可以分散化的,而哪部分则不能。换句话说,APT 为关于风险与收益率权衡的实证分析提供了一个蓝图,而无需使用者了解导致资产定价因子背后的机制。因此,我们可以利用机器学习方法进行隐性因子分析,从而得出关于实证资产定价现象的全新见解。
我们还推荐读者参阅 Giglio et al. (2022a) 关于收益率因子模型的综述。在这篇综述中,几位作者依照因子是否是可观测的、
4.2 无条件因子模型
Ross (1976) 的 APT 是以如下这个统计因子模型为前提:
其中
另外,
上式意味着,承担特质性风险的补偿并不会随着投资范围的扩大而激增(译者注:根据原著脚注的说明,
4.2.1 使用 PCA 估计因子
受 APT 的启发,Chamberlain and Rothschild (1983),Connor and Korajczyk (1986) 以及 Connor and Korajczyk (1988) 均主张,当因子和因子暴露均无法观测时,使用主成分分析(PCA)作为因子模型的估计方法。为此,一个等价但更方便的处理方法是对去均值之后的收益率
其中
上述因子估计值是标准化的,因而满足
Connor and Korajczyk (1988) 最早使用大约 1500 支股票研究了隐性因子模型的表现。他们发现,尽管基于 PCA 的因子模型比起 CAPM 模型更能解释样本中的风险和收益率,但它依然会产生很大且显著的定价误差。一般来说,无条件因子模型很难描述个股级别的数据。基于该研究以及其他相关研究,无条件隐性因子模型(及其通过 PCA 的估计)自 Connor and Korajczyk (1988) 之后便淡出了人们的视线。Kelly et al. (2019) 利用最新的数据也证实了上述发现。他们显示,在横跨 1962—2014 年的 CRSP 股票面板数据中,PCA 在估计个股风险溢价方面极不稳健。
近年来,利用 PCA 对收益率因子建模再次回到了人们的视线之中。这个现象在很大程度上源于这样一个事实:尽管 PCA 在描述个股股票面板数据时效果不理想,但它在对投资组合的面板数据建模方面取得了巨大的成功。例如,Kelly et al. (2019), Kozak et al. (2018) 以及 Pukthuanthong et al. (2019) 均表明,通过 PCA 分析异象投资组合的面板数据而得到的因子模型能够对这些很好地为这些组合定价,表现为经济意义很小的定价误差。这些分析是建立在 Geweke and Zhou (1996) 的早期工作之上,他们使用 Gibbs 抽样法从投资组合级别数据中提取隐性因子。
对于隐性因子模型而言,由于该模型的不确定性(译者注:即可以通过旋转得到等价的模型),它的一个潜在的缺点是人们难以解释估计出的因子。然而,当我们关注的对象不受旋转影响时,使用隐性因子模型就会变得非常方便。下面我们就来看这样一个例子。
4.2.2 风险溢价的三步法估计量
因子的风险溢价等于均衡状态下投资者因暴露于该因子的风险而要求的补偿。许多理论经济模型是基于一些不可交易因子(即因子本身并非某个投资组合),如消费、GDP 增长、通货膨胀、流动性和气候风险等,来开发的。为了估计一个不可交易因子的风险溢价,我们需要构建一个模拟该因子的投资组合并估计其预期收益率。为了便于阐述,假设某个不可交易因子
其中
通过将 Fama-MacBeth 回归与 PCA 相结合,Giglio and Xiu (2021) 提出一个三步法估计量来对
第三步则是计算
最终,
Giglio and Xiu (2021) 进一步给出了该估计量的渐近性质。他们对基于 PCA 结果的 Fama-MacBeth 回归的渐近分析为风险溢价、随机贴现因子(Giglio et al. 2021b)以及
三步法估计量和基于 PCA 回归的模拟投资组合密切相关。后者是使用
在实证研究方面,表 4.1 汇总了使用不同方法对若干不可交易因子的风险溢价估计,其中包括 Ludvigson and Ng (2010) 中的工业生产增长的 AR(1) 冲击(IP),以及 279 个宏观金融变量的前三个主成分的 VAR(1) 冲击,Pástor and Stambaugh (2003) 的流动性因子,He et al. (2017) 的中介资本因子,Novy-Marx (2014) 的四个气象因子,以及 Malloy et al. (2009) 的一个综合消费因子。
表格中的结果清晰展示了传统两步法回归中存在的两个问题:遗漏变量偏误以及测量误差偏误。两步法估计量依赖于研究者选择哪些基准因子作为控制变量。然而,就这方面而言,经济理论往往无法提供足够的指引。遗漏控制变量通常会导致风险溢价估计量出现偏误。以流动性和中介资本因子为例,对于前者而言,当使用单变量的两步法回归时,其风险溢价估计值为每月 226 个基点,而一旦使用 FF3 因子作为控制变量,其风险溢价则变为 57 个基点;类似地,对于后者而言,两种情况下的风险溢价分别为 101 和 43 个基点。
式 (4.5) 也可用来分析噪声因子(
4.2.3 PCA 延伸
虽然 PCA 是发现因子的最常见方法,但也还存在其他一些具备独特特点的拓展。例如,Giglio et al. (2021a) 采用矩阵补全来估计因子模型,以应对不平衡面板收益率数据的问题。假设
其中
标准 PCA 实现方法是对去均值后的超额收益矩阵
Lettau and Pelger (2020a) 建立了 RP-PCA 的渐近理论,并指出在没有定价误差且因子是普遍存在的情况下,它比 PCA 估计量更有效。虽然标准 PCA 方法对定价误差的存在并不敏感,但由于定价误差存在时资产预期收益率不再和因子暴露一一对应,因此该误差可能会导致 RP-PCA 估计量出现偏移。我们猜测,如果施加了无近似套利的经济约束 (4.2),该偏移则是可以渐近忽略的,因为在这种情况下
Giglio et al. (2021b) 指出一个因子的强度取决于测试资产的选择。如果所有的测试资产都是对市场暴露为零的多空对冲组合,那么即便是市场因子也会被认为是一个弱因子。为了解决风险溢价估计中的弱因子问题,该文提出了一个基于监督 PCA 来选择检验资产的方法(如第 3.5.2 节所述)。此外,这个方法可以被用来检测随机贴现因子模型中的缺失因子。
4.2.4 有哪些因子?
人们为了解释股票预期收益率截面差异,已经找到了数百个潜在的候选因子。然而,其中很多因子在控制了其他因子之后便对资产定价而言没有增量的解释力,因而是冗余的。有些因子甚至自身就是完全无用的,没有任何解释力。
机器学习方法可以通过降维和变量选择来解决冗余和无用因子问题。例如,通过将平均收益率对因子协方差进行 LASSO 回归可以获得一个简约的因子集,它们能够在截面上很好地为资产定价。与此同时,错误选择也是难以避免的:过度拟合可能导致选出无用的因子;相对解释力较弱的因子可能被遗漏;冗余的因子也有可能被选出从而取代真正的因子。Feng et al. (2020) 的发现(图 4.1)显示,在交叉验证时采用不同的随机种子(即随机将样本数据分割为多个子集)会对 LASSO 回归的结果产生重大的影响。
Feng et al. (2020) 将 Chernozhukov et al. (2018) 的双机器学习框架和两步法横截面回归相结合,提出了一个能够识别与资产定价密切相关的因子的方法,并同时给出了其估计量的渐近分布。通过该分布,他们可以对这些因子进行推断。
在实证方面,Feng et al. (2020) 递归地使用他们的推断方法,以此区分文献中介绍的有用因子和无用及冗余因子。他们的实证发现显示,如果从 1994 年开始逐年应用他们的方法,那么在 120 多个候选因子中只有 17 个因子是有用的,而其他大多数因子则是冗余或无用的。
另有文献从模型不确定性和模型平均的角度考虑因子模型的选择问题,相关的研究包括 Avramov et al. (2023) 和 Chib et al. (2023)。Avramov et al. (2023) 认为,关于夏普比率取值的先验观点将左右因子和预测变量的选择。总体上,贝叶斯所考虑到的模型不确定性是未来金融机器学习领域中一个有趣的研究方向。
4.3 条件因子模型
前一节重点关注了欧拉方程 (1.2) 的无条件版本(通过空集代替信息集
是选择条件还是无条件模型?这是在研究收益率因子模型时要考虑的问题。我们的观点是,研究者都应尽可能努力构建一个有效的条件模型。条件模型往往目标远大 —— 它们描述了资产价格的状态依赖性,从而更精细地捕捉了市场的行为。然而,提出条件模型的要求也更高,它需要研究者提供相关数据来总结当前的条件。这种条件信息集涉及的方面可能非常广泛,并且可能需要更丰富的参数化模型来捕捉微妙的条件行为。当相关的条件信息不可用时,使用简单的无条件模型,研究者在无需了解详细的市场动态的情况下便能够理解基本的资产行为。因此,早期关于收益率因子分析的文献大多使用了无条件模型(如前一节所述)。在本节中,我们将讨论的重点放在条件模型的构建上。
与式 (4.1) 类似,向量形式的条件隐性因子模型为
其中因子暴露和定价误差均随条件信息集
4.3.1 IPCA
如不加入额外的约束,模型则会因为式 (4.7) 右侧的自由度太高而无法被识别。Kelly et al. (2019) 利用工具变量主成分分析(IPCA)将因子暴露(以及资产的定价错误)和观测变量联系在一起,取得了一定的进展。IPCA 模型的形式为:
其中
IPCA 模型的核心是其对
模型中
IPCA 通过对特征空间降维来解决这个问题。如果许多公司特征都关于股票风险敞口提供了带噪声的信号,那么将它们聚合成线性组合能够在剥离出信号的同时一并抵消掉噪声。
资产风格迁移问题,例如股票从小市值变成大市值或者从成长股变为价值股,对使用简单的时间序列方法研究个股条件预期收益率模型提出了极大的挑战。对此,常规的解决方法是构造一些投资组合,每个组合中的资产在特定公司特征上的平均值在时序上相对稳定。然而,如果我们需要用多个公司特征来准确描述资产时,上述方法就变得不切实际。IPCA 的解决方案是将因子暴露(
最后,式 (4.8) 所示的 IPCA 设定还考虑了这样一种可能,即(公司)特征代表
表 4.2 将使用不同数量隐性因子的 IPCA 模型(面板A)与文献中的其他主要多因子模型进行了比较。第一组比较模型包括预先指定的可观察因子,并逐一使用资产进行时间序列回归这一传统方法进行估计。K=1 表示 CAPM 模型,K=3 表示包括市场、SMB 以及 HML 的 Fama and French (1993) 三因子模型(以下简称“FF3”),K=4 表示 Carhart (1997,“FFC4”) 模型,它在 FF3 模型中加入了动量因子 MOM,K=5 代表 Fama and French (2015,“FF5”) 五因子模型,它在 FF3 模型中加入了盈利 RMW 和投资 CMA 因子,K=6(“FFC6”)则在 FF5 之上加入了动量 MOM 因子。在表 4.2 的结果中,所有 IPCA 模型都是在施加
表 4.2 报告了基于同期因子已实现收益率计算的总体
图 4.2 比较了两类模型对 37 个基于特征构造的“异象”投资组合的平均定价误差。在左侧的子图中,纵坐标是这些异象组合相对于 FFC6 模型的超额收益率
上述 IPCA 框架已被应用于多种市场的截面资产定价问题之中,包括国际股票(Langlois 2021; Windmueller 2022)、公司债券(Kelly et al. forthcoming)、股票指数期权(Büchner and Kelly 2022)、特定单一股票期权(Goyal and Saretto 2022)以及货币(Bybee et al. 2023a)市场。此外,它还被用来分析价格趋势信号的盈利能力(Kelly et al. 2021)以及叙事资产定价模型(Bybee et al. forthcoming)。
参考文献
Avramov, D., S. Cheng, L. Metzker, and S. Voigt (2023). Integrating factor models. Journal of Finance 78(3), 1593–1646.
Bai, J. (2003). Inferential theory for factor models of large dimensions. Econometrica 71(1), 135–171.
Bai, J. and S. Ng (2002). Determining the number of factors in approximate factor models. Econometrica 70(1), 191–221.
Büchner, M. and B. T. Kelly (2022). A factor model for option returns. Journal of Financial Economics 143(3), 1140–1161.
Bybee, L., B. T. Kelly, and Y. Su. (forthcoming). Narrative asset pricing: Interpretable systematic risk factors from news text. Review of Financial Studies.
Chamberlain, G. and M. Rothschild (1983). Arbitrage, factor structure, and mean-variance analysis on large asset markets. Econometrica 51(5), 1281–1304.
Chernozhukov, V., D. Chetverikov, M. Demirer, E. Duflo, C. Hansen, W. K. Newey, and J. Robins (2018). Double/debiased machine learning for treatment and structure parameters. The Econometrics Journal 21(1), C1–C68.
Chib, S., L. Zhao, and G. Zhou (2023). Winners from winners: A tale of risk factors. Management Science.
Connor, G. and R. A. Korajczyk (1986). Performance measurement with the arbitrage pricing theory: A new framework for analysis. Journal of Financial Economics 15(3), 373–394.
Connor, G. and R. A. Korajczyk (1988). Risk and return in an equilibrium APT: Application of a new test methodology. Journal of Financial Economics 21(2), 255–289.
Feng, G., S. Giglio, and D. Xiu (2020). Taming the factor zoo: A test of new factors. Journal of Finance 75(3), 1327–1370.
Gagliardini, P., E. Ossola, and O. Scaillet (2016). Time-varying risk premium in large cross-sectional equity data sets. Econometrica 84(3), 985–1046.
Geweke, J. and G. Zhou (1996). Measuring the pricing error of the arbitrage pricing theory. Review of Financial Studies 9(2), 557–587.
Giglio, S., B. T. Kelly, and D. Xiu (2022a). Factor models, machine learning, and asset pricing. Annual Review of Financial Economics 14, 1–32.
Giglio, S., Y. Liao, and D. Xiu (2021a). Thousands of alpha tests. Review of Financial Studies 34(7), 3456–3496.
Giglio, S. and D. Xiu (2021). Asset pricing with omitted factors. Journal of Political Economy 129(7), 1947–1990.
Giglio, S., D. Xiu, and D. Zhang (2021b). Test assets and weak factors. Tech. rep. Yale University and University of Chicago.
Goyal, A. and A. Saretto (2022). Are equity option returns abnormal? IPCA says No. Working paper.
Harvey, C. R. and W. E. Ferson (1999). Conditioning variables and the cross-section of stock returns. Journal of Finance 54(4), 1325–1360.
He, Z., B. T. Kelly, and A. Manela (2017). Intermediary asset pricing: New evidence from many asset classes. Journal of Financial Economics 126(1), 1–35.
Huberman, G. (1982). A simple approach to arbitrage pricing theory. Journal of Economic Theory 28(1), 183–191.
Ingersoll, J. E. (1984). Some results in the theory of arbitrage pricing. Journal of Finance 39(4), 1021–1039.
Kelly, B. T., T. Moskowitz, and S. Pruitt (2021). Understanding momentum and reversal. Journal of Financial Economics 140(3),726–743.
Kelly, B. T., D. Palhares, and S. Pruitt (forthcoming). Modeling corporate bond returns. Journal of Finance.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501–524.
Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73(3), 1183–1223.
Lettau, M. and M. Pelger (2020a). Estimating latent asset-pricing factors. Journal of Econometrics 218, 1–31.
Lettau, M. and M. Pelger (2020b). Factors that fit the time series and cross-section of stock returns. Review of Financial Studies 33(5), 2274–2325.
Ludvigson, S. C. and S. Ng (2010). A factor analysis of bond risk premia”. In: Handbook of Empirical Economics and Finance. Ed. By A. Ulah and D. E. A. Giles. Vol. 1. Chapman and Hall, Boca Raton, FL. Chap. 12. 313–372.
Malloy, C. J., T. J. Moskowitz, and A. Vissing-Jorgensen (2009). Longrun stockholder consumption risk and asset returns. Journal of Finance 64(6), 2427–2479.
Novy-Marx, R. (2014). Predicting anomaly performance with politics, the weather, global warming, sunspots, and the stars. Journal of Financial Economics 112(2), 137–146.
Pástor, L. and R. F. Stambaugh (2003). Liquidity risk and expected stock returns. Journal of Political Economy 111(3), 642–685.
Pukthuanthong, K., R. Roll, and A. Subrahmanyam (2019). A protocol for factor identification. Review of Financial Studies 32(4), 1573–1607.
Rosenberg, B. (1974). Extra-market components of covariance in security returns. Journal of Financial and Quantitative Analysis 9(2), 263–274.
Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341–360.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。
川总写量化
分享量化理论和实证心得
微信扫码关注该文公众号作者