更有效的信息聚合方法 ?
作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。《因子投资:方法与实践》领衔作者。
封面来源:https://www.pexels.com
未经授权,严禁转载。
摘
要
协变量的高维数时代,数不胜数的公司特征都和预期收益相关,然而它们之间存在不能忽视的相关性。在这个背景下,如何更好地聚合协变量包含的预测信息?
01
对于资产定价而言,相信到现在你已经接受了协变量的高维数时代(Kozak, Nagel and Santosh 2020,Giannone, Lenza and Primiceri 2021)。需要补充背景知识的小伙伴请参考《稀疏性幻觉》。然而,面对层出不穷的 factor zoo(Cochrane 2011,Harvey, Liu and Zhu 2016)背后的公司特征,一个自然的问题是:如何有效地聚合它们所包含的预测信息,从而形成关于预期收益率更好的预测?
在这方面,学界和业界的尝试从未停止过。
比如,最直接的方法是 Fama-MacBeth regression。当然,一旦协变量个数激增后,这个方法就会受到各种计量经济学问题的困扰。
又比如 rank-based approach,即根据取值高低将股票在每个公司特征上排名,然后求均值得到综合排名。这个方法在 Stambaugh, Yu and Yuan (2015) 以及 Stambaugh and Yuan (2017) 中大放异彩,也同时出现在 Asness, Frazzini and Pedersen (2019) 的 QMJ 因子构造之中。
再比如各种机器学习算法,这其中以 PCA 为代表(Kelly, Pruitt and Su 2019,Kozak, Nagel and Santosh 2020),也在聚合预测信息的时候发挥了很大的作用。另外,Lettau and Pelger (2020a, b) 的 risk premium PCA 也是这类方法的拓展。《实证资产定价理论新进展》一文的聚合因子信息一节对上述方法有更多的介绍。
除此之外,Light, Maslov and Rytchkov (2017) 通过将预期收益率视为隐性变量(latent variable),利用 partial least squares(PLS)提出了一种新的方法。该方法实操起来方便,在直觉上也颇具吸引力。
02
令
由已实现收益率和预期收益率之间的关系,我们进而有:
对于进行分析的计量经济学家而言,预期收益率
在此基础上,Light, Maslov and Rytchkov (2017) 方法的核心假设是隐性变量
在上述模型中,
由于预期收益率是隐性变量,因此计量经济学家的任务就变成如何通过可观测到的已实现收益率
The main objective of PLS is the extraction of a common factor from a set of predictive variables that has the highest covariance with the predicted (target) variable. In contrast to PCA and factor analysis, which also extract one or few factors that concisely describe the variability of data and correlations between predictors, respectively, PLS identifies a factor with the best ability to predict the target variable even though this factor may not be the most important source of common variation in the predictors.
按照 Light, Maslov and Rytchkov (2017) 自己的话说,PLS 的这个特点正是它相比于 PCA 的优势所在。因为有些公共信息仅仅解释了特征的共同波动但是却和预期收益率无关,这些信息对于解释资产的预期收益率来说是没有帮助的,因此会影响 PCA 的结果,而 PLS 却不会。
为此,该文提出了一个两步截面回归来估计预期收益率:
在第一步中,用
值得一提的是,在上述两步估计中,第一步仅用到了
在样本外使用时,有两点需要注意。首先,上述估计值和真实 demean 预期收益率差了一个 scaling factor。第二,即便没有 scaling factor 的顾虑,上述估计也是截面上 demean 的预期收益率。所以如果基于该预期收益率的估计来进行样本外选股,那么 portfolio sort 无疑就是最自然的选择,因为它不受 scaling 或者 shift 的影响。这也正是 Light, Maslov and Rytchkov (2017) 在实证中采用的方法。
此外,在实操层面,还有另外一个技巧。上述两步法的第一步类似 Fama-MacBeth 的第二步,使用单期收益率对单期公司特征回归(FM 是对 beta 回归),得到
03
在实证中,该文选择了文献中常见的 26 个公司特征作为被聚合的对象。下图展示的就是该文的 portfolio sort 结果,其中 Panel A 在估计
从结果中可见:(1)无论等权还是市值加权,以 PLS 得到的估计值构造的对冲组合总能获得显著的超额收益;(2)当使用多期平均来估计时,超额收益率无论在经济上还是在统计上都更加显著。
除此之外,通过比较信息聚合和这 26 个单一变量,作者同样指出两点:(1)这些变量在预测收益率方面确实存在一些共性,这也支撑了该文提出的模型;(2)尽管如此,不同变量仍然包含了关于预期收益率的不同信息,只不过每个单一变量都是其所包含预测信息的噪声版本。
为了说明 PLS 的过人之处,Light, Maslov and Rytchkov (2017) 将其和本文第一节提到的 Fama-MacBeth regression、rank-based approach、PCA 以及 factor analysis 进行了对比。后面这些信息聚合方法的实证结果如下表所示。
以构造的对冲组合超额收益率的 t-statistics 而论,PLS 方法优于上述其他信息聚合方法,而和 PLS 最接近的要数 rank-based approach。就这个结果而言,学界和业界常用的 rank-based approach 也是很有效的方法。
04
本节在 A 股市场对上述 PLS 方法进行实证,看看和人们更熟悉的 rank-based approach 相比结果如何。
实证中使用 BetaPlus 小组在《一个混合四因子模型》一文中介绍的十个协变量,它们包括账面市值比(BM)、短期反转、特质波动率、MAX、异常换手率、SUE、ROA、应计量、动量以及流动性冲击。计算说明见下表。数据窗口横跨 2000 年 1 月 1 日至 2022 年 5 月 31 日。
对于 PLS 来说,首先每月对每个指标在截面上进行标准化(具体数据处理方法请参考《因子投资:方法与实践》的 3.1 节),然后采用前文介绍的两步回归法,估计每个月每支股票的预期收益率,并以估计值的高低作为分组排序的依据。在实证中,在两步法的第二步中,对于
为了和 PLS 方法比较,实证中的另一种信息聚合方法采用平均 z-score 方法,即同样每月在截面上将每个变量标准化得到 z-score,并通过其和预期收益率的关系调整其方向,然后取十个变量 z-score 的均值作为该股票当月最终的 z-score,并以 z-score 的高低进行分组排序的依据。
由于在 PLS 方法中使用最长 60 个月的数据计算
观察上述结果,可以总结出两点:(1)由于估计误差,使用当期
和 Light, Maslov and Rytchkov (2017) 一文基于美股的结果相比,在业界更常用的 z-score 均值面前,PLS 两步法似乎并没有什么过人之处。但是,我们也不应仅仅基于以上有限的结果就那么快对 PLS 方法在 A 股的表现下定论。今后可以通过更多的稳健性分析来考察其能够发挥的作用。
05
在协变量的高维数时代,如何聚合不同变量涵盖的预测信息是非常重要的课题。在这方面,研究的思路应着眼于剖析并有效利用不同变量所涵盖的共有信息、每个变量所携带的独有信息,以及剔除每个变量所涵盖的巨大的噪声。Light, Maslov and Rytchkov (2017) 为此提供了有益的思路。
然而,我们对信息聚合的追求并不能止步于此。
信息聚合的目标是为了获得更加准确的估计,因此无论是采用前文介绍的 PLS 还是其他方法(尽管这些方法的效果有所差异),聚合后的变量较单变量来说都会获得更加显著的超额收益。然而,这后面一个巨大的但却往往被人们忽视的假设是,被用来信息聚合的单变量都是真实的。
可是,如果某些或绝大部分协变量和预期收益率之间的关系是虚假的(p-hacking),那么聚合之后又会如何呢?是否会“错上加错”呢?如果是的话,又是否有什么更好的办法来降低聚合的危害吗?
我们择日再议。
(Hint:对于这个问题,Rytchkov and Zhong (2020) 给出了答案。)
参考文献
Asness, C. S., A. Frazzini, and L. H. Pedersen (2019). Quality minus junk. Review of Accounting Studies 24(1), 34 – 112.
Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.
Giannone, D., M. Lenza, and G. E. Primiceri (2021). Economic predictions with big data: The illusion of sparsity. Econometrica 89(5), 2409 – 2437.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134(3), 501 – 524.
Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271 – 292.
Lettau, M. and M. Pelger (2020a). Factors that fit the time series and cross-section of stocks returns. Review of Financial Studies 33(5), 2274 – 2325.
Lettau, M. and M. Pelger (2020b). Estimating latent asset-pricing factors.Journal of Econometrics 218(1), 1 – 31.
Light, N., D. Maslov, and O. Rytchkov (2017). Aggregation of information about the cross section of stock returns: A latent variable approach. Review of Financial Studies 30(4), 1339 – 1381.
Rytchkov, O. and X. Zhong (2020). Information aggregation and p-hacking. Management Science 66(4), 1605 – 1626.
Stambaugh, R. F., J. Yu, and Y. Yuan (2015). Arbitrage asymmetry and the idiosyncratic volatility puzzle. Journal of Finance 70(5), 1903 – 1948.
Stambaugh, R. F. and Y. Yuan (2017). Mispricing Factors. Review of Financial Studies 30(4), 1270 – 1315.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。
川总写量化
分享量化理论和实证心得
微信扫码关注该文公众号作者