Ledoit and Wolf 的协方差矩阵收缩之旅
作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。《因子投资:方法与实践》领衔作者,《机器学习与资产定价》译者。
封面来源:https://www.pexels.com
未经授权,严禁转载。
摘
要
本文简要且有侧重地回顾 Ledoit 和 Wolf 两位在协方差估计方面多年的尝试。
0
协方差矩阵是资产配置的重要输入之一;对它的准确估计对于求解权重的最优化问题至关重要。然而众所周知的是,样本协方差矩阵并非一个很好的估计量(estimator),尤其是在收益率的期数
我们以 Frobenius norm 来衡量两个矩阵的差距。对于矩阵
其中
下面假设 DGP 已知并通过模拟说明
但显然,这种数据量的需求是奢侈的;而且实际资产配置中,标的个数也可能远远超过 50。因此,我们需要更好的协方差矩阵估计量(当然,如果你的标的个数很少,比如配置因子且因子个数 < 10,那么使用更复杂的估计量取代样本协方差矩阵所能获得的益处比较有限)。这就要请出今天的主角:Olivier Ledoit 和 Michael Wolf。这两位在过去 15 到 20 年的时间里致力于利用收缩技术(shrinkage)提出更好的协方差矩阵估计量,其研究范围从线性收缩到非线性收缩,从静态模型到动态模型,从 empirical Bayes 到多因子模型。
今天这篇文章就来(非常)简要地回顾一下。需要说明的是,本文涉及的重点自然反映了我个人的偏好(比如我会聚焦在静态模型的情况,即假设不同时刻的收益率满足 IID),而希望了解进一步信息的小伙伴请参考两位作者自己写的综述文章 Ledoit and Wolf (2022)。此外,就协方差矩阵估计量而言,除了这两位外,学界还有大量重要发现,但它们并非本文关注的重点(again,再次反映了我个人的偏好)。
1
先说说线性收缩。
我接触到 Ledoit 和 Wolf 这两位就是从他们把样本协方差矩阵往单位矩阵收缩(Ledoit and Wolf 2004b)开始。他们两位受到 James and Stein (1961) 将样本均值向零收缩的启发,提出将样本协方差矩阵向单位矩阵(的某个缩放版本)收缩。
令
将其向单位矩阵(的某个缩放版本)收缩,由此得出估计量
其中
2
上述线性收缩方法后来在很多领域得到了应用。不过对于金融数据而言,人们期望尽可能利用金融数据的实际特性来决定收缩的目标(记为
因此,上一节的一个自然的延伸就是寻找其他
在这方面,一个自然的想法是利用 CAPM 模型。如果 CAPM 成立,那么资产超额收益率和市场组合的超额收益率满足
其中
其中
此外,考虑到 CAPM 并不是描述资产收益率的完美模型,我们也可以进行其他尝试。比如,Ledoit and Wolf (2004a) 假设所有资产的相关系数相同,并定义
其中
3
再来说说非线性收缩。为了便于理解,让我们从谱分解(特征分解)的角度重述一下向单位矩阵收缩的情况,即
不难看出,该估计量等价于先对样本协方差矩阵做特征分解,然后再对由特征值构造的对角阵进行相同程度的收缩,即
其中
有了这个铺垫,就不难理解非线性收缩,即对不同的特征值进行不同程度的收缩,即通过某些方法最优的确定
4
最后,我们再来简要介绍一下利用多因子模型来构造协方差矩阵估计量。在这方面,一个自然的想法是延伸上面的 CAPM,转而使用多因子模型构造目标
在这方面,De Nard, Ledoit, and Wolf (2021) 同时考虑了静态和动态模型。为了简化,我们以静态模型为例(即 factor loading 不随时间变化)。假设资产超额收益率满足某个多因子模型,则其协方差矩阵可以表述为(非常类似 CAPM 的情况,只不过拓展到多因子)
其中
在估计
另外值得一提的是,对于使用多因子模型估计协方差矩阵而言,使用哪些因子以及不同因子会对估计结果产生怎样的影响注定是绕不过去的坎。然而真实定价模型里有哪些因子是未知的,因此我们大概率会使用一个设误的版本。De Nard, Ledoit, and Wolf (2021) 指出,在近似因子模型假设下对
5
面对形形色色的收缩估计量,小伙伴不禁会问,到底选择哪一个。在实际使用中,一个有效的经验法则是根据
除此之外,在比较协方差矩阵估计量时,一个常用的方法是构造最小方差(minimum variance)投资组合,并考察每个估计量构造的组合在样本外实际方差的大小(Ledoit and Wolf 2017)。由于最小方差投资组合仅仅利用协方差矩阵作为输入,因此它不会受到预期收益率估计误差的影响。
本文简要且有侧重地回顾了 Ledoit 和 Wolf 两位在协方差估计方面多年的尝试。他们的方法从线性收缩到非线性收缩,从静态到动态模型,不仅提高了协方差矩阵估计的准确性,也极大地扩展了其应用的范围。沿着他们二位已经铺好的道路,我们能在估计协方差矩阵的道路上走得更远。
参考文献
De Nard, G., O. Ledoit, and M. Wolf (2021). Factor models for portfolio selection in large dimensions: The good, the better and the ugly. Journal of Financial Econometrics 19(2), 236-257.
James, W. and C. Stein (1961). Estimation with quadratic loss. Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, vol. 1. Oakland, CA, USA: University of California Press, pp. 361-380.
Ledoit, O. and M. Wolf (2003). Improved estimation of the covariance matrix of stock returns with an application to portfolio selection. Journal of Empirical Finance 10(5), 603-621.
Ledoit, O. and M. Wolf. (2004b). A well-conditioned estimator for large-dimensional covariance matrices. Journal of Multivariate Analysis 88(2), 365-411.
Ledoit, O. and M. Wolf (2015). Spectrum estimation: A unified framework for covariance matrix estimation and PCA in large dimensions. Journal of Multivariate Analysis 139, 360-384.
Ledoit, O. and M. Wolf (2017). Nonlinear shrinkage of the covariance matrix for portfolio selection: Markowitz meets Goldilocks. Review of Financial Studies 30(12), 4349-4388.
Ledoit, O. and M. Wolf (2020). Analytical nonlinear shrinkage of large-dimensional covariance matrices. Annals of Statistics 48(5), 3043-3065.
Ledoit, O. and M. Wolf (2022). The power of (non-)linear shrinkage: A review and guide to covariance matrix estimation. Journal of Financial Econometrics 20(1), 187-218.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。
川总写量化
分享量化理论和实证心得
微信扫码关注该文公众号作者