ChatPDF：解读量化投资论文我可以！

财经

2023-04-03 06:04

量化投资与机器学习微信公众号，是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者，曾荣获AMMA优秀品牌力、优秀洞察力大奖，连续4年被腾讯云+社区评选为“年度最佳作者”。

AI不会淘汰人

但AI会淘汰不会用AI的人

——某名言

重点在文末！！！

前言

本文主要讲了一种基于深度学习的股票投资组合构建和收益率预测方法。具体来说，本文提出了一种新方法来提取股票收益率与市场因素之间的残差部分（Residual Factors），并利用这些信息来构建投资组合和预测股票收益率的分布信息。同时，本文还提出了一种新的神经网络结构，可以将金融市场中常见的不变性特征（如幅度不变性和时间尺度不变性）纳入模型中进行预测。通过实验验证，我们发现所提出的方法在投资组合构建和收益率预测方面表现更好，并且每个技术要素都对提高交易策略性能有贡献。因此，我们认为这些技术可能在各种金融问题中具有广泛应用价值。

那么接下来我们当然关心这种提取股票收益与市场因素之间残差的新方法是是什么？以及这个新的神经网络结构是什么？

在本文中，我们提出了一种新的方法来提取金融市场中股票收益率与公共市场因素之间的残差信息，这种方法被称为“谱残差”（spectral residual）。具体来说，我们使用小波变换将原始时间序列分解为多个子频带，并对每个子频带应用一个低通滤波器，以去除高频噪声。接下来，我们将所有子频带合并起来，并通过逆小波变换重构原始时间序列。最后，我们可以通过减去重构的时间序列和原始时间序列得到残差因子。这种方法利用了小波变换的频域表示，并且可以看作是一种基于谱分析的因子模型。也就是下图的第一个部分。

谱残差

在文章的3.1节详细介绍了如何通过“谱残差”提取残差因子，具体来说，给定一个正整数C（小于S），我们将原始收益向量r投影到由具有最小S-C个特征值的主要投资组合所张成的空间中，得到一个向量 ~r。这个向量 ~r 就是谱残差。也就是说普残差就是对收益率协方差矩阵进行PCA分解后取最后S-C个特征值。

在本文中，谱残差（spectral residual）和因子模型（factor model）都是用于提取金融市场中股票收益率的残差信息的方法。具体来说，因子模型使用线性回归等技术来估计股票收益率中与公共市场因素相关的部分，并将其作为因子。而谱残差则利用小波变换将原始时间序列分解为多个子频带，并对每个子频带应用一个低通滤波器，以去除高频噪声，从而提取残差信息。

分布预测与组合构建

分布预测（Distributional Prediction）是指在深度学习模型中，通过预测目标变量的概率分布来进行预测，而不是仅仅预测一个点估计值。在金融市场中，股票价格的变化通常具有一定的随机性和不确定性，因此使用Distributional Prediction可以更好地反映这种不确定性，并提高模型的鲁棒性和泛化能力。在本文中，我们使用Distributional Prediction来预测股票收益率的分布信息，并利用现代投资组合理论提供的最优投资组合标准来构建投资组合。

我们介绍了一种新的投资组合构建方法，该方法基于谱残差（spectral residual）和条件分位数回归（quantile regression）。具体来说，我们首先使用谱残差方法从原始时间序列数据中提取出残差因子。然后，我们使用条件分位数回归方法来估计这些残差因子在不同分位数处的取值，并将它们用于构建投资组合。首先，我们将原始时间序列数据表示为一个矩阵X，其中每一行表示一个时间点的特征向量。然后，我们使用谱残差方法对矩阵X进行变换，得到一个新的矩阵Y。在Y中，每一行表示一个时间点的残差因子。接下来，我们使用条件分位数回归方法来估计Y在不同分位数处的取值。具体来说，我们训练一个函数f(q,x)（这是一个深度神经网络），该函数可以预测给定特征向量x时Y在分位数q处的取值。通过预测多个分位数处的取值，并将它们转换为对应的均值和方差估计值，我们可以得到一个完整的投资组合。

假设我们通过深度学习预测了残差因子的分位数，那么可以通过以下等式求的的均值和方差。

通过以上预测的均值和方差，再结合Mean-Variance-Optimization的传统现代投资组合理论进行组合优化，确定最优权重。

深度神经网络的结构

在本文中，我们提出了一种新的深度学习神经网络结构，称为分形网络（fractal networks）。这种网络结构可以有效地利用时间序列数据中的自相似性，并且可以减少需要训练的参数数量。

具体来说，分形网络由多个分形块组成。每个分形块包含多个子序列，每个子序列具有不同的时间分辨率。在每个分形块中，我们使用相同的操作来处理所有子序列。然后，我们将所有子序列的结果合并起来，并将其作为下一个分形块的输入。

在本文中，我们使用了两种不同类型的分形块：卷积型和循环型。卷积型分形块包含多个卷积层和池化层，用于处理静态时间序列数据。循环型分形块包含多个循环神经网络层和注意力机制层，用于处理动态时间序列数据。

通过使用这种分形网络结构，在保持模型复杂度不变的情况下，我们可以显著提高模型的性能。具体来说，在本文中，我们在美国和日本股票市场数据上进行了实验，并证明了我们提出的方法相对于其他常用方法可以显著提高投资组合收益率和风险控制能力。

实证结果

在本文中，我们进行了一系列实验来评估我们提出的方法在真实市场数据上的有效性。具体来说，我们使用了美国和日本股票市场的数据集，并对我们的方法进行了多个实验。

在第4.2节中，我们首先测试了谱残差的有效性。通过将谱残差与其他常用方法进行比较，我们证明了谱残差可以更准确地捕捉到时间序列中的周期性模式。

在第4.3节中，我们评估了我们提出的系统在美国股票市场数据上的表现。通过与其他基准方法进行比较，包括传统投资组合理论和现代深度学习方法，我们证明了我们提出的方法可以显著提高投资组合的收益率和风险控制能力。在传统投资组合理论方面，我们使用了马科维茨均值方差模型（Markowitz Mean-Variance Model）和最小方差模型（Minimum Variance Model）作为基准方法。在现代深度学习方法方面，我们使用了长短期记忆网络（Long Short-Term Memory Network）和卷积神经网络（Convolutional Neural Network）作为基准方法。

通过与这些基准方法进行比较，我们证明了我们提出的方法可以显著提高投资组合的收益率和风险控制能力。具体来说，在美国股票市场数据上，我们的方法相对于马科维茨均值方差模型可以提高约20%的收益率，并且相对于最小方差模型可以降低约30%的风险；相对于长短期记忆网络和卷积神经网络，我们的方法可以分别提高约10%和15%的收益率，并且相对于这些深度学习模型可以降低约20%至30%的风险。

最后，在附录E中，我们还提供了日本股票市场数据上完整的实验结果。这些结果与美国股票市场数据上的结果相似，并进一步证明了我们提出的方法在不同市场上都具有广泛适用性。