来!新闻流与股价跳跃、图数据应用综述、机器学习与有效前沿
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。
资产价格的跳跃已经被认为是许多金融和经济决策的重要因素,例如投资组合重新平衡、衍生品定价以及风险度量和管理。股票价格的大幅波动可能与市场上重要的信息流(如超预期收益)有关,这一直观的想法启发了许多与股票收益跳跃建模相关的研究。
本文也主要研究新闻流及股票价格跳跃之间的关系,主要有以下几点发现:
1、我们发现,新闻指标与跳跃概率/强度和跳跃收益特征(跳跃规模均值和波动率)显著相关。例如,当某一天的新闻频率和新闻语气的绝对值较高时,股票日收益的跳跃可能性显著增大,其中新闻频率起主导作用。在每日收益至少有一次跳跃的条件下,我们发现正的跳跃收益与新闻强度正相关,而负的跳跃收益随着新闻强度的增加而平均上变得更负。跳跃规模分布的另一个特征,即跳跃规模波动率,与新闻频率和新闻语气绝对值均呈正相关。总的来说,我们的结果表明,新闻流量的测量解释了跳跃大小分布变化的重要部分,而新闻强度在驱动跳跃概率中扮演着尤其关键的角色。
2、值得注意的是,鉴于我们的新闻样本周期很长,第二个亮点是我们能够发现新闻对股票回报跳跃的影响的一个新的时间趋势。我们的结果表明,随着时间的推移,信息流对股票收益跳跃的影响和解释力有所增加。例如,新闻计数对跳跃概率影响的系数估计从1980年到2012年增加了5倍(从0.1到超过0.5)。
3、在建立了新闻-跳跃关系之后,我们进一步在截面上研究了跳跃概率与公司特征之间的关系。在单变量回归中,我们发现,对于较大的公司或处于更透明、更可见的信息环境中的公司(如更多的分析师报道、更多的媒体能见度和更高的机构所有权),新闻的跳跃敏感性更高,这突出了这些渠道在快速将新闻纳入回报方面的重要性。在多变量回归中,媒体曝光度、分析师报道和机构持股仍然是新闻跳跃敏感度的三个最重要决定因素。
本文是图数据在股票分析与预测场景的一篇综述文章。图数据不同于常见的行列式数据结构,包含点和边,比传统数据增加了不同点之间的连接关系。本文从以下五个角度整理了近年相关的图研究论文:
1、图构建:图中节点的选择,特别是节点与节点间边权重的选择,常见的有用股价相关系数作为边权重。
2、图过滤:在金融场景中,很多时候,图中节点的边是非常密集的。这当中有很多噪音,如果提取有效的边关系,也是图算法很重要的一部分,比如常见的最小生成树MST。
3、图聚类:图数据结构在无监督学习中,主要是用于聚类,发现一组内在关联较大的股票。常见的算法比如层次化聚类。
4、股价预测:这是图数据在量化中很重要的应用场景,比如用动态图结合因子与图结构信息预测未来股价的涨跌方向或涨跌幅。
5、组合优化:层次化风险评价(HRP)就是一种基于图聚类的组合优化方法。
本文作者Bryan Kelly来自AQR
本文研究了在具有交易成本的环境下,如何使用机器学习有效的构建投资组合。其他文献中ML在组合够建时通常包括两个步骤:首先,找到一个预测总回报的特征函数;其次,利用预测结果建立投资组合。我们的方法将交易成本直接构建到目标函数中,并且直接使用模型学习各标的的权重,从而确保算法学习可用的可预测性。考虑到交易成本,无论你今天买了什么,你都可能会持有一段时间,因为交易成本会鼓励你慢慢进入或退出头寸。我们最终开发了一个框架,通过将考虑交易成本的投资组合优化与机器学习集成在一起,产生了一个更好的有效前沿。
为了评估我们的方法的有效性——事实上,任何投资组合选择的方法——我们建议投资者应该关注可执行的有效前沿,而不是标准的成本不可知的有效前沿。我们以经验证明,我们的方法相对于其他投资组合选择方法扩展了可执行的有效边界。换句话说,我们从我们的方法中发现了显著的样本外收益,即相对于复杂和更高度参数化的替代方法。最后,该方法暗示了一个新的观点,哪些证券是重要的。事实上,尽管忽略交易成本的标准方法专注于在纸面上对小型股票很有效的瞬时特征,但我们的方法自然选择了具有经济重要性的持久特征。
微信扫码关注该文公众号作者