另类因子:消费交易数据与股票截面收益
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。
标题:Consumer Spending and the Cross-Section of Stock Returns
作者:Tarun GUPTA, Edward LEUNG,Viorel ROSCOVAN
来源:Journal of Portfolio Managemen
前言
本文研究了刷卡消费数据与消费板块股票截面收益率之间的关系,研究表明消费数据与公司未来三个季度的盈收数据间有着明显的关系。在非必需消费品板块中,这种关系不仅在大盘股中表现明显,在小盘股中表现的更加明显。基于这个实证研究,本文构建了一个简单的多空策略,在提出其他常用因子影响及扣除费率后,该策略取得了年化16%的收益。
数据
本文使用了第三方另类数据公司提供的2013年至2019年的美国公民的刷卡消费数据。当然,数据是脱敏处理后的2000多个商家的日度交易汇总数据,包括每日的:销量、消费者数量及交易笔数,其中有300多家公司是上市公司。该销售数据与政府报告的月度普查零售销售数据的相关性超过90%,这证明了它的代表性。
下表1展示了该数据在不同行业的覆盖度,其中在非必需消费品行业的公司覆盖度最高。
我们主要关注的是总体的销售数据,所以需要将信用卡和借记卡的交易数据汇总成公司级别的销售指数。具体来说,对于样本中的每个公司,数据集包含每日销售额以及一个由于考虑消费者数量的调整指数。我们把一个月的数据汇总起来计算每个公司每月的消费指数:
然后再基于以上月度指数,计算当月消费指数与一年前相比的变动比率:
下表给出了该指标的统计描述,有趣的是,虽然中值接近于零,但在所有子样本中都略有负值,这表明有许多公司的销售指数出现了负值。
在市场有效的假设下,一家公司的销售数据被直接纳入到公司的价格中,因此上述数据可以被作为为传统基本面因子的替代。然而,我们的度量可能更好,因为它更及时,并且基于更高频率的交易数据。
所以我们好奇,这样高频的交易数据和公司披露的盈收数据之间有没有明显的关系。本文定义了两个度量公司盈利变动的指标,第一个是Historical Earnings Surprise:
第二个是基于分析师一致预期数据计算的盈利变动,其中MEPS是分析师一致预期,这两个公式中的t-4都表示四个季度前:
消费大数据与公司盈利数据的关系
分别使用HES和CES与 进行回归:
表3和表4分别给出了HES和CES的回归结果,结果显示HES和CES与ΔSALES之间存在明显的正相关,而且能够通过1%显著水平下的统计检验。但整体HES与ΔSALES的相关性比CES与ΔSALES更加显著。而且在不同的lag设置下,相关性虽然有所减弱,但还是存在显著的正相关性。
消费大数据与股价截面收益的关系
为了评估ΔSALES是否可以预测股价受益,我们基于ΔSALES构建了一个标准的多空组合。首先,每个月我们都会根据ΔSALES,从上到下对股票进行分类。排名靠前的是销售指数上升幅度最大的“改善型”股票,排名靠后的是销售指数大幅下降的“恶化型”股票。在每一个组中,我们构建等市值的投资组合。最后,我们创建了一个多空组合,每个月都做多正在好转的股票,做空正在恶化的股票。我们把这种投资组合称为IMW投资组合——即改善-减去-恶化的股票投资组合。
下表5给出了回测结果,可以看出使用全部数据在所有覆盖股票中测试,等权组合的费后的年化收益率为16%。
下表也给出了ΔSALES与其他因子的相关性:
消费大数据,具体到信用卡或借记卡的消费数据在国内的可获得性可能不是特别容易,但或许可以使用电商消费数据进行类似的研究。在国内移动支付普及的情况下,也希望能够在数据合规脱敏的情况下,有更多的另类数据丰富策略的研究场景。
微信扫码关注该文公众号作者