追涨行为因子:基于上交所投资者账户数据的散户交易行为量化策略
量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。
来自:SSRN June 30 2022
标题:Who Chases Returns? Evidence from the Chinese Stock Market
作者:Weihua Chen、Shushu Liang、Donghui Shi
核心观点:
1、本文利用上交所1800万个个人股票账户的数据,研究了散户投资者的追涨行为(return-chasing behavior)。
2、本文构建了一个衡量个体追涨倾向(RCP)的新指标。缺乏经验的投资者往往表现出更高的RCP。RCP高一个标准差的投资者平均年收益率低5.6%。
3、在股票层面,我们通过交易该股票的散户的RCP按照投资金额进行加权,构建了一个衡量单个股票追涨(RCO)的指标。RCO最高的股票年收益率平均要低10%。
正文
散户如何交易?他们的交易行为是否存在异质性?了解散户投资者的异质交易模式对于了解主要由散户投资者持有的股票的价格动态非常重要。在本文中,我们关注的是追涨(return-chasing),这是一种被传统投资智慧视为严重错误的交易行为。早期的研究已经在总体投资者水平上从理论上和实证上研究了追涨(或者也可以称为,正反馈交易或动量交易)。然而,散户投资者追涨的异质性却鲜为人知。
本文首次研究了个人投资者追涨的异质性。我们使用来自上海证券交易所的投资者账户数据。我们的数据集覆盖了从2011年1月至2019年12月的1800万散户投资者的样本月度数据(随机抽样,占所有数据的20%)。我们获取每个账户的持有和交易记录,以及投资者人口统计数据。详细的微观数据使我们能够扩展现有的研究,从而进行个人投资者的追涨行为的研究。下表给出了2011年至2019年间,上交所账户交易数据的统计值:
本文主要解答以下三个问题:
1、谁在追涨?
2、这些追涨投资者的(收益)表现如何?
3、追涨者的进入和退出是否会影响股票的未来收益?
我们构建了一个新的衡量指标——追涨倾向(RCP),根据投资者的账户交易和持有记录来捕捉投资者的追涨行为。
本文使用投资者的持仓和交易数据构建了追涨倾向(RCP)指标。使用所有持仓股票在该投资者买入前一段时间的收益率的加总值作为该投资者的RCP,详细的公式如下:
其中 是该账户i在时间t所有的持仓股票。对于每个持仓股票 ,我们先得到该股票的买入时间 ,然后再计算买入前 至 这段时间内该股票的收益率 ,其中 的取值可以是1、2、3、6及12个月,并减去同时间段市场基准的收益 ,最后在乘以该股票对应的权重 。关于 ,可以用两种计算方式:1. 简单算术平均;2. 使用股票在买入时的持仓权重。在本文接下来的分析中,主要采用了算术平均的加权方式,且选取 。
计算完1800万个账户的RCP之后,我们可以分析RCP指标和投资者特征之间的关系。下表2汇总了RCP与其他指标之间的关系。前5列使用的月度的所有面板数据计算均值方差;第6和7列计算逻辑是:先计算每个账户在有效期内的RCP均值,再计算每个截面所有账户的RCP均值及标准差;第8和9列计算逻辑是:先计算每个截面所有账户RCP均值,再计算时间序列上的均值及标准差。
比较第2、7及9列,可以看出,面板数据的波动(标准差)主要来自第7列截面数据的波动,也就是说同一时间不同账户的RCP的差异要大于同一账户不同时间的RCP的差异。
面板汇总统计数据中,我们计算的RCP的平均值为32%,标准差为81%。告诉我们,一般投资者购买的股票过去一年的回报率比市场回报率高32%,这表明他们追逐的平均回报率相当高。我们还可以看到RCP分布是右偏的,这意味着一些投资者非常激进地追涨。处置效应被定义为在过去一年中实现收益的比例和实现亏损的比例之间的差异(Odean 1998)。处置效应平均为6.2%,这与之前的文献一致,即散户更有可能了结收益而不是截断亏损。Log(AvgInvest)是投资者在前一年持有的股票市值的对数值。股票数量是指投资者在每个月底持有的股票数量。这个数字的中位数是2,表明大多数散户投资者的投资分散度非常低。同样,HHI是投资者投资组合的Herfindahl-Hirschman Index,以股票价值为权重。HHI指数中值为0.9,再次证实了散户投资者分散投资不足。交易频率是指投资者在一个月之内进行交易的次数。交易频率中位数为0,验证了我们之前关于散户惰性大的担忧。股票的波动性是指投资者所持有股票的波动性。它是指在买入股票之前的前一年,持有的股票之间的平均每日收益波动率。它能反映投资者是否喜欢购买波动较大的股票。所持股票的日均波动率为3.4%。年龄是投资者的年龄,平均为46岁。经验是投资者的投资年龄,平均6.4岁。最后,Female是一个表示投资者性别的虚拟变量。
在表3中,列(1)报告了当期RCP与其他投资者特征之间的回归系数。我们发现,处置效应越高的投资者,其RCP越高。交易更频繁的投资者也有更高的RCP,经常交易的散户往往是不成熟的。持有波动较大股票的投资者更有可能拥有较高的RCP。拥有更多股市财富的投资者,其RCP往往较低。年龄与RCP之间负相关,即年龄越大越谨慎,追涨的行为越少。
对年龄二次项的影响是正的,这意味着年龄的增加对RCP的影响在61岁时减弱并改变了方向(我们的观察中约12.5%涉及到61岁以上的投资者)。类似的模式也存在于股市经验中:经验更丰富的投资者可能拥有更低的RCP,但这个迹象在8.3年后也会逆转(我们观察到的大约33.6%涉及投资经验超过8.3年的投资者)。(QIML备注:这段解释不知如何从表3中得出)。
表3的结果表明了一个一致的信息:RCP较高的投资者可能是不成熟的。他们往往更年轻,经验更少,有更强的处置效应,交易更频繁,持有更不稳定的股票,在股市上的财富更少。
RCP较高的账户,收益表现如何?
在表4中,RCP的系数总是负的,并且非常显著:高RCP的投资者在未来倾向于获得更低的回报。当月RCP增加一个标准差将导致下个月的回报率降低0.48%(年化回报率损失5.6%),而且,即使在六个月之后,月回报率仍然降低0.22%(年化回报率损失2.6%)。RCP的负面影响是相当强烈和持久的。
我们还发现,更强的处置效应与更低的未来回报相关。持有波动性较大股票的投资者,未来的回报往往较低,但不是很显著不大。投资者投资于股票市场的财富(Log(AvgInvest))对预测未来收益没有显著关系。较高的HHI指数意味着投资组合的多样化程度较低,与较低的未来收益密切相关。交易更频繁的投资者未来的回报也更低。请注意,我们在这里考虑的回报没有考虑交易成本。除去交易成本,频繁交易者的损失会更大。这再次证实了之前文献的发现,频繁的散户交易者往往是不成熟的,获得较低的回报。年龄更大、经验更丰富的人未来的回报更高。最后,女性比男性更有可能获得更高的回报,这再次与之前的发现一致。
研究结果表明,经验丰富的投资者往往获得更高的平均回报,而行为偏差的投资者则表现更差。最有趣的是,在我们考虑的投资者特征中,RCP在预测未来投资者收益方面具有最强的强度:RCP每增加一个标准差,平均年收益就会降低5.6%。这表明,即使在控制了所有其他投资者特征之后,RCP仍然是捕获投资者行为的一个有意义的措施。在后面的第5节中,我们将说明这也适用于股票回报预测。
我们首先在股票维度定义单只股票的RCP,本文称为Stock Return Chasing Ownership(RCO),用以度量单个股票受被追涨的程度。RCO是持有给定股票的散户投资者的RCP信息的集合。RCO越高,股票散户投资者追涨的积极性越高。我们将股票的RCO定义为其散户投资者的价值加权RCP:
其中 为账户 在 时刻持有的该股票的市值权重。
去除上市未满6个月的股票后,我们对股票的RCO做了如下表5表6的统计和分析,我们可以看出,过去回报率更高、波动性和周转率更高、规模更大、估值过高(账面市值比较低)的股票更有可能吸引追逐回报的投资者。除了过去的收益外,这些股票特征通常预示着未来风险调整后的收益较低。这与我们之前的研究结果一致,即高RCP散户更有可能获得较低的平均回报。
基于股票RCO的交易策略
将股票按当月的RCO分成5个五等份。图2展示了5个五等分位数的平均未来一个月回报(为了更容易解释,这些数字是年化的)。Q1是RCO最低的一组股票,Q5是RCO最高的一组股票。我们观察到股票未来收益与RCO之间存在明显单调关系。最低的RCO五分位数股票的未来年化回报率平均为12.4%,而最高的RCO五分位数股票的年化回报率为-2.9%。
未来股票收益与RCO之间的负相关关系表明,激进的追涨投资者持有的股票往往表现不佳。接下来我们构建一个交易策略,做多RCO最低五分位数的股票,做空RCO最高五分位数的股票。投资组合收益是以股票的市值为加权值的。多头/空头头寸每月更新一次。该构建的RCO因子在我们的样本期内表现相当好,年化夏普比率为0.94,t统计量为2.75。
图3绘制了RCO与标准Fama/French三因子和动量因子的对数累积收益。所有因子每月重新平衡。从图中我们可以看到,在我们的样本期间,RCO优于其他因子。值得一提的是,我们的RCO因子与传统的MOM因子有很大的不同。大量文献表明,中国股市存在动量缺失,即经典的动量交易策略在中国不起作用。这凸显了一个事实,即股票RCO包含的信号远比股票过去的收益更广泛。RCO比仅使用股票特征获得的更丰富的信息。
我们已经证明了RCO交易因子在中国股票市场是非常有效的。我们的RCO指标完全集中在散户投资者身上,因此可以很自然地推测,散户占比较高的股票受到的影响可能更明显。我们通过对RCO和股票散户份额进行双排序来验证这一猜想。我们将一只股票的散户份额定义为散户持有的股票价值与散户及机构持有的股票总价值之比。我们根据股票当月的零售份额将其分为3个子类。然后我们对RCO和零售份额进行独立的双排序,得到* 5 * 3 = 15组。
图4绘制了RCO因子条件下不同零售份额股票的累积收益。蓝色实线指的最高零售股票中RCO多空组合的收益,而橙色虚线最低零售股票RCO多空组合的收益。RCO和零售份额是独立的双重分类。我们可以看到,RCO在高零售股中的表现要好得多。RCO因子作用于最高零售股票的股票,产生的年化夏普比率为1.94 (t统计值为5.38)。
总结
有人可能会担心,在实际操作中,投资者可能无法获得这个数据,所以这个文章中的交易策略无法实施。这当然是一个合理的担忧。我们展示相关的交易策略有三个原因。首先,我们想通过严谨的分析来展示追涨行为对股票表现的影响。其次,该策略可以针对其他数据来源进行修改:例如,经纪商的数据也可以用来计算样本RCO(经纪商数据现在更容易获得)。我们推测,如果使用一个代表性良好的券商样本,这样的策略仍然可行。第三,交易策略的存在揭示了散户投资者追涨的普遍行为。
微信扫码关注该文公众号作者