准确率超过90%的预测模型为什么不靠谱？

财经

2024-04-17 10:04

在进入正题之前，先来做一个小测试。

在国际著名期刊《Journal of Finance》上有这么一个研究：研究人员调查了美股的市场择时策略。每年1月，他们都会构建一个模型，预测以标普500指数衡量的市场当年的走势。如果模型预测上涨，就做多市场，如果预测下跌，就做空市场。

研究人员对该模型进行了22年的测试，结果显示，模型在22次中有20次正确预测了市场走向，准确率高达91%。此外，当模型发出上涨信号时，平均年收益率为 15.2%，发出下跌信号时，平均年收益率为-10.9%。结果具有统计学意义。

当然，还有一个不容忽视的因素是，该研究是在《Journal of Finance》上发表的（金融领域三大顶级期刊之一）。

问题来了，你会参考这个模型来构建自己的投资策略吗？

如果你的回答是Yes，请接着往下看。（回答No的可以先想一下选择的理由，然后继续往下看。）

现在告诉你，整个模型给出的预测是基于超级碗球队的输赢情况，比如NFL（后来的NFC）球队获胜，股市会上涨，AFL（后来的AFC）球队获胜，市场就会下跌。

现在，你还愿意参考该模型进行投资吗？为什么？

如果答案依然是Yes，你会如何解释超级碗的比赛结果与随后股市走势之间的关系？

下面是对答案环节。

以上所说的都是事实，这篇标题为《An Examination of the Super Bowl Stock Market Predictor》的论文最早于1990年6月发表在《Journal of Finance》上。

论文由威斯康星大学拉克罗斯分校副教授Thomas Krueger和北卡罗来纳大学夏洛特分校副教授William Kennedy撰写。他们对超级碗与股市走势之间的关系给出了两种可能的解释：一是这纯属巧合；另一个是，如果有足够多的人相信它，那这种现象可能真的存在。他们观察了超级碗比赛后第二天的市场反应，发现第二个猜想得到了一些支持。

研究给出的结论是，虽然超级碗指标（Super Bowl Indicator , 简称SBI）非常准确（截至1988年），但“不能确保预测准确性将持续下去，更何况超级碗指标和股市走势的理论关系并不明显。”

那么，该预测指标在该论文发表之后表现如何呢？

二十多年后，杰克逊维尔州立大学教授Bill Schmidt 和 Ronnie Clayton延续了对这超级碗指标的研究，并于2017年在《The Journal of Business Inquiry》上发表了论文，更新了截至2016年的预测结果。他们的论文标题也更为贴切和直白：《Super Bowl Indicator and Equity Markets: Correlation Not Causation.》（超级碗指标与股票市场：相关而非因果）。

继续补全2016年至2023年的结果后，可以看到，在随后35年的预测中，只有18年是正确的，正确率为51%，只比抛硬币多一点。在预测为上涨的年份里，市场上涨了9.1%，预测为下跌时，市场的涨幅更大，达到了11.5%。

△超级碗指标57年的表现（标红表示结果与预测值不一致）

△超级碗指标与市场表现

57年来的大部分时间里，超级碗指标的准确率约为72%，随着市场指数越来越偏离该指标，这种相关性也在逐渐减弱。但超过70%的准确率已经足够让超级碗指标揽获一批追随它的受众。

在很长一段时间里，该指标一直是体育迷、经济学家和投资者争论不休的话题，一些人迷信其准确性（虽然这一点越来越站不住脚），将其奉为金融神谕（其中甚至有华尔街的分析师），另一些人则认为这不过是巧合，并对其嗤之以鼻。

可以肯定的一点是，超级碗指标并不是有效的股市预测指标。但它可以作为“相关并不意味着因果关系”的典型案例。

1978年，《纽约时报》体育撰稿人Leonard Koppett首次提出了超级碗球队获胜情况与股市走向关系的假设。在此之前的11年，以及之后的12年内，超级碗指标都完全准确地预测了市场的走势，其准确率在早期堪称传奇。

有趣的是，Koppett最初用来衡量市场走势的指数并非标普500，而是纽约证券交易所综合指数（NYSE）。在该指标保持了17年完全准确的市场跟踪记录后，事情出现了转折。

1984年，比赛结果对市场的预测刚好与参考指数的走势相反，于是Koppett修改了衡量标准。

他后来写道：“我做了任何优秀统计学家都会做的事情：我扩大了我的统计基础，直到得到我想要的数字。”因此，尽管这一年出现了一些小的差错，但投资者依然可以相信超级碗指标，因为NYSE、道琼斯指数或标普指数中至少有一个将得到与超级碗比赛相对应的结果。

于是，经过调整的超级碗指标在31年的“可靠样本量”中预测市场的准确率高达96.8%。

△超级碗指标57年的表现，绿色为正确，红色为错误（Koppett的预测结果）

△超级碗指标与各项指数的结果对比

Koppett后来补充说自己是想强调因果关系和相关性之间的区别，正如他在采访中表示的：“我的本意是讽刺人类统计推理的缺陷，这太愚蠢了，让人无法相信”。

但超级碗指标因其早期超高的准确率被媒体不断报道之后，演变成了一个全国性的热门金融话题。在80、90年代的投资者看来，Koppett意外地发现了投资史上最准确的市场预测指标之一。多年来，超级碗指标一直受到各种研究和分析师的支持或批判，即便其可靠性无异于抛硬币，但它仍然是一个受欢迎且有趣的话题。

除了该指标对市场整体趋势的预测之外，S&P Global Market Intelligence还提供了基于超级碗获胜情况更广泛而细分的市场表现统计数据，同样很有意思。

例如，比赛中得分越高，股市行情就越好。S&P Global 表示：“当超级碗球队合计得分至少 46 分时，股市平均回报率为 16.3%。如果得分低于46分，平均市场回报率仅为7.2%。”

另外，超级碗比赛举办的场地与股市的表现也有关系。当超级碗在密西西比河以西举办时，股市表现较差（东侧为8.6%，西侧为14.3%），当比赛在穹顶内（可封闭的屋顶）举办时，股市表现也往往较差。

撇开牵强的因果关系和看起来像是玩笑的结论，我们其实更应该关注超级碗指标之所以不可信的因素是什么。

样本量：超级碗指标基于相对较小的样本量，容易受到随机波动和异常值的影响。例如，如果该指标连续几年正确预测市场方向，人们很容易认为它具有某种预测能力。同样的，一些错误的预测又很容易让人得出相反的结论。

经济状况：超级碗指标假设股市是整体经济的反映。虽然这通常是对的，但有时两者可能会出现分歧。例如，如果投资者认为复苏即将到来，股市可能在经济衰退期间表现良好。同理，如果投资者认为衰退即将来临，市场在繁荣时期也可能表现不佳。

媒体关注：媒体对超级碗指标的大量关注，可能影响其准确性。例如，如果更多的人了解该指标及其所谓的预测能力，他们可能更有可能根据其建议进行投资，从而可能使市场朝某个方向倾斜。这也是前面论文中对其预测准确性的一种解释。

采樱桃谬误：超级碗指标的支持者通常只关注支持其理论的数据，而忽略任何与其理论相矛盾的数据。这是许多研究领域的常见问题，而它可能造成结论的不准确。

超级碗比赛结果：超级碗指标中采用具体球队对决的结果来预测市场走向，而每场比赛的结果都会受到无数变量的影响。比如明星球员在比赛前受伤，可能会严重影响比赛结果以及随后对市场趋势的预测。

总的来说，超级碗指标可能是一个有趣的概念和假设，但它在预测股市方面作用可以说是仅供娱乐，充其量只是让投资变得更有趣的一种方式。更重要的是，它可以提醒人们，在对任何存在相关性的事物下定论之前，都应该警惕相关性并不一定等于因果关系。

超级碗指标是众多另类（非科学）市场预测指标之一，也是最著名的一个，其他类似的体育指标还有美国的三冠王赛马比赛、美国棒球联赛、环法自行车赛等。

正如古人研究羊的内脏进行占卜一样，一些更加另类的市场预测者则是在口红的色号、纸板箱的生产、巨无霸汉堡的价格、女性裙子的长度和《体育画报》泳装特刊的封面上寻找市场走向的征兆，这类指标多到可以单独写一篇讲讲。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章