肥尾效应:应对随机性的最佳实践
徐鸿鹄先生在《统计信仰》中发现,在2015~2020年的5年里,标准普尔500指数500只成分股,只有苹果、谷歌、微软、亚马逊和脸书这5只股票的价格之和增长了2.5倍,而剩下的495只股票的价格加在一起几乎没有变化。这种情形到2023年依然如此。《巴伦周刊》最近指出,美国股市看起来正处于牛市或即将进入牛市,但这是有史以来最“瘦”的牛市之一。2023年前五个月,7家公司(苹果、谷歌、微软、亚马逊、英伟达和特斯拉)贡献了全部甚至溢出标普500指数9.65%的回报率,按照年化来计算,这一回报率超过23%。
这说明上百万数量级的市场数据,无标度或分形的特点会呈现在所有的股票价格波动上。肥尾是真实存在的,之所以有薄尾的错觉,是因为样本数据较少并且存在采样误差。许多原本好用的分析方法和策略都可能被肥尾破坏。这意味着在金融领域中一大类统计分析方法论在实践中都是无效的。不管是参数方法,还是稳健统计,在计量经济学中但凡是违背肥尾假设被广泛使用的理论,从根本上说都是错的。它们包括现代投资组合理论、因子分析、广义自回归条件异方差、条件方差和随机波动。这些方法都依赖于二阶距(与平方有关的变量 ),甚至更高矩的存在。在肥尾的世界中,二阶矩是无法被量化的。
■ 一段尘封的历史
徐鸿鹄先生探究到了一段尘封的历史。他指出,通过金融工具量化不确定性是永恒不变的课题。但未来通常是无法预知的,金融能做到的只是人们对未来的期望贴现而已。这种期望贴现的实现手段,不外乎追寻一种“狂野”的建模策略,利用数学模型填补未知,在缺少事实和数据的情况下通过模型给出决策。期权定价模型 ( BSM ) 就是这样的。它假设人是理性的;所有的投资者都是相同的;价格以连续的方式变动;金融资产价格波动能以布朗运动描述。但这些假设的真实性都是存疑的。在现实世界中,它们都不能被严格地证明,甚至实证和观察结论可能与其完全相悖:人不是永远理性的;投资者也可以有不同的风格和信仰;价格也可能以离散的形式跳跃;金融资产价格波动不一定能用布朗运动描述。
在肥尾的视角下,古典金融的一切都是存疑的。更有出路的做法是围绕异常值构建一个全新的理论体系,极端表现的是金融的常态,接受异常情况是金融风险管理唯一合理的方法,没有什么好解释的,这就是现实。1987年10月19日,道琼斯指数当日暴跌29.2%,正态分布无法解释这一事件,所有基于假设的模型都败下阵来。观察过去,近100年的道琼斯指数会发现,其与布朗运动是截然不同的,其偏离程度甚至达到22个西格玛。这就难怪在诺贝尔奖加持下的美国长期资本管理公司,在获奖第二年就倒闭了。
实际上,早在1963年,分形几何学的创立者伯努瓦·曼德布罗特就在他的那篇著名论文《特定投机性价格的变动》中对棉花价格波动用正确的统计模型进行解释。这篇论文是一个巨大的突破,他第一次在剧烈变化的金融市场中应用莱维分布,并强调了幂律分布的重要性。莱维分布是一种符合广义中心极限定理的随机过程分布。金融市场中价格的急剧改变,被曼德布罗特称作诺亚效应,因为价格的急剧改变类似于《圣经》中诺亚的故事所描写的洪水。价格的急剧改变还有另外一种形态,即《圣经》中谈到的约瑟效应,暗示了市场价格波动在某种程度上互相依存,这种长期依赖性偏离了布朗运动的慢步随机预测,因为在一个方向上的漂移将持续一段时间。
曼德布罗特主张,交易时间的混合行为模式可以由多重分形来构建。分形是一种模式,模式的部分反映出整体,只是按比例缩小而已。模式的某些部分快速萎缩,其他部分则缓慢萎缩,多重分形拥有包含尾部的分布,这个分布遵循幂律分布。值得注意的是,它同时蕴含诺亚效应 ( 急剧的不连续变化 ) 和约瑟效应 ( 长期趋势 ) 。然而,幂律分布并没有在第一时间在金融学领域得到关注,当时它还属于小众的理论。
1955年,斯坦利等人发表了名为《动力学经济指标中的尺度行为》的论文。该论文对股票市场高频数据进行分析后指出,价格收益率的概率分布既不是高斯分布也不是莱维分布,而是尾部截断的莱维分布。更深刻地,这种价格收益率的概率分布呈现出动力学标度的行为。这启发了物理学理论和研究方法在金融领域的跨界应用。
斯坦利指出,金融动力学系统具有时间性的自相似性,是一种强的记忆效应,记忆效应来自价格波动率的长时间自关联。物理学在统计力学、相变、非线性动力学等方面的理论储备,都能联系到幂律分布、无法预期的随机性时间序列和随机过程等概念。这似乎暗示了幂律分布比布朗运动和高斯分布更深刻地揭示金融资产价格波动现象的本质。虽然物理学在20世纪经历了一连串惊人的理论革命,建立了具有不确定关系的量子力学。海森堡不确定性原理对经典力学体系确立的决定论科学哲学观产生了巨大的冲击,但这种不确定性却很难通过类比的方式应用到经济学领域。金融市场是动荡的,需要进一步探究其内在复杂的随机动力学。
在此,关键在于扔掉“高斯认知”的旧枷锁就是“重走 ( 幂律认知 ) 长征路”。幂律分布极具侵略性,其显著动力学驱动的特征使得它再次进入主流视野,而这次被关注是因为它站在了更深刻的物理学认知的肩膀上。
■ 实践派背后的经验
现代投资组合理论中的“最优投资组合”实际上是最不优的,因为它无法防范尾部风险,并且对高回报的资产类别配置不足。意思就是,优势没占尽,行事还特别保守。这一现实让学院派的教授崩溃。更让人崩溃的是,决策理论中,一个简单的1/n规则就能在市场中轻易战胜现代投资组合理论,在这个规则中,一个人没有任何策略平均(算术平均)投资n个基金 ( 或其他金融产品 ) ,而不是根据一些优化标准,如增加一定集中度系数加权的现代投资组合理论投资。
1/n 规则降低了有模型错误而导致破产的风险,因为一项资产的损失不会导致破产。虽然非优化准则预测的潜在巨额回报无法兑现,但由预测错误而导致破产是可以避免的。这是一种启发式的方法,能够很好地规避尾部风险。因为从本质上看,世界的运行是非线性的,更极端一点的说法是,所有我们看到的脆弱事物都是非线性的。非线性是这样一种比喻,如果我被一块大石头击中,我所受的伤害会比我被同样重量的小鹅卵石连续击中所受的伤害要大得多。
任何脆弱但仍然存在的东西都必定经历过时间考验。如果它脆弱,必然早就被小的事件摧毁而无法被观察到。可以说,这种非线性反应是地球上一切脆弱事物的核心。由于非线性的存在,我们最好的生存策略就是保持多样性,而不是按照某个客观标准进行加权和集中。这也是肥尾世界里1/n规则这样简单的多样化策略比投资组合策略表现更优的原因,而现代投资组合理论的严格成立过分依赖均值-方差的薄尾框架。
纳西姆·塔勒布在《黑天鹅》一书中提出了杠铃策略。塔勒布认为,杠铃策略是一个能够实现反脆弱性的方法。迈向反脆弱性的第一步就是减少不利因素,而不是增加有利因素。也就是说,通过降低自己暴露于负面黑天鹅事件的概率,让反脆弱性顺其自然地发挥作用。降低脆弱性,并不是可有可无的选择,而是一种强制性要求。因为脆弱性会带来严重的后果。脆弱性与齿轮不可逆转的特征类似,其造成的损害也是不可逆的。较之于于成功,生存的逻辑优先级别更高。要赚钱,最好先考虑生存问题。再考虑与速度和增长相关的概念时,如果不考虑脆弱性,那就是毫无意义的空谈。
杠铃策略与1/n规则并不矛盾,也是一种“多元化”策略,可以规避系统风险。防火墙对资产的隔离能够避免全局破产和毁灭。严格的讲,绝对无风险的资产几乎是不存在的,也许中央政府发行的完全指数化的无违约风险的债券可以看作不多的备选之一。综合来看,1/n规则更具实践价值。
我们在学院里发展精美的模型来解释事物,但最终还是经过实践检验的、朴素的模型渐渐胜出。这是因为现代投资组合理论无视非线性,不包容现实中重要的肥尾风险。学院派的方法是自上而下的工程方法,擅长根据各种条件进行规划,因此要依赖大量的假设,而失败往往是因为无法预见现实中的诸多新条件。
与此相反,实践方法通过自下而上实践出的理论通常是朴素的、不精确的、非条件式的总结。当然,实践出的理论不一定都是正确的。但这种自下而上的实践性的进步即便是错误的,其错误的影响也是有限的,这种影响意味着有进步的可能。于是,我们在自下而上创新过程中承担的风险一定不能扩展到整个系统,局部的失败往往蕴含着重要的有关进步的信息。有自下而上的理论,就有自下而上的实践方法,如乔治·索罗斯的“预测可影响被预测的事件”、沃伦·巴菲特的“用时间过滤掉观点的波动”、戴维·德雷曼的“逆向投资”。另外,本杰明·格雷厄姆、彼得·林奇、约翰·聂夫、约翰·邓普顿、安东尼·波顿等风格迥异的大师,也都能在市场中获得优异的成绩。
理论固然重要,但市场却在博弈中存在。工程派理论有诸多假设模型,实践派理论有诸多行事风格,畅行其间的唯有认知本身。格雷厄姆说,投资是指根据详尽的分析,使本金和回报有保证的操作。不符合这一点的操作就是投机。显然,格雷厄姆认为,认知才是风格投资和投机的楚河汉界。在格雷厄姆的观点下,投资风格并不是界定投资哲学的核心指标。在面对具体机会时,认知往往比投资风格更加基本和重要,投资风格在大多数时候只是任人修改的标签。
从历史事件中往往并不能发现科学论断。因为人们的决策并不是根据自己掌握的客观知识而做出的,人们选择关注什么、实施什么行动很容易受到自己的主观认知、主流范式和情绪的影响,所以结果就很容易偏离现实的预期。如果要让我选择在工程派理论和实践派理论中二选一,我一定选择后者。因为后者就是格尔德·吉仁泽所说的“经验法则”,而在经验法则中,我们会看到彼得·考夫曼的“人类两万年的经验”和纳西姆·塔勒布的“祖母的智慧”。
■ 知识的局限性
在现实的回归世界中,我们可能面对的风险有以下三种:
(a)不知道分布的类型和性质,如将幂律分布看作正态分布。这个后果可能是灾难性的。就像正态分布下3个西格玛的极端事件,在同样概率下,幂律分布下可能出现10个西格玛的极端事件,以至帕累托分布可能出现100个西格玛都极端事件。
(b)知道分布的类型和性质,却由于对肥尾的误判错误地估计了参数。这个后果同样可能是灾难性的。例如,小样本下的决策,因为尾部通常是看不见的,所以需要海量的样本,如果样本不足就会带来错误的估计。对于极端的情况,如对帕累托分布来说,需要1亿个观测值,才能匹配30个观测值的高斯分布。
(c)黑天鹅事件。黑天鹅事件是无法被量化的,这与技术无关,而是世界观的冲击。任何统计的量化都是经验里的产物,因此经验之外的东西是无法被量化的。
无论处理是哪种风险,甚至包括黑天鹅事件,人们通常关注的都是X,即对X进行观测。但在肥尾世界里,过度关注X,就会遇到一个难题:小概率的X是不可计算的,这个问题也被称作“知识的局限性”。塔勒布认为,在试错或有选择的情况下,我们不需要像了解风险一样了解X,因为X的真实特性在小样本的情况下可能会被淹没。
一个大概率赔钱的策略不一定是糟糕的策略,只要没有破产的风险且小概率能获得巨大收益即可,如尾部对冲策略;一个胜率为99.99%的也不一定是好策略,只要不能完全规避破产风险,前期盈利就都可能归零,如长期资本管理的杠杆统计套利理论。显然,寻找反脆弱,即凸性的意义就是让潜在的结果对我们有利,或者至少不会对我们有害。现实世界中的回报通常并不是基于概率的,而是基于赔付的,但是人们在直观上更在意概率预测。很少人意识到,不论概率X是如何度量的,在肥尾的场合下,它都不如回报函数重要。
预言家专注于预期X的数学世界已经远远落后于实干家专注于行动的脚步。这就解释了为什么在现实世界中,“糟糕的”预言家却可以是伟大的实干家,而“糟糕的”实干家却可以成为伟大的预言家。误把熊当作石头要误把石头当做熊的后果坏得多。这意味着在现实世界中重要的表现,即收益,而不是概率。计算真正是熊的概率有多大在面临生死抉择的时候毫无意义。当一个人押对的时候,会有很大的收益,但押错的时候,损失却更少;当一个人押错的时候,会有很大的损失,但押对的时候,收益却很少。这两种哪种结果更好,其答案不言自明。
小的错误如果影响有限,就应当被鼓励,而不应该被惩罚,这无关犯错误的概率。如果犯错误没有成本或成本很低,或者有助于生存,这就不是一个错误。假如地球暴露给地外文明会被消灭,相当于无穷大伤害,对方完全合作好处也有限,那么彻底避免暴露必然是最优策略。但问题是不暴露人类也照样有可能遭遇灭顶天灾,得到其他文明的帮助还有助于免糟灭顶,这就是一个无穷大的利益。
参加鸡尾酒会是一个明智的选择,虽然会浪费你一点个人时间(有限的负面影响),但你可能会遇到一个改变你一生的人 ( 无限的正面影响 )。哥伦布之所以被人们称为冒险家,不仅是因为他坚信并已用行动去证明地球是圆的,更重要的是他利用商业凸性机会收获冒险带来的巨大收益。看的人都觉得那是冒险,做的人却知道那是深入思考之后做出的结果。思考越深入的人,越倾向于坚定的遵循思考结果。而平庸的思考往往深度不足,不足以理解甚至抗拒凸性机会的现身。冒险通常是指他人对冒险者的表面理解,而不是冒险成功的人的思考和行动。
统计学家佩尔西·戴康尼斯说,人的大脑生来就不太擅长进行概率计算。因此对风险的判断不应该仅关注概率数字本身,我们并不擅长于此,对风险的判断涉及概率及其后果,两者应该相乘。许多领域的事件都有肥尾,这意味着可能产生比传统统计方法认定的更显著的影响。当这种影响较大时,对小概率事件的过度反应不是非理性的,因为概率与危害的乘积更重要,大于传统概率分布的预期。所以,应对随机性的最佳实践恰恰是很自觉地远离概率,未雨绸缪地去考虑事件影响的更重要的东西:损益。
作者:姚斌
来源:在苍茫中传灯
微信扫码关注该文公众号作者