量化投资的底层逻辑
“至人之用心若镜,不将不迎,应而不藏,故能胜物而不伤” - 庄周
应然没法能从实然中推出。No-Ought-From-Is, or NOFI for short - David Hume
量化投资分很多流派,既然是讲行业整体,我也就不去细分了,所以肯定有挂一漏万的现象,请读者朋友多多谅解。但因为不同流派之间,其底层能力源头有共性,所以讲逻辑层面,只需要描述大家可理解的本质要点。这些点,各流派其实都会去相互借鉴和整合利用。量化机构如果把这些点用透用足、在落地层面更精益求精,就能取得市场竞争力;如果在此基础上再管理好其负面反噬,才能在残酷的市场竞争中长期胜出。
我自己观察,量化投资外表看上去的各种分门分派,更多是媒体宣传和渠道销售业务分类便于处理的表象,而无关量化行业整体的逻辑本质。“便于处理”这四个字,在各个行业的实践底层逻辑中反复出现,包括本文主题中的量化投资。
总结出来,量化投资有以下4点逻辑供参考:
高频打低频
细部有规律
价格定价值
休谟双刃利
这个逻辑主打的其实是信息进入价格过程的时间差。
其中信息可以是市场外部信息,也可以是市场(跨市场)本身的价格信息。
01. 各种先于国家统计局整合信息发布之前的过程数据
02. 热销品在京东淘宝上销售数据
03. 全球航运大数据
只要采样的频率比主观经理常用的数据频率高,就能获得信息上的先机。
只有数据可得性还不够,还需要对这些数据建立到可交易标的价格映射的机制。
以全球主要航线的航运大数据为例,你怎样将这一可得高频采样的数据映射到可交易标的。即看到数据流的变化,到底应该用何种模型驱动对何种资产如何做多做空。这些都是需要研究来定的。这个数据到交易的映射逻辑,与主观行研其实没有太多本质区别。现在量化基金也在往基本面量化投研方向走(交易门精粹群群友张然教授的《基本面量化投资》一书值得一读)。这里在逻辑差异性层面,强调的是更高频率的数据采样,和能去归纳回验的建模过程。
高频打低频的另一种更常见量化投资模式,就是大家非常熟知的利用市场(跨市场)本身的价格信息差的高频交易或套利交易。资产价格的信息已经高度结构化,所以非常容易被量化算法程序系统性处理。同为价格信息,也很容易建立跟不同资产价格的变动映射关系。于是这里的竞争主要就是在交易科技层面,看谁下手快。落地竞争要点虽然在交易科技,但底层逻辑仍然是高频打低频。
看家里客厅的地毯,可能表面杂乱,但带着显微镜深入下去,你会发现很多微观细节。同理,在数据局部去找规律方面,量化投资走的非常非常深入。之前各种统计建模,现在机器学习算法都在应用。
这部分也是人和机器在能力上很大的区别。找规律的具体方法这里不细表。那这些规律逻辑根上的来源和确定性,可能出自哪里是理解量化投资最有趣的问题。
绝大多数规律其实就来自于不同类型的市场参与者的行为,甚至就来自于完全对位竞争的程序算法。
这些参与者可能需要在10点之前完成自己主观投资的投资交易策略,于是在9点半开盘到10点之间,就有机构交易员信息交易的规律性痕迹。或者一家大的保险资管需要在某中型规模和市场流动性一般的公司股票上建立较大的持仓头寸,他就必须把持仓目标分解到几周时间甚至更长去执行,可能交给自己的交易台,也可能交给市场上的算法执行机构,这些交易本身都会在市场交易中留下数据轨迹。这些信息轨迹和对价格冲击的微观机制,是金融学术理论圈中市场微观结构领域特别关心的问题。(最爱该领域开山牛文 Kyle1985,Continuous Auctions and Insider Trading)
对位竞争的量化程序也会提供可资利用的规律,比如你有到东京gowest的线路,你能最快知道北美市场的最新价格。但是国内的低延时竞争者的程序没有接这路行情源。他的交易中就会出现没有这些信息带来的规律性特征,毕竟大家都是在一样的思路下交易,你或许就可以系统性侦测到他的程序因缺乏某种持续而重要信息源,对其程序运行带来影响所产生的轨迹规律。毕竟,越往高频走,你会越来越多碰上对位的高技术条件下算法程序。
以上只是可观测数据规律来源的一些方面,当然还有更多的方面。宏观一点的,比如股票截面因子有效性的问题,在2020年全年A股动量因子实证有效。背后是资管新规过渡期所推动的压力下,机构资方的“买买买”行为。机构的钱进来太猛,主观基本面公募基金经理本身研究透的股票也就这么多,只能把钱配在手中持仓已有赢家白马股上。动量因子表现不好那才难以想象了。只不过我们是事后去找归因,发现是这个问题。在2020市场进行中,量化管理人的多因子策略模型研究就是靠因子有效性的持续跟踪来看到当下“因子动物园”(factor zoo)喧嚣热闹的。
交易门精粹群群友张曦同学的“金融主义”理论论述,论证严密,内容详实,案例丰富,结论深刻让笔者大呼过瘾。张同学论证了金融主义并非另一个资本主义的版本,是一种全新的“主义”。就是会发展出有利于占据市场最核心位置的交易者与金融机构全新的“价值观”,他们对资产价值定义早已经偏离了传统教科书的经典定义,变成了更简单实用,更容易量化建模,也更便于量化交易落地的:价格即价值。
价格反应了市场参与主体的共识,融汇了市场外的各种信息,大家用钱投票形成价格,这点在高频打低频的描述中已有说明。绝大多数量化交易者其实并不关心资产非价格层面的价值。在金融资产定价理论那些模型层面精致,假设和输入却都不太能用于实战的模型,对量化投资者实战来讲都太过奢侈。所以他们的程序活着当下,算法心情平静(“至人之用心若镜,不将不迎,应而不藏,故能胜物而不伤” -- 庄周),忘掉其他类型投资者念兹在兹的错误定价机会搜寻,将人的精力,计算机算力一股脑投入到市场价格延迟反应与价格规律析取路径下的盈利获取中。
这一切源于何为“合理估值”这个核心问题,并没有便于用量化投资工具体系处理的路径。当然你可能要提Q宗那套,第一我说了,挂一漏万,第二我一定可以告诉并不矛盾,比如能用于定价的波动率估计本身就是个大难题。量化管理人在“价格即价值”的新工具理性下,是否估值合理成了显然的悖论,被心安理得地取消研究。从此量化人心中没有错的价格,只有慢半拍的对手和其留下轨迹规律的行为。当量化投资关注点完全从“价格不匹配价值”的窠臼中移开,可折腾的天地也随之开阔起来,不管是高频还是低频,宏观还是微观,信息汇聚入价格的过程,这本身都是大的数据同步发生过程,时刻不停地为量化建模提供所需的特征刻画与算法训练输入数据集。
价格定价值,使量化投资者,通过数据分析和建模,在市场高频与微观的结构上看到大量可以出手的机会。每天的日常忙碌后回家后的量化人。在晚上睡觉前,可能需要问问自己,这些机会一定都是真的必然赚钱(大部分情况下只能讲统计意义)吗?有没有什么自己没有意识到的很大的坑?这就进入了下一节认知方法论的讨论。
大家都知道有个英国哲学家,叫休谟。他对应然和实然做了探讨和区分(应然没法能从实然中推出。No-Ought-From-Is,or NOFI for short, -- David Hume),给量化投资在价格定价值的实践方向,做了心理约束上的大松绑。且不管实然和应然能不能划等号,应然的研究如此费劲,对量化人来说实然显然更容易观察和处理。于是在投资交易实操中,专心对着实然去研究就好了。换中国人的语言体系讲,实事求是最厉害。可量化可追踪可回验的事实如果主导,那更是厉害翻翻。
于是,我们可以看到量化投资者是最有名的不争论派:你(指其他交易对手方)完全可以有你的“应该”,即价值高或者低的估计,全部欢迎来我对面当对手盘,或同向交易的流动性竞争者。在市场中公平地用自己的钱来参与形成最终的价格。完全没有任何可争论想争论的点,因为很快市场的变动就会自然告诉我们结论,你要你的正误,我要我今天的P&L和盘后可去建模调整的真实数据集,各取所需,求仁得仁。也正因为如此,量化投资者也并不愿意对外解释自己的逻辑,才使得这篇文章有个缘起。
必须指出的是,量化人内部对这个事有两种不同的表述,体现自己底层思考的不同趣味:一种坦然承认自己不预测、只建模根据实然数据流来“应对”;一种也同样真诚地觉得统计建模就已经是一种预测了。跟别的投资流派一样在预测,区别可能是这边更实事求是更微观落地,不看空泛而充斥没经验证假设的大逻辑,明显是更科学的预测。
这两类人其实底层做事都是这套,细节技术抽象忽略后,逻辑和流程都一样。但对外,一半说不预测,一半说要预测。这很让人困惑。经常有非本行的朋友问我,你们量化到底预不预测。我常半开玩笑说这叫量化战忽之预测篇。量化战忽可不止于预不预测,因其整体都对外颇神秘,还有不少好玩的战忽点,有空慢慢写。
同样因为这不争论的态度,把实然(即真实发生包括市场价格在内的大数据集)抬升到了最高研究对象。于是,量化投资一定要讲数据实证,而数据一定来自已发生的历史。这就出现了归纳法应用的后视镜问题。
同一个休谟也反复提示:NOFI,即应然不能从实然中推出。人类在归纳法应用上存有底层的大隐患。以刚才举过的两个例子来说,动量因子有效,近期回测也有效,实战也赚钱。作为量化基金经理的你,可能选择一直用,甚至可能比之前加大比例用。而渠道销售看你基金超额表现很好,也乐意帮你卖产品涨规模。直到市场对面大机构资金的权益类份额都打满了,不再买买买,动量因子超额消失。量化回测统计建模,在最经典归纳法意义下,是不会管这些的。实战结果就是会表现为因子失效,产品超额业绩消失。这是一个典型因归纳法底层逻辑带给量化投资问题的场景。即,数据本身不告诉我为什么会有这样的数据。
如果,此时渠道销售帮你扩规模卖的起劲。新申购基金的钱,按回测和实盘近期表现,继续配置在动量因子上,那么这些新来的财富端的钱,都可能让过去几个月有效的因子,仅靠涌入资金,超额有效表现再延寿几周。而这正是2021年三季度量化指增市场发生的事。这时的逻辑就从休谟快进到了索罗斯,即著名的反身性问题。
这里,如果简单归纳为“量化策略易拥挤”,我觉得就太粗糙了。财富端可能觉得这样讲容易让客户理解。但简单概念和简单类比的引入,往往会造成严重的误读。比如,只要量化管理人做的好上一段时间,销售和客户就立马开始担心策略会拥挤,这样造成的大量产品的申赎,对投资者长期回报会带来负面影响。毕竟,我上面讲的两个如果,是在最原始的量化逻辑下的推演。而在市场竞争的腥风血雨中成长起来的管理人,在这些问题上一定会有自己独到的思考,作为一线实战者比我想的深,那是题中之义。对应的机构,大概率也会搭建相应的风险管理流程。所以,真不能一概而论。
这些针对休谟双刃剑和索罗斯反身性对应的量化投资风险管理问题,今后有时间专题写吧。
总结:量化投资工具箱中有更多更好的数据输入和对数据实证建模分析处理的强大能力,并持续主动升级。在应用于金融投资实战时:
1. 在理论层面,将价格认定为价值做客观化定义,从而取消了其他流派那里难于处理的投资估值问题,便于全面对接数据输入与实证方法论。
2.在落地层面,应用归纳法的基本思考形式,应用统计建模(含最新的AI算法等)与交易科技等技术手段来投研交易竞争展业。
3. 最后,量化市场参与者要想做的好,在市场中活的长久,还需要关注底层归纳法双刃剑与市场反身性等问题带来的风险,构建对其的透彻理解与风险管理业务流程。
关于品哥小作文:和行业上千人聊过的品哥,写写小作文和大家分享思考。如果你也希望和品哥聊聊,欢迎在公众号后台回复关键字“品哥”,获取聊天路径。
READNG
微信扫码关注该文公众号作者