量化研究入行1年能学到什么?
趁着2022国庆长假,我整理了自己的积累给大家分享。我知道当我发现6个月前的自己像傻瓜,1年前的自己像超级傻瓜的时候,才说明进步了。本文没有太学术的东西,因为量化难就难在它不是非对即错,没有一个圣杯,可以让我们知道对错。思路的产出远远要比策略重要。感谢同学,同事,领导,投资人,知乎认识的交易员,朋友,同行的沟通解惑。
1. 对作为一个基金经理,为什么最近那么难?为什么大家都在亏钱
日内低频或高频固定持有期cta作为大私募的核心策略一般都不会亏损。这类型策略难在持有期短,而且要覆盖手续费,这样回测准确而且优秀的一般都经得起实盘的考验。
日间规则cta做的是持有holding alpha,赚的beta收益,大多数是趋势跟踪,而且是延迟的。当市场领先开始无序震荡,就会被洗,持有期内的都是噪音。所以此类策略拼的是出场和资金管理,进场信号都大同小异,除非有逻辑非常不一样的入场规则来互补。因为利润是市场给的所以要分散在多品种上做趋势跟踪,但是也会出现集体失效造成亏损。目前市场上85%的cta都是这种类型,包括主观,量化,国外期货杂志,国内各类出售的策略都是。比如最著名的海龟策略就是由手动择时交易者把总结出来的规律程序化。说白了就是高级拍脑袋,没有系统化,统计性可言。
股票是现在大厂能容纳最大资金量的赛道。而且因子工程已经非常工业化了。在截面上的因子普遍要比时间序列成绩好,数据量多。但是由于截面缺乏了时间序列特有的因子评估优势,很多样本内和样本外都好的因子非常容易经不住实盘考研,而很快失效。所以这就需要许许多多的因子放在一起组合,希望统计上是正期望,组合权重,筛选等等都是课题。可一旦集体失效,之前做的再好都是会有回撤的。
不要觉得任何人的做法太low,传统的跟庄/狙击/波段交易在执行上有优势,机器学习在特征上有优势,最好的办法的都懂然后取长补短。说到底市场是情绪驱动的,估值对不对不要紧,库存缺不缺不要紧,基本面供需不要紧;大资金(主力)想让k线长成什么样就会是什么样。作为基金经理,要在情绪中找规律,实盘后不停分析复盘,不停的更新模型才会最终成为市场里获利的那8%的人。(根据期货大赛统计数据)
2. 作为一个量化研究员,应该怎么进阶或者是否放弃
要有足够的韧性去失败再爬起来:研究不必定会出结果,做一件事但是做不成在职业道路上会成为绊脚石。
要有足够的时间成本去试错:不要怕过拟合,不要怕数据错。坑踩多了就好了,怕就怕没有点子了。
要有足够的热情去试各种东西:当没有点子的时候是否能及时接纳和快速学习别的资源。非常建议大家都看一下kaggle,有些答案的思路可以借鉴。但是题目预测的目标不一定能用在自己的实盘。
要认知过拟合。解决它的方法论有很多,比如先过拟合再剔除,或者反过来等等。但在建模的最开始就要知道会在什么地方引入过拟合,再想怎么去解决它。举几个隐晦的例子,在寻参的时候,模型会刻意在历史中去规避几个大的亏损点,抓住几个大的盈利点。还有比如价格其实都是以复利计算的,动量其实有一部分是在拟合指数式的上涨曲线
不要在每个量化分支都打一枪,没有精力的。当自己在某个领域知道够多,再去付费,再去和前辈请教才会有收获。不然知道的太浅薄,哪里做错都不知道就收手了。
这句话我听到过很多次:“这么做行不通的,我以前试过”。别人说没用的东西不应该直接丢弃,因为量化的做法千千万,有时候差一行代码一个思路结果就会千差万别。不思考本质原因,亲身经历,对自己是完全没有帮助的
量化应该要和交易结合。请实习生挖因子可行正是因为许许多多的交易规律是手动大师根据k线,均线,成交量,盘感,主力,跟庄总结的。而不是简简单单的close.rolling().mean()+close.rolling().std()。对于实习生搞清楚规则型,连续型因子的用法,和最最重要的因子评估要做对。
3. 作为一个新手小白,应该怎么开始走量化这条路
选一个方向深挖。有能力的话看paper,不行就看书。从信息度上来看是paper > 书 > 收费blog > 免费blog。当一个作者花大心血把资料整理成书就已经比blog内容优质了。
择时:利润是市场给的,不能一直全天候获利
预测:需要积累,并不是新手拿个因子上来学一下就可以预测。需要对因子构造,变型,数据,评估,组合等等有非常深入的了解。量化的圣杯并不是告诉你10个大私募的因子,因为它们最终都是向量基,各个环节环环相扣组成结果才行。可怕的是一步错步步错,一直没有好结果也不知道为啥
截面:大厂在这领域有绝对的因子数量,人员,科研优势。但是同样容易一步错步步错。
套利:偏高频的领域,锁住价差的同时也锁定了利润,但是要资金管理的好,利润高才行。不然虽然夏普10但是利润覆盖不了硬件开支也不行
做市:和马丁策略类似,需要足够的存货,和风险对冲来积少成多做收益。
期权:作为衍生品的期权本来是用来对冲非线性风险的。bs 定价,pcp,strike arb错误早已不见了。目前最流行的是把skewness,calendar spread,convexity都做成因子,然后做时间截面所有期权的long short。这个做法的难点是回测和交易滑点成本,因为期权市场天然就不是给量化投机用的。
现在市场上有许许多多的短线交易书籍和课程。我自己也抽空看了几本,在这想和中国许许多多的散户投资者呼吁,不要相信没有有效统计结果验证过的策略。短线交易虽然会连赢好几次,但是在大数据概率上能做到。
请发送简历至:[email protected],应届生加入量化高校群交流,获得干货分享和面试习题等。小助手:jymsu2023
微信扫码关注该文公众号作者