独家 | 交易门视频专访百亿量化致诚卓远创始人史帆
PART 1
>>> 史帆进入量化领域的起源
>>> 为什么很多量化大佬都是物理学背景
>>> 我不做量化干啥去?
>>> 史帆对机器学习在量化研究中的运用
我原来在银行里面做的很多工作,实际上还是一些数据分析的工作。只是我们在银行的话,我们可能会比如说通过一些数据去研究,一个比如说他违约概率等等,或者研究我们内部的一些员工的工作效率啊等等。那这样一个东西,它本质上来说,它的一个研究框架还是我们通过可以采集到的一些数据,然后去预测一个我们可能在未来才会观测到的数据,比如说这个计划完成率等等之类的情况。那这样的话,因为我当时实际上是在做一些跟内部管理有关的事情,实际上并不是主要做违约的,主要我们还是构建一个模型,去构建了这样一个关系。那这样的一个模式实际上它本质上来说还是我能采集到一些x,然后我去预测一个我目前是看不到的y,或者是我未来看到或者是我永远看不到的一些y,然后这些y可能有一些意义。那这样的话,这个框架在我们当时研究的也是比较熟悉了,这无非是一种研究方式。那后来我发现股票里面实际上也是这样的,大家都知道你其实因子就是你一些看得到的一些信号,然后你去研究一个未来的收益率,然后研究这两者的一些相关关系,所以我们后来发现这个东西可以比较好地迁移到股票上来。然后大概我就在2014年的时候开始自己捣鼓一些东西,所以我们这套研究体系可能跟主流研究体系差异比较大,因为这套东西是纯自己瞎捣鼓出来的,所以它可能也会有一些自己的特点,然后也会有一些跟其他的不同,所以导致这个结果下来就是,我们那么多年下来我们的体系一直其实跟其他家会有一些不同。
我分三条先来讲吧。因为我感觉现在做量化的比较多的,一个数学一个物理的,还有一个计算机这三种类型的。这三种类型,我觉得他们每一个学科的特点是这样,物理学科,我们做的事情主要是我们会观察一些现象,然后通过这些现象,我们试图拿一两个公式去整合这些现象,然后整合的这个现象我们再把它进行一个外推,这个是物理学喜欢干的事。那数学喜欢干的事呢,可能我们记一两条假设,这两条假设可能是比较普遍、比较简单的,对吧。比如说平面上的平行线只有两条或者是几条,给我一个点的,这个时候是一些比较简单的假设,然后我们可能用数学的办法推出了一整个世界,然后我们去看这个假设下的世界是不是跟我们的真实的世界是一样的,那这个是数学的办法。那计算机的人,他可能更擅长的是,比如说他在程序方面,他的算法可能会比如说提高一些计算速度等等。所以实际上这三条线在量化里面,我觉得他各自的切入点应该是不一样,每一个学科的人如果都来研究量化这个东西,他可能切入点是不一样的。那像我研究一个物理的角度,如果来切入量化的话,那我们习惯的就是说我去看一个数据,这个数据里面我找出一些规律来,然后这些规律我可能,因为物理我们知道,特别像我是在物理里面做试验的可能就更糙一点。我们做过试验的人,一般来说就是我们可能会有个想法就是我们可能会做出很多出来的结果,但是我们不知道为什么会这样,但他就是有用。那现在我们可能做量化,也会是这样一个东西,就我可能会找到一些规律,然后我可能试图去把它变成一些规律性或者数学性,但这个可能并不严格,但我们可能会有很多很多的这样的一些数量模拟的一些东西。那这样的一些东西,我们本质上来是找到了世界上过去发生的一些东西,然后在过去发生的东西在未来他还会以某种方式重现,那我们去找这样的一个方式。所以我觉得这三个学科,可能每个学科切入量化的话,他的侧重点都会不同,但至少从我自己而言,可能我自己的策略等等里面,往这个方向去做了东西会更多一些。
其实准确来说我是喜欢研究一些东西,因为本身学物理的可能都喜欢研究一些东西,特别是如果你能自由自在地研究一些东西的时候会更开心一些。那所以量化这个东西它提供了一个比较有意思的,就是你的一个想法您可以很快地去验证它对不对。那其他的行业可能这种反馈的节奏会更慢一点,或者是你没有特别好的办法去检验你的一个想法是不是对的。那量化这个行业它有意思的点就在于我可以去想很多很多的,我可能想了100种,中间发现三五个点是能用的,那这个时候就可以带来一些兴奋感,实际上也就是这样了。至少其他行业,我目前看来没有量化这么直接,我只需要编个程序,跑一下就可以验证我的新思想对不对。
我对它的理解可能是比较简单,也不知道其他人可能会对这个有没有更深的理解。我的理解我刚才已经介绍过了,就是我们包括我在建行的时候,当时做的也就是一对x去预测y,对吧。这个其实大家都知道是一个非常典型的机器学习解决的问题,那就是我们有一堆已知的数据去预测一个标签也好,预测一个值也好,那这个东西是个比较典型的问题。那在我们开始用这种模型来解这种问题的时候,至少在我们14、15年我们知道的市场上大部分应该都还在多因子。那这个时候他们多因子的办法呢,可能就是这对x他们试图去人工地写出一些公式,那这个公式可能会跟y有关系,但是肯定没有继续学习这个y的更深入透彻。那所以我们是在比较早地使用的这样一些方式,在这个模式里面,就是说我知道一堆x去预测y这一个东西,那可能我们会有很多种不同的变形,那这些变形,我们本质上来说是要把这个问题,每一个我们要解决的问题把它良好地定义成这样一个数学问题,然后再用这个工具去解决。所以我觉得我们用机器学习的一个核心点,是怎么把我们要面对的具体问题变成这个数学方式很容易解决的问题。那如果我们能把不同的问题一个一个地变成这样能可以被解决,因为数学的人就说我已经用这种方法解决了对吧,那我就永远认为这个东西到这就可以直接结束了。那我们也是一样,这个东西我能归结到一个已经被解决的问题,那这个问题就已经算解决掉了。那所以在这个是里面我们去研究它的思维过程更像是这样一个东西,所以就说对机器学习里面的东西,我可能并不是专家,但是我可能会更擅长地把我自己需要研究的问题,把它变成一个机器学习可以解决的问题。
PART 2
>>> 致诚卓远为什么从昆明搬来陆家嘴?
>>> 致诚卓远团队人才建设
>>> 喜欢什么样的量化人才
>>> 团队不断学习新方向
实际上我们在昆明的阶段,因为我们公司是14年我开始做,然后15年正式成立公司,然后发产品做;14年到15年,我们当时是发了一个头部型产品。所以当时我们20年来到上海之前,我们已经发展了6年了。那这个6年的过程中,其实我们发展的一个过程还是相对来说,至少在前面那些年是比较顺畅的。因为市场前面的竞争啊,它是没有那么激烈。但是我们一直设置一个问题,就是我们在昆明那个地方,实际上是非常难招到一些合适的人的,所以我们在很长很长时间,我们的策略主要是我在做这个,也可能是一些由于一些客观条件限制,我没有办法招到一些特别好的人才导致的这个结果。但这个结果后来也导致了我们的特点,策略的一些特点,这可能也是一些即好又坏的事吧。但是我们在20年的时候,我们认为可能这种依赖一个人的方式可能还是不太利于我们策略的一些信息的广度的铺开。那后来我们在上海这边设立一个办公室,最初的目的,反正肯定是招一些同行业比较精英的人。那可能我们一开始也没有想好我们在上海的一个模式会是什么样的,那经过20年一直到现在的一些磨合,现在我们大致来说初步确定就是上海这边我们会把它定位为一个因子的一个研发中心,那这边的因子不停地研发出来以后,后面的一些使用办法还是继续我们原来的一些使用办法。
我觉得量化它投年轻,它底层逻辑是这样的,就主观上它可能更凭借一个人的经验,但是量化的话,它本质上来说是一些技术活,对吧?就像一个工程师一样。那我们这个时候一般来说年轻的人他总会更多地掌握一些更新的技术,然后年纪大的人来说他接受新鲜的技术的速度总是会慢的,所以在这个层次上我觉得投量化是投年轻的是没有错的,因为我们看到其实很多涨起来特别快的这些都可能都是一些相对年轻一点的团队。但是我觉得是这样,就一个量化公司,如果它发展到一定程度以后,那这个时候它可能会是这样,就是如果我们认为一个它通过一些标准化的这些数据,比如说量价这些,里面蕴含的真实的数据规律,这个时候会有两种可能,一种可能就是说如果我们已经用现有的技术大致挖的差不太多,那这个时候比如说如果我们认为这里面拥有的信息的上限,比如说20%,随便说说吧,那这个时候如果我们一个但凡在里面挖的时间比较长的团队,可能都会接近19或者19.5这样的一个级别,再往上突破的空间实际上我觉得是并不大的,所以刚才我跟您这边聊了很多,也都是在聊一些我们这边的风控的一些点,其实我们认为现在市面上这些大家来说做挖掘,包括我刚才说的,我们也不希望挖外面的人来,因为大家挖来的人这些点上可能很多都不会差太多。所以我们认为可能大家不管是怎么样,到20这个做了这么多年的,可能都是19,你19我也19,或者你18.5我19。这个时候大家之间相互的差异会比较小,所以我们认为在这个时候可能在量化,如果你要长期相对于稳一点的情况下,可能会是相对老一点的公司,像我们这种。但是如果你要是,比如说他这个团队,三四十亿四五十亿,可能这里面确实会有一些,他的在短期内,分数肯定会比我们要高的。
一种可能性他采用了一些新鲜的办法,另外一种可能性,也有可能是他在某些风险方面,他控制的有一些暴露刚好又没碰上。那后面这种肯定是我们不希望的,对吧;那前面这种实际上在这么多年的量化里面,其实也有过几次。一次就比如说之前大家都在用因子,那现在基本所有都在用一些机器去学习啊等等这些东西,那这个点上我觉得是这样,就是如果未来再出现一种革命性的技术手段,那像我们的话,我们肯定也会尽可能地去、想办法地去保持这种新的革命性的技术手段,尽快地用到我们体系来。但这个本质上还是不一样的,因为我们公司为什么在前面发展会比较快,实际上是因为我在比较早的时间已经采用了机器学习了,那在这种情况下,相对于一些当时的一些可能大一点的其他类型公司,那他们可能由于他们自己的管理体系,他们可能会比较难的采用这种新的技术。因为你毕竟这个是一个人的世界,那你的团队里面如果已经有了很多用脑技术的人,新技术来怎么平衡这个之间的关系,所以不会也像一个,我们如果是个全新的公司,那全部都是新技术,那这个肯定是的。所以在这个点里面,当一个新技术出现在一个比较大的团队的时候,这个技术首先是个技术性、革命性质的东西,可能大家都看得到。所以在大的团队里面他可能很难地把他的全部流程都改造;那如果是新的团队这些没有问题,但在我们这边的话,可能有一个好处,就是我们这边因为我还是总管整个体系,那所以就是说如果我这边我自己还有精力去学得懂这些东西的话,那可能至少还是不存在这个人之间的这种一个更新迭代的关系。当然也有一种可能就是我如果年纪太大了,可能接受不了新鲜东西,那也有可能在这个时候就会逐渐地落后于同行,我觉得这种可能性都是存在的,所以我们也不能说会一定战胜市场,我们只能说尽我们的所能去在这些我们看得到的点上,尽量去做到最好。
其实我们这边找的人,我很难说什么样的人适合做量化研究,因为这个量化研究实际上每个公司都有每个公司不同的做法。那可能我们只是也只找到了我们的某种方法去研究而已。但现在因为我们的特点是这样,因为我原来这套体系是比较完整的,所以我们现在需要的人是跟我原来这套主体系并不会特别重合的人。因为这层也有我们自己的东西。那现在我们虽然希望搭建梯子,但是跟我重合的这一部分,我是不希望的,所以我希望的是扩展开的。所以至少对我们致诚卓远而言,我们现在招的人是我不希望他因为他原来很多是在比如说在其他公司做过很长时间的因子挖掘,那他可能手头很多因子会跟我原来的这些因子重合度非常高,那种对我是没有意义的。那所以在我们这边我们新招的一些新人来,我们会把我们自己的这个因子的一个结果首先就会放在我们系统里面,那这个时候他挖一个因子,如果发现跟我们这个因子已经很像了,那他就不要去往这个方向走了,他就知道这个地方你再去做对公司是没有什么提高的。那这个时候我们在他开始培训的初期步骤,他就会把这些原来我们已经做过的点就避开,那这个时候再去找外面的我们没有覆盖过的地方。那所以现在我们要招的人是一些比较新一点的人,因为他有的知识对我们大部分老人,对我们来说可能重合度是非常高的。
像我自己一般也会喜欢跟踪一些业内的比较新鲜的paper,去看一下等等,那如果是我们认为可能会出现了在方法论上跟原来是颠覆性的这种方法论的话,那可能我们就会投入大量去学习这个。那如果没有,只是比如说你的强度提高一些,那我们可能也会用他的这些方法去试一下我们有的问题。那这样的话可能并不是一个我刚才所定义的这种颠覆性的技术革命。那所以这两种东西,那包括我们自己在继续学习的同时呢,我们也会去跟踪比较新一些的这些paper来看他的问题对我们要解决的这些问题有没有帮助。但至少我认为我们最大的变革可能会出现在一个完全的新的东西。如果出现的话,那可能旧的这一套就完全会彻底被打败,那如果我们更多地是关注这个东西会不会出现。
PART 3
>>> 致诚卓远2022年怎样做到表现优秀?
>>> 史帆对风险控制的理解和把握
>>> 规模和收益的博弈
>>> 客户和公司共同成长
>>> 史帆对2023年的看法
因为其他家他们整个特别是在20年发展起来那一波。那一波应该有很多,可能19年都才几十个亿,整个到20年就可能到几百个亿,甚至到千亿的,对吧?那一波上去的很多实际上它都是靠着那一波,就是类似于我前面说你小盘暴露等等,反正你靠风格挣钱,在风格在的时候都是很好挣的对吧?那这个时候一旦风格没有了,实际上他们并没有在没有风格的情况下怎么赚钱的这种策略。那这种情况下,如果他们去把这些敞口降下来,那他们就会发现在降低敞口的情况下,他们是非常难赚钱的。但是我们呢,因为我们一直都是在不做这些暴露的情况下去赚钱这件事,所以这个事,现在无非就是我们依然也不去暴露,别人也不暴露,但是我们不暴露的是我们是能赚钱的,但别人不暴露他们可能就没法赚钱。所以在这种情况下,即使在我们20年我们不暴露,我们虽然业绩比其他难看,但是我们也还是接近10个点左右的一个收益嘛,可能七八个点那一年,不对,六七个点吧,反正那年不是特别好,应该是我们所有年份当中最差年。但是实际上也保证了还是至少超过国债的一个收益率。
实际上这个东西我们从我们公司成立第一天来就是这样,因为我们公司成立第一天特别有意思。我记得我们成立的第一个产品是到现在我都很记得,就是2014年的11月19日。然后为什么记得那天,因为第二天就是赶上了那一波金三胖猛涨啊,就是刚好第二天我们就赶上了这些股份大概就是第二天超大盘指数超了六七个点。然后我们的做法,因为在这之前,大概12、13年还有14年前8年,大家的做法都是用一些比如说你做到小盘股,因为那时候只能做空IF对吧,那做空IF前面都可以几乎这样摆起阿尔法。但是我们虽然研究数据肯定都看到这种现象,但是我们认为这个东西里面存在了一个天然的风险点。所以在当时我们设计的产品里面,我们几乎就是说我们还是对冲IF,但是这个时候我们多头这边,他大概35%当时都是证券和银行,那我们大概这35%是克隆的这部分。所以在这种情况下,我们几乎没有受到太大的损伤,也就是为什么当时在14年运行了一年的一个比较小的规模以后,后来我就成立这公司也算到了我们第一笔资金,实际上也取决于我们其实一开始没有掉到坑里。那当时在14年那一波里面,其实之前的很多,比较有名的公司可能都掉到坑里,可能有的就已经死掉,就我们现在都已经完全不知道那些量化公司吧。因为那一波下来你对冲IF空头,然后这个时候如果你没有去做多银行证券,可能那一波你短时间都会,一个月内可能回撤就会达到20个点这种级别。所以这种基金是我们那么多年来一直秉承的,包括一直秉承到后面20年这一波。20年这一波又是典型的如果我们去压这些白马股,整个20年全年最多白马股超越其他股票,有非常非常强的阿尔法,只要在这上面多配个10%、20%,可能一年就会多个10个点左右的阿尔法,那这个时候这一段在当时大家都很难做高频的情况下,这部分增补进去的阿尔法会是相当明显的。所以整个20年市场上坚持还不这样做的基金公司应该几乎都死光掉了。因为别人都做到30%、40%的超额,而我们那个时候可能超额一直是20%左右,但是我们多年以来一直都是比如说我们的500的超额在25%左右,是相对稳定的;但是别人如果做到40%,那我们做到25%,可能我们的资金就会流失非常多对吧。所以那一年啊,整个市场上不停地在炒Smart Beta等等,那事后这个东西一直可能到21年的四季度了才发现这个东西可能是不可持续的。那也就正如我们如果在12、13年采用我们当时那种对冲方法,那在12、13、14年我们肯定都做不过同行,它就是暴露着小盘敞口在做的这种做法。但是我们如果去那样做,我们可能在14年公司成立的第一个月,我们就会死掉。所以这个也是我们、至少我们觉得量化这有两次比较大的洗牌,一次就是那一次,一次就是21年四季度。那这两次实际上我们都刚好赶上,然后我们都平安地过去,那这个东西也是取决于我们对一些东西它的真实风险和过去它有没有发生这个真实风险的一个判别。那有的企业它可能认为这段这种风险在过去这一段时间没有发生,那我可能就认为这个不是一种真实的风险。那比如说世界上很有名那个LSTM那家公司对吧。那它可能认为加了很高的杠杆等等,这些它的模型里面计算这个是一个很小风险的事,对吧?但这个事情如果从我们的角度看来我们就会认为这个它的核心风险是在的,只不过是因为我们在过去的这段数据中刚好没有,我们的观点会是这样。那这样的情况下,我们就不会去放大这种有可能会产生非常非常颠覆性错误的问题。所以这种情况至少保证我们在过去的这两次里面我们都还是比较幸运地活下来。
其实我一向觉得规模做太大也没有特别大的意义,特别是,怎么说呢,你的规模做到100亿和500亿,你的自己收入翻五倍,你如果到达一定程度以后,这个翻五倍对你的生活质量改变几乎是零,对吧。所以在这个情况下,至少我自己认为我们可能在100多一个亿这样的一个区间已经是让我很舒服的了。那这个时候我可能会愿意做一些在我自己喜欢的范围去提升它的收益,而没有必要去把它规模做的很大,因为规模做的很大无非就是再多赚一点钱嘛,但这个实际上没什么特别大的意义。
我们觉得客户和管理公司是一个共同成长的过程,那对双方来说都是我要什么,然后这个管理公司跟我提供的是不是我要的,所以我觉得是这样的一个过程。所以我们不会说,强行地说,让我们每个客户是不是都要接受我们,我们只是说那么这些客户那么多年陪我们走过来,哪些客户是喜欢我们这种风格的那他就会留下来。
我觉得是这样,因为我们做量化的人从来是不看beta的,虽然现在似乎看起来,这个情况如果有方式上的转变的话应该会好一些,但是我们从来是不看beta的,所以这个上面我们也不去进行评价。但是从我们自己做量化的角度而言,我讲一下我自己的一个感受。因为我刚才已经重复提到就是为什么20年那一波会整个出现一个Smart beta的行情,我是这样理解的,我认为当时是按存在一个资金流的问题,就是很多理财产品,它变成那个止化的,所以很多都会去买这种类似公募持仓的,因为银行很多钱可能都去委托给类似公募的人去管,那这样的票会涨很猛,涨很猛以后就有很多人会去跟风,跟风以后大家一起把它抬上去,然后这个时候大家一起有好处嘛,对吧。但在这样的过程中,先跑掉的人是落袋为安了,后跑掉的人就在里面被埋掉了,所以大概第一波我们看到是2020年1月份,已经持续到了2021年的2月份;然后第二波又出现一波新能源,就是2021年的4月份到10月份这波大概持续了6个月,然后到21年四季度这波大家都知道就会很惨了。然后今年大概又出现了,我们感觉是二季度也有一点这种感觉,但是我们看到的是第一次将近13个月,第二次6个月,第三次3个月。所以我们认为这个东西包括我们当时为什么不去跟这个风,因为我们看在之前的市场上这样一个持续的情况出现,是比较很难持续延期特别长时间,当时可能是有一些外生力量的原因,但是我们认为之后这种再继续出现类似的情况可能性不大,所以至少对于量化这个行业我认为在未来可能仍然会回到一个持续的就是在各种风格之间来回切。这个时候如果你真的要去靠smart beta赚钱,你必须能预测准每一波,但这个事情我认为是非常难的,但如果你有长长的一波你就预测它对了,一直赚钱这个是比较简单的事对吧。所以如果我们认为未来的不会出现这种长长的一波,哪个不管是风险因子或者行业或者什么持续的情况出现的话呢,我们认为它不停在震荡,那在这种情况下我觉得相对我们自己而言,我们是比较喜欢这种市场的就是它各种风格不停,因为我们刚才也说我们其实就不在风格上做长时间的暴露,所以我们觉得其实这个点上我们从21年年终以后,其实我们都认为这个可能会是一个比较持续过程。现在22年都快过完了,我们认为这个可能确实以后不会再出现这种长期的一个风格很长很长时间能赚钱的这个东西了。
(添加交易门工作人员微信可以获取与致诚卓远独家互动机会)
交易门视频故事上架B站、视频号、抖音、快手、小红书、西瓜视频和新浪微博啦!祝您观赏愉快!喜欢的话,欢迎一键三连哦!
微信扫码关注该文公众号作者