量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,曾荣获AMMA优秀品牌力、优秀洞察力大奖,连续4年被腾讯云+社区评选为“年度最佳作者”。
Elliot Rozner
这可能听起来很抽象。我们来举个例子:一小时是多少时间?这个问题几乎有无限的答案。你可以说一小时是60分钟,或者3600秒。你也可以说是一天的1/24,或者一周的1/168。但如果你不知道秒、分、日或周是什么呢?这个问题并不像听起来那么抽象。当我们还是婴儿或蹒跚学步的时候,我们都经历过这种情况。我们不知道一小时,一分钟,或者其他时间段是多少,那么我们是如何学习的呢?我们被告知可以再多睡5分钟,或者被告知我还没到目的地,但大约一个小时后就会到,或者得知奶奶这个周末不来了,但我们下周末会看到她。换句话说,既然我们不能通过比较其他时间框架来了解时间,我们就可以通过比较我们的经历来了解时间。时间的好处是,一旦我们理解了它的任何单位,我们就可以(理论上)理解任何其他单位。一小时实际上只有60分钟,而一天实际上只有24小时。我们使用相同的“时间尺”来测量所有这些时间框架。不幸的是,在投资中对信息进行比较有些困难。ABC的股票今天上涨了3美元。这几乎没有传达任何关于ABC移动的信息。首先,我们不知道ABC的上涨前的价格。ABC是1000美元的股票,3美元的变动幅度小于1%,还是10美分的股票,3美元的变动幅度小于3000%。XYZ股票今天上涨了3美元。我们对此有同样的问题,就像上次关于ABC股票的陈述一样。我们不知道XYZ的价格,所以我们不知道3美元变动的重要性。由于我们不知道ABC或XYZ的价格,我们不能比较XYZ和ABC的变动。缺乏可比性是无用信息的标志。我们将讨论如何构建交易信号以确保最大程度的信息,或最大程度的可比性。但由于交易信号有些抽象,让我们首先继续讨论价格走势,以及我们如何更有效地传达有关它们的信息。如何衡量价格变动?从最不可比性到最可比性
有几种方法可以衡量资产的价格变动,其中一些方法传达了很多信息,而另一些方法几乎没有传达任何信息。所传达的信息量与价格变动与其他价格变动的比较难易程度成正比。让我们逐一讨论这些方法。这是金融媒体通常采取的方法,正如我们前面提到的,它几乎没有传达有用的信息。除非我知道道琼斯指数的当前水平,否则我无法将其今天的走势与其他资产的走势进行比较。此外,我甚至无法将今天的走势与道琼斯指数前几天的走势进行比较,这可能发生在不同的价格水平上!我唯一能做的比较就是向下移动。我知道今天道琼斯指数的涨幅超过了其他下跌的资产,也超过了前几天道琼斯指数本身下跌时的涨幅。这传达了一些有用的信息。现在,我可以将道琼斯指数的走势与其他资产的走势或之前的道琼斯指数走势进行比较。然而,仍然存在可比性问题,这与波动性有关。一些资产每天经常变动几个百分点,而另一些资产的变动很少超过5到10个基点。在不了解道指波动率的情况下,我无法将其1%的波动率与其他具有不同波动率水平的资产进行比较,也无法将其与之前的波动率进行比较(因为波动率会随着时间而变化)。这种框架是我们不习惯的,但它实际上包含了比引用百分点更有用的信息。使用每日标准差使我们能够比较具有巨大不同波动性的资产的变动。例如,它允许我们比较比特币5%的波动和政府债券ETF0.25%的波动;如果我们将这些百分比变动转化为标准差,我们可能会发现债券ETF的变动比比特币的变动更重要!尽管如此,还是有一些可比性被遗漏了。我们现在可以比较不同价格和波动水平的资产的走势,但我们无法比较不同时间框架内发生的走势。我们不能将前一天发生的变动与上个月发生的变动进行比较。这是因为按日标准差计算,月波动自然会比按日波动大,所以用日标准差来引用每一次波动并不能告诉我们哪一次波动更显著。4、道琼斯指数今天的上升幅度等于其按日标准差计算的日平均绝对移动幅度这种对道指走势的分析对进行比较最有帮助。如果我知道日平均波动是向上或向下一个标准差,月平均波动是向上或向下4.5个标准差,我就可以比较不同价格、资产、波动水平和时间框架的波动。我可以将昨天道琼斯指数的走势与上个月的走势进行比较,或者将上个月比特币或牛期货的走势进行比较。这是因为所有这些价格变动都将以该时间段的平均标准偏差变动来表示。平均日移动值为1,平均月移动值为1。既然我们已经看到了表示价格变动的各种方法,让我们将讨论扩展到表示交易信号的方法。我们对交易信号的讨论将遵循我们对价格变动的讨论;我们将讨论四种构建量化交易信号的方法,从最低可比性到最高可比性。我们将使用一个简单的动量规则作为交易信号的例子。假设我们有一组10种资产,我们想做多动量最大的那一种。在这里,我们将动量定义为当前价格和200日移动平均线之间的距离。这意味着我们的信号将是“距离”的一个排名,从1到10。我们如何正确地测量距离?1、距离将由当前价格减去200天移动平均线(以美元计算)来定义这相当于以美元报价价格变动;它不允许我们区分高价格的资产和低价格的资产,所以它对我们来说是无用的。2、距离将由当前价格和200天移动平均线之间的百分比差来定义许多人在构建动量规则时使用这种方法,我们不会说它是无效的。但是,它没有区分高波动率资产和低波动率资产。例如,资产价格高于200天移动平均线10%的情况可能非常不稳定,高于或低于平均线10%的情况很典型。另一项资产可能比平均水平高出5%,这对该资产来说可能是一个很大的变动(经波动性调整后)!3、距离将由当前价格减去200天移动平均线,除以每日标准偏差来定义这种方法修正了波动性,所以现在得分最高的资产将是真正有最显著上涨的资产。如果我们只使用一个动量信号,即距离200日移动平均线的距离,这就很好了。假设我们想用多个信号的平均值。例如,我们可能还想测量距离50天移动平均线的距离,然后取我们两个测量值的平均值,并将平均值从1排到10(还有另一种方法;对两个信号进行排序,然后对组合的秩进行排序,但你可能不希望这样做)。问题是,当前价格离200天移动平均线的距离可能比离50天移动平均线的距离要远得多;只是有更多的时间让它移动!如果我们把这两个指标取平均值,平均值将严重偏向于较长的时间框架,即200天移动平均线。显然,如果我们想要平等地衡量这两个信号,我们需要对它们中的每一个进行一些调整,以便它们的平均值相似。4、使用3中的方法,然后将每个信号乘以一个标量以使其归一化。标量应该等于1除以原始信号的平均绝对值假设平均而言,资产的当前价格高于或低于其200日移动平均线10个每日标准差。这意味着使用上面的方法3,我将得到平均原始信号的值为10(或-10)。如果我用这个乘以标量,在这个例子中是1/10,得到1。还假设,平均而言,资产的当前价格高于或低于其50天移动平均线5个每日标准差。原始信号的平均值是5,标量是1/5,所以平均值是1。假设资产ABC比其200天移动平均线高出15个每日标准差,比其50天移动平均线高出3个每日标准差。我们把标量应用到这些度量上,15乘以(1/10):得到的总价值为1.5, 3乘以(1/5):得到的总价值为0.6。1.5和0.6的平均值是1.05,这是我们对资产ABC的动量得分。现在假设资产XYZ比200天移动平均线高出9个日标准差,比50天移动平均线高出7个日标准差。我们把标量应用到这些度量上。9乘以(1/10):得到的总价值为0.9,7乘以(1/5):得到的总价值为1.4。0.9和1.4的平均值是1.15,这就是我们对资产XYZ的动量得分。基于这些度量,资产XYZ动量更高。一旦我对所有的信号应用标量,它们的平均值都是1。然后我可以以任何我想要的方式组合它们。根据信号与平均信号的关系来呈现信号,可以在资产和时间框架之间实现最大的可比性。如何使用预测标量似乎是一个相当小众的话题。但关于信息的有用性及其与其他信息的可比性是交易信号最根本的假设。