如何利用金融市场的自相关

2021-04-17 20:25:12

术语自相关术语用于指同一时间序列之间观察之间的相关性。基本上,自相关时间序列是与本身的滞后版本相关的。

这对于发现数据集中的周期性趋势非常重要。它有助于我们确定我们是否可以预测重复的底层模式,并在此之上增加我们的剩余变化。这可以显着帮助我们建立我们的预测,因为它提供了任何时间序列分析的构建块 - >趋势。

自相关是我们数据的摘要统计信息。为了定义它,我们必须讨论其本身的组件,也概述统计数据。

变量x的期望是该变量的平均值,表示为e(x)或希腊符号mu。

变量的方差是数据传播的量度,特别是与平均平方的偏差的期望表示为var(x)= e [(x-mu)^ 2]。

标准偏差是数据传播的另一个和更常见的度量,因为其单位与数据本身相同。它由希腊字母Sigma表示,并计算为方差的平方根。

协方差告诉我们两个变量在一起的变化,或“共同变化”。这是了解两个变量相关的有用措施,并使用以下公式计算 - > sigma(x,y)= e [(x-mu_x)(y-mu_y)]。

我们的协方差措施的问题类似于方差的问题,因为该度量标准没有给我们任何可比信息。作为一个例子,如果您参加前一年的GBPUSD和GBPCHF的价格,绘制下面并计算他们的协方差,我们得到了0.000382的数字。这并没有告诉我们太多,价值没有限制,我们可以推断的只是这两个变量一起移动,因为我们的协方差大于0。

输入相关性,通过将我们的两个标准偏差的产品分开来标准使用我们的协方差。这可确保我们的数字现在具有-1的最小值,最大值+1,这使我们更容易比较值。 GBPUSD和GBPCHF之间过去一年之间的相关性为0.7514,这对图表给出了更有意义。

自相关需要一个参数,延迟k,我们原始时间序列的时间次数转移以创建新的步骤。然后,我们使用刚刚描述的相同方法计算这两个时间序列之间的相关性,返回一个图,如前所述,在[-1,1]的范围内。

在Python中,我们使用StatsSmodels包来运行自相关计算和可视化,缩写为ACF图。我们可以将参数滞后传递给Plot_acf()方法,该方法设置我们希望计算自相关的MAX LAG。下面的代码显示了此实现。

阴影的蓝色图显示了5%的重要性边界。如果我们观察到这个值之外的相关性,这表明我们有足够的证据表明我们的数据集中的显着自相关。

从自相关的推断并不像找到具有最高相关数的滞后值一样简单。当我们分析ACF图表时,我们应该注意一些概念。

每个遗失包含在我们计算中使用的相同数据集,因此如果我们有一个滞后(除了0之外,因为这将永远是1),那么在我们的边界之外具有显着相关的相关性,我们希望随后的值遵循西装和显示高相关。对于我们作为分析师来说,这不是一个理想的情况,当你看看下面的GBPUSD ACF Plot时变得明显。我们在每次期间之间采取了近2年的增量变化历史,结果是我们的腿都非常接近1.我将在下周的随机步行车型中更详细地进入这一点,在我将提供公式,以准确地解释这种现象是如何产生的。

我们看到的那种图表在构建预测的方面并没有向我们提供大量方向,而是因为我们无法将任何自相关绑定到外部变量。当我们看到为某些滞后显示高相关的时间序列时,我们需要能够理解为什么这些滞后从逻辑的角度出现。如果我们无法解释相关性背后的原因,那么我们就没有一个复杂的模型,我们可以构建,因为在这种情况下我们正在做的是使用过去的数据来尝试和预测未来的数据,而无需任何额外的智能。

例如,拍摄下面可视化的数据集,该数据集每年衡量3世纪超过3世纪的太阳黑子数量(1700 - 2008)。大约每11年,磁场的太阳翻转和北极基本上切换地。在每个周期的开始时,太阳有太阳黑子数量最低,同时它具有最高的。这已成为识别通过其太阳循环的距离实际上是多远的措施。

我正在尝试通过这个例子提出的重点是我们在这里有一个外部原因。当我们查看自相关图表时,我们在LAG 10和11然后21和22中看到了显着的正相关。像我们在这里看到的图表对分析师更有利于,因为我们有一个潜在的理由为什么特定的滞后拒绝为什么我们的初步假设。

自相关并不总是保证为您提供有助于您创建模型的见解。然而,检查您的时间序列是否在重复过去行为的任何时间点,因为更深入的研究可以揭示您可以使用的经济活动期间更深入的研究,以便将来用于将来分析和预测。

本文的灵感来自Michael Halls Moore在串行相关性上由高级算法交易第8章的信息。