许多预测模型都要求时间序列具有一定的一致性,即“平稳性”。平常的转换,即整数阶差分(譬如,在金融学中表现为建模收益而不是绝对价格),消除了数据中的记忆,从而影响了建模的预测能力。
本文概述了分数微积分如何保留更多的信息,以及如何更好地在平稳性和有意义的记忆之间做出权衡。
一般而言,我们会把一个给定的时间序列理解为一个随机过程产生的样本,并试图推断出其分布及统计数据以建立一个预测模型。
建立随机过程的预测模型是为了平衡样本的特殊性和一般性:该模型根据一般模式的背景对给定的序列做出解释。
Mike Novogratz:现货比特币ETF可能还需要6个月的时间:金色财经报道,Galaxy Digital首席执行官Mike Novogratz援引贝莱德 (BlackRock) 和景顺 (Invesco) 的消息人士称,比特币交易所交易基金 (ETF) 可能会在2024年2月之前的某个时间获得批准。
Novogratz表示,这是一件非常非常大的事情。这是一件大事,因为我们与景顺方面和贝莱德方面的接触都让你认为这是一个何时的问题,而不是是否的问题,外部窗口可能是六个月,Novogratz在8月份的股东大会上告诉股东,第二季度财报电话会议报告净亏损 4600 万美元。[2023/8/9 21:33:29]
比一般预测回归更具体的是,由于时间结构的原因,时间序列一般具有其固有顺序。任何给定的实例都反映了其发展变化情况,即过去跟踪记录的特定记忆。
数据:比特币交易确认时间在一个月之内下降97%:Blockchain.com数据显示,过去一个月,确认比特币交易所需的平均时间大幅下降。这一指标在5月16日达到了年度高点,约340分钟,现在,交易平均时间降至7.88分钟,下降了97.68%。此外,比特币交易费也在2020年减半后达到年内高点后继续下降。(Cryptopotato)[2020/6/15]
平稳性
为了确定生成过程的一般模式并映射给定的排列,在实际建模之前我们通常将此特定序列的记忆作为预处理步骤的一部分予以删除。
在机器学习领域的监督学习中,该序列可以发现一般性结构并对给定的实例与标记训练集中更多的样本进行匹配。
Kraken业务开发总监:比特币网络的正常运行时间达到99.985%:Kraken业务开发总监Dan Held表示,比特币网络的正常运行时间为99.985%,已经超过了亚马逊、谷歌和Facebook。接下来除非遇到大型网络脱机,否则仅需再花费2,887,353分钟即可达到99.99%。(Decrypt)[2020/5/20]
在数学领域,过程的统计特性不会因时间顺序的改变而变化,这意味着系列不会随时间推移而呈现出一种趋势。该概念被称为平稳性。
检查时间序列平稳性的方法有很多种:
观察线形图,寻找一段时间内的明显的趋势。比较数列中各种分割的基本汇总统计数据。观察自相关图:曲线下降越快,滞后越明显,序列的非平稳性阶数越小。最常见的平稳性统计检验是单位根的ADF检验。
The Block研究总监:减半至当前的短时间内,出块速度实际上在提高:The Block研究总监Larry Cermak发推称:“有趣的事情发生了。虽然时间范围很短,且样本数量相当小,但是比特币网络出块的时间间隔实际上在减少,这意味着出块速度比减半之前更快。最近三个区块的平均出块时间还不到7分钟。如果这种趋势持续下去(显然大概率不会),这可能意味着算力不仅不会下降,目前看来还将继续增长。”
注:BTC.com数据显示,最近十个区块(630058-630067)的出块总时长仅为49分钟。[2020/5/12]
单位根是指初始条件或外部冲击不会随着时间的推移而消散,而是通过该序列传播,并通知所有后续值。该含义从直观上正式地解决了在单位圆上的过程特征方程。
对于给定的置信水平,ADF测试零假设“序列中存在单位根”以及序列稳定性的替代。它直接证明了,单位根的存在确实意味着该序列的不稳定。
声音 | 欧洲央行执委默施:就央行数字货币做出决定还需要一段很长的时间:欧洲央行执委默施:就央行数字货币做出决定还需要一段很长的时间。(金十数据)[2020/1/14]
分数阶微积分
事实上,在17世纪牛顿和莱布尼茨发明微积分后不久,数学家们就对分数阶导数的使用进行了探索,将微分或积分的顺序从自然数扩展到实数。然而,其应采纳赫斯特和曼德尔布罗特在20世纪的成果,为分数微积分找到初期的自然应用,并使其与霍斯金和格兰杰于20世纪80年代创建的Arfima模型一同进入金融领域。
大约在1730年,欧拉就该归纳给出有史以来第一个启发式,通过函数将二项式系数推广到实数阶。后来,在黎曼和刘维尔的积分理论中,重复微分的柯西公式使之变得更加严谨。
这里,我们仅仅给出了时间序列差分应用程序的形式启发式:
B表示滞后操作符,即对于t>1,BX_t=X_{t-1}和某个时间序列X={X_1,...}。一阶元素阶差分可以用恒等算子I表示,如下:
金融时间序列建模的应用
在金融领域,时间序列起主导作用。为了更好地理解分数阶差分的特征,我们将其应用于一些典型的金融时间序列。
利用以下代码,将差分算子的上述形式序列的展开式应用到指定实阶d和固定窗口大小的时间序列上,得到变换后的序列,然后只需将一个pandas时间序列输入参数阶和lag_cutoff的ts_difference函数中即可。
2016-2018年比特币的价格(红色,右轴),以及部分衍生品(蓝色阴影)
正如你可能已注意到的,比特币的价格在2017年和2018年经历了一次明显的炒作。实际上,看看一阶差分,我们发现价格在某些日期上涨了2500美元以上。上图展示了一些分数阶差分的平滑函数插值。这似乎很奇怪,在如此强劲的趋势下,约0.4的弱差分实际上竟足以使该序列呈平稳型:给定样本的ADF统计量为-5,其已低于DFt-分布的临界值-2.86,因此在置信度为95%下,该序列可以假定是平稳的。的确,随着财富的来回变动,它很快就变得吝啬起来。
低阶差分足以满足平稳性的结论与其他许多金融时间序列相似。
为了说明平稳性和记忆之间的权衡,我们可以进行适当的可视化,并将ADF测试统计数据以及与原始序列的相关性绘制成具有不同阶差变换的序列。。
对于商品期货、汇率、指数等各种典型的金融序列,这种对比清晰地表明了差阶满足金融建模的平稳性条件,同时保留了特定的记忆结构,从而保持了原始序列的统计动态。
ADF检验统计量(左轴,红色曲线)和线性相关(右轴,矢状花蓝色曲线)与原序列进行各种分数阶差分,应用于各种金融时间序列。石板灰中的常数线表示ADF检验的显著性水平为95%。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。