0%

时间序列突变点检测

前言

1973年著名的法国数学家勒内.汤姆(ReneThom)在《结构稳定性和形态发生学》一书中系统的提出突变理论(Catastrophe Theory),并将系统内部从一种稳定状态突然跳跃到另一种稳定状态称为突变。汤姆认为数学微分方程可以很好的解释自然界光滑而连续变化的现象,但自然界中还存在大量不连续的突然变化的现象,比如极端的气候(骤旱/暴雨)、DNA的突变、生物种群的消长与生灭、人情绪的波动等等,都包含突变在内的复杂的过程,而这些过程恰恰是微分方程描述过程中遇到的瓶颈。突变理论正是在这种背景下产生的,旨在研究系统临界状态下的性质和状态

时间序列是对系统行为随时间变化的描述,系统的行为会由于内外部因素共同作用而随着时间改变,突变点检测就是在时间序列中找到突变位置,常常应用在序列分割、边缘检测和异常检测等领域。此外,在气候突变检测中,也常常需要对气候数据进行突变检测,常用的突变检测方法有滑动t-检验、Pettitt突变检验、Mann kendell突变点检验、Bernaola Galvan分割算法、Bayes突变点检验、秩和检验、Brown-Forsythe检验、R、里海哈林法、有序聚类等几十种方法。

二、不同检验方法的基本原理

汤姆指出动力学系统主要存在七种突变类型

(一) 里海哈林法(Lee-Heghinan)

对水文序列,在假定总体服从正态分布,分割点先验分布为均匀分布的情况下,推得可能分割点的后验条件概率密度函数为:

式中:取为比例系数;n为序列长度。由后验条件概率密度函数计算得到的最大值对应的,则最可能分割点。

(二) 有序聚类法

由有序聚类推求最可能干扰点,实质是计算最优的分割点,使同列之间离差平方和最小,而类与类之间离差平方和较大。设序列(t=1,2,...,n),可能分割点为,满足条件的,即为最可能变异点

(三) 最优信息二分割法

以灰色差异信息理论为基础,建立差异信息相对测度体系和最优信息二分割模型。采用不同分割方法,计算分割点前后序列的差异信息测度,对应分割点前后差异测度之差最小的点,认为是最可能变异的点。

(四) R/S检验法

R/S检验法是基于R/S分析的一种检验方法,在大量实证研究基础上提出的一种时间序列统计方法。考虑一个时间序列,对于任意正整数, 有, 通过点绘的关系曲线,计算分割点T前后曲线斜率的差异,并取斜率绝对值最大的点作为最可能变异点

(五) Brown-Forsythe检验法

通过构造统计量, 使其服从自由度为的F分布,m为分组数。在给定显著性水平下,若有则认为不同组间水平差异明显,通过个点对原始序列进行动态分割,可以得到一个具有m个子序列的序列分析结果,将m个子序列看作方差分析中的m组样本,即可计算一个F值,其中最大值就是m-1个可能变异点的位置。

(六) 滑动F检验法

滑动F检验法时针对传统F检验法只能对变异点进行检验二不能自动搜索变异点的特点提出的。设分别代表变异点前后两个样本序列,则服从自由度为的F分布。在置信水平为下,当时,则认为两序列无显著差异,该序列不存在突变点;当时,则认为两序列差异显著,该序列在t点存在突变点,然后逐渐滑动T,使F统计量达到最大值的点即为所求的变异点

(七) 滑动T检验法

滑动检验与滑动检验类似,假设变异点T前后两序列总体的分布函数各为,从总体中分别抽取容量为的两个样本,构造T统计量为:

式中:为样本均值和方差。T统计量服从。在置信度为的情况下,当时,即说明其存在显著性差异;当时,接受原假设。对于满足所有可能的点,选择使T统计量达到最大值的那个点,作为所求的最可能变异点

(八) 滑动秩和检验法

设分割点前后两序列总体的分布函数分别为:,从总体中分别抽取容量为的两个样本,要求检验原假设。将两个样本数据依大小次序排列并统一编号,规定每个数据在排列中所对应的叙述称为该数的秩,对于相同的数值,则用它序数的平均值为秩。记容量小的样本各数值得秩之和为W,秩和检验就是根据统计量W做检验。滑动秩和检验法利用秩和检验法对序列进行逐点检验,找出满足所有可能得点T,选择U统计量计算值达到最大值得点,作为所求得最可能变异点

(九) Mann-Kendall检验法

Mann-kendall检验(简称MK检验)是世界气象组织推荐的一种非参数检验方法,并已广泛地用来分析降水、径流和气温要素时间序列的趋势或跳跃变化。定义统计量为: 其中: 式中: 通过分析统计序列可以进一步分析序列X的趋势变化,而且可以明确突变的时间,指出突变的区域。如果这两条曲线出现焦点,且交点在临界直线之间,那么交点对应的时刻就是突变点。

(十) Bayesian方法

通过建立时间序列突变点分析的贝叶斯模型,根据观测资料通过蒙特卡洛马尔可夫链随机抽样的方法来估计变点位置的后验概率分布,对应最大后验概率的位置被认为是发生突变点的最可能的位置。

(十一) B-G分割算法

B-G分割算法是一种适合非平稳、非线性时间序列突变检测的方法,最初由Bernaola-Galvan等人与2001年提出,与传统的突变检测方法(如Mann-Kendell突变点检测、Pettite检验、Bayesian法等)相比,具有将非平稳时间序列分割成不同均值的多个平稳子序列,是一种有效的突变检测的新方法。

10种突变检验方法对不同变异情况的检验性能