はじめに
色々と発展的な時系列系の分析手法に手を付けようとすると、基本的な時系列分析についての知識が抜け抜けだったので、初心に帰って沖田先生の本に目を通しました。
いつも通り簡単にまとめたいと思います。
経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)
- 作者:竜義, 沖本
- 発売日: 2010/02/01
- メディア: 単行本
時系列分析の基礎
自己共分散
時点1からまでに観測された時系列データをを表現する。 異なる時点同士の共分散を次にように表現され、一次の自己共分散と呼ばれる。
ここで、である。
一次の自己共分散が正であれば、1時点離れたデータは期待値を基準にして同じ方向に動く傾向にあり、負であれば1時点離れたデータは期待値を基準にして異なる方向に動く傾向にある。
一般化した2次以降の自己共分散は、k次の自己共分散と呼ばれ次のように表現される。
ここで、である。
自己相関係数
自己共分散を基準化したものを自己相関係数と呼び、k次の自己相関係数は次のように定義される。
自己相関係数をの関数としてみたものは自己相関関数と呼ぶ。
自己相関性の検定
自己相関性の検定はかばん検定と呼ばれる検定を用いて確認する。
検定を行うために、標本期待値、標本自己共分散、標本自己相関係数と呼ばれる標本の統計量を推定する。
- 標本期待値
- 標本自己共分散
- 標本自己相関係数
検定では、標本自己相関係数を用いて、という帰無仮説をという対立仮説を用いる。
この時、帰無仮説の下でのの漸近分布を求める必要がある。
複数の自己相関係数が全て0であるかどうかの検定を考える場合もある。
定常性
同時分布や基本統計量の時間不変性に関するものである。
弱定常性
任意のとに対して以下が成立する時、弱定常過程である。
つまり、弱定常性は過程の期待値と自己共分散が時間を通じて一定であることを意味する。
自己共分散は、時点には依存せず時間差のみに依存することになる。
よって、任意のに対してが成立する。
この時の、自己相関は次にように定義される。
強定常性
強定常性は、任意のとに対して、[tex:(y_t, y{t+1}, \dots y{t+k} )']の同時分布が同一となることを意味する。
強定常性は非常に強い仮定であり、一般的に定常性があるという場合は弱定常性であるという意味である
ホワイトノイズ
全てのに対して以下が成立する時、ホワイトノイズと呼ぶ。
正規過程に従うホワイトノイズは正規ホワイトノイズに従うという。
ホワイトノイズは弱定常過程であり、i.i.d系列である。
ARMA過程
MA過程
1次MA過程
移動平均過程(Moving avarage process)は、ホワイトノイズを拡張したものであり、1次MA過程は次にように定期される。
MA過程の確率変装は全てホワイトノイズによって決まる。
また、の時の定義は次にようになる。
とのモデルがという共通項を持つので、とで相関が生じるため、MA(1)モデルは1次自己相関をもつ。
MA(1)の期待値は、分散は次のようになる。
MA(1)の一次自己相関は、次のようになる。
自己相関の絶対値がの時に、最大値を取ることに注意する。
二次自己共分散は、次のようになる。
q次MA過程
q次MA過程 は次にように定義される。
現在とq期間の過去のホワイトノイズの線形和に定数を加えたものである。
の期待値と分散などについては次のような性質を持つ。
(1)
(2)
(3)
(4) MA過程は常に定常である
(5)
(5)からMA(q)はq+1次以降の自己相関は0であり、長期にわたる関係をモデル化するには多くのパラメータが必要である
Rで確認
MA(3)の時系列をシミュレートしてみる。
係数は全て1としている
library(tidyverse) library(forecast) library(tseries) library(ggfortify) ma_sim <- arima.sim(n=500, # ステップ数 list(ma=c(1,1,1)), # MA過程の係数 sd=3) # ノイズの標準偏差 ggtsdisplay(ma_sim)
ラグが3時点までの自己相関(ACF)が約0.2以上となっていることが確認できる。
AR過程
1次AR過程
自己回帰過程(autoregressive process)は、過程が自身の過去に回帰された形で表現される過程である。 1次AR過程は次にように定義される。
式からとが相関を持つのは明らかである。
< 1 の時に過程は定常となる。一方での時に爆発的な変化を見せる。
AR(1)の期待値は、分散は次のようになる。
AR(1)のk次自己共分散は、次のようになる。
これの両辺をで割るとユール・ウォーカー方程式と呼ばれる関係が得られる。
AR過程の自己相関が, が従うAR過程と同一の係数を持つ差分方程式に従うことを示すものである。
ユール・ウォーカー方程式と を用いて、AR過程の自己相関は逐次的に求めることができる。
AR(1)過程の場合の一般的に自己相関は次のようになる。
AR(1)過程の自己相関の絶対値は指数的に減衰していく。
q次AR過程
q次AR過程 は次にように定義される。
過程は常に定常になるとは限らない。
過程の性質は次のようになる。
(1)
(2)
(3) 自己共分散と自己相関は[y_t]が従うAR過程と同一の係数を持つ以下のp次差分方程式に従う。
これは、次のような特性方程式と呼ばれる表現も可能である。
(4) AR過程の自己相関は指数的に減衰する
Rで確認
AR(2)の時系列をシミュレートしてみる。
係数は(0.5,0.4)と設定している。
ar_sim <- arima.sim(n=500, list(ar=c(0.5,0.4)), # AR過程の係数 sd=3) ggtsdisplay(ar_sim)
ラグが2時点までの偏自己相関(PACF)が約0.4以上となっていることや、自己相関が指数的に減衰していることが確認できる。
ARMA過程
自己回帰移動平均過程(Autoregressive moving average process)は自己回帰項と移動平均項の両方を含んだ過程である。
ARMA過程ARMA(p,q)過程は次にように定義される。
AR過程とMA過程の両方の性質を持つことになるが、強い方がARMA過程の性質が残ることになる。
過程の性質は次のようになる。
(1)
(2) 次以降の自己共分散と自己相関は、[y_t]が従うARMA過程のAR部分と同一の係数を持つ以下のp次差分方程式に従う。
(3) ARMA過程の自己相関は指数的に減衰する
Rで確認
ARMA(3,3)の時系列をシミュレートする。
ARの係数は全て1、MAの係数は全て0.2とした。
arma_sim <- arima.sim(n=500, #出力数 list(order=c(3,0,3), # ARIMA(p,d,q) ma=c(1,1,1), # MA過程の係数 ar=c(0.2,0.2,0.2)), # AR過程の係数 sd=3) #ノイズの標準偏差 ggtsdisplay(arma_sim)
ARMA過程の定常性と反転可能性
AR過程の定常性
AR過程が定常である条件は、特性方程式の解の絶対値が全て1以上である時である。
AR(1)過程の時、解はであることから定常条件は < 1 である。
また、定常AR過程はMA(∞)過程に書き直すことができることから、あるAR過程がMA過程に書き直すことができれば、そのAR過程は定常であると言える。
MA過程の反転可能性
MA過程は定常であることが保証されるが、同一の期待値と自己相関の値が複数存在する。
この時、どのモデルを用いれば良いかの助けになるのが、MA過程の反転可能性である。
MA過程の反転可能性とは、MA過程がAR(∞)過程に書き直せることを意味する。
MA(q)過程の判定可能性は、AR過程の定常条件と同様のものであり、次のMA特性方程式を用いて表現できることである。
これは、MA特性方程式の全ての解の絶対値が1より大きい時にMA過程は反転可能性であることを意味する。
ARMA過程の定常性と反転可能性
ARMA過程のMA過程部分は定常であるため、AR過程部分だけが定常であれば全体は定常となる。
AR過程部分をMA(∞)過程に変換することができれば定常であると言えるため、AR過程部分の特定方程式を考えて、全ての解の絶対値が1より大きければ良い。
また、ARMA過程の反転可能性もMA過程部分の特性方程式の全ての解の絶対値が1より大きければ良いと言える。
VARモデル
VARモデルについてはこちら。