これまで時系列分析の考え方について見ていきましたが、簡単にまとめると時系列分析に使う時系列データは、その時点で一度しか観測できないという問題点があります。
時系列分析の対象となる株価を例にあげると、日経平均株価の昨日の終値を一度だけ観測することはできますが
当然その終値の平均的な値、つまり期待値を一点の観測データから推定することはできません。
このため、将来の予測を行おうとする場合は、時系列データ自身になんらかの構造を仮定して、その構造を用いて予測を行う必要があります。
時系列分析では、観測された時系列データはある確率変数からの一つの実現値と仮定し、この確率変数の構造(確率分布)のことを時系列モデルと呼びます。
確率変数については↓の記事で説明してます
そして、様々な時系列モデルの根幹となる概念に、「定常性」というものがあります。「定常性」とは、その時系列データの確率分布は常に同じであり、時間や位置によってその確率分布が変化しないという確率過程の性質を表します。
さいころの例で表すと、さいころを振ったときの確率過程は1~6がそれぞれ常に1/6であり、振る時間や場所で目の出る確率が1と5がそれぞれ1/2になったり変わることはないということです。これを定常性と言います。
ですが、現実の時系列データにおいてサイコロのような、強い定常性を持つデータはなかなか存在せず、定常性がどれだけ確率分布が不変であるかによって、『弱定常性』と『強定常性』の2つに分類されます。
まず『弱定常性』とは、
その時系列データの確率分布の平均・分散が時点によらず一定であり、自己共分散も同じ時点差(差分)において常に一定であることを意味しています。
一方で『強定常性』は、
時系列データにおけるすべての依存構造が、時点に関係なく時間差のみに依存しているということを意味します。つまり、弱定常性が自己相関についてのみ時間差kに対して依存構造をもつのに対し、強定常性では平均や分散といった全ての確率構造が時間差kに依存するという性質を持っています。
まあ実際には、強定常性は仮定が必要なケースが少なく、加えて計量時系列分析の主戦場である金融データや株価データにおいては、弱定常性が必要なことが圧倒的に多く、この手の研究分野における定常性というのは弱定常性を指すことが一般的なようです。
なので、弱定常性は頭に叩き込んで、強定常性は参考程度の認識でいいと思います。そして、定常性は観測した時系列データにそのまま存在しているという事は少なく、大抵トレンドが含まれているので、データを変換して定常性を持たせるということをよく行います。
例えば、経済的データは季節による変動したりトレンドが存在しているので季節調整を行なったりトレンドによるデータの変動を対数変換や差分を取ることで、除去したりします。
次は時系列データにARモデルを当てはめてみます。
追記:時系列分析については、現場ですぐ使える時系列データ分析 という本がとても分かりやすかったので、もし時系列分析でつまずいている人は是非一度読んでみてください。