株初心者が本気で儲けるブログ

株式投資・仮想通貨に関連するテーマについて取り扱ってます。

【R言語】 時系列データの基本的な分析 その1

 

 

 

今回は時系列データ分析の基本として、まず入手したデータを時系列でプロットしていきます。使用するデータはバンダイナムコゲームスの2005年から2016年までの株価データです。

 

ここで改めて、なぜ時系列解析をするのかというとことを説明すると、要は「時間とともに変化しているデータ(ここでは株価データ)があって、もしそれが何らかの性質・特徴を持っているならば、それを何かしらの形で定式化できるはず」という前提があるからです。

 

そして、異なる時系列同士で時間と共に変化していく相関・因果関係などを導き出し、それらの時系列モデルに基づいて様々な経済学的・ビジネス的な仮説や理論を検証するというのが目的だからです。まあこれがちゃんとできれば、大金持ちなはずなのですが、ところがどっこい現実はそう甘くありません。

 

まあデータ分スキルはこれからさらに重要になっていくので、身に着けておいて絶対に損はないスキルです。余談はさておき、株価データの具体的な取得方法は下の記事に書いてます。

 

www.dmjtmj-stock.com

 

 

そして、取得したデータをbamnamのオブジェクトに放りこむとこんな感じです。

 

f:id:oruka199665:20161229214233j:plain

 

次にデータの種類を確認してみます。

> class(bamnam)
[1] "xts" "zoo"

 

 

quantmodでデータを取得すると、すでに時系列データなので問題ないのですが、サイトから株価データをエクセル形式で取得してRに読み込ませるとデータフレームになっているので、もしそういう場合はxts形式の時系列データに変換するのがオススメです。

 

下の記事でデータフレームの時系列データへの変換とデータの整理方法を紹介しています。

 

 

www.dmjtmj-stock.com

 

さて下準備が終わったところで本題の時系列分析に入っていきます。

 

まずxtsパッケージを読み込みます。

 

>library(xts)

 

 

そしてplot()で作画します。

 

> plot(bamnam[,4],main="bannam",cex.main=0.8)

 

f:id:oruka199665:20161229224048j:plain

 

集めたデータを統計解析の前にまずグラフでぱっと見ておくのは何気に結構大切なプロセスです。時系列分析に限らず、グラフ解析ではまず異常値がないかを確認が大切です。

 

それの値がなんらかの原因による正常なものであれば問題ないのですが、入力ミスだったりした場合は、その値のせいで分析結果が大きく変わってしまうこともあるので注意です。

 

そして分析するデータの基本的な特徴をあらわしている、基本統計量をsummary()で算出します。

 

> summary(bamnam)

 

 

f:id:oruka199665:20161229230422j:plain

 

基本統計量とは、データ全体を分析して、特徴・性質を把握する手法です。つまり、膨大なデータの全体を一旦俯瞰し、その大まかな形を掴むために必要不可欠な解析手法です。(詳しくは↓を参照)

 

 

www.dmjtmj-stock.com

 

次は株価の変化率を算出していきます。

 

www.dmjtmj-stock.com