統計分析ソフトウエアR

Rをインストールする

統計ソフトRはhttp://r-project.org よりLinux版, (Mac) OS X版, Windows版それぞれのパッケージが提供されている. コマンドラインからRと入力することでフロントエンドが起動する.

インデックスに戻る


データの読み込み

read.table()

データの読み込み方法としてread.table関数を紹介する. データはスペース区切りのテキスト形式ファイルとして格納されているとする. 以降このファイルの名称はtopix.txtとする. 以下の表に示すように, 最初の列には5つのフィールド名称がそれぞれ記載されているとする. topix.txtは左から日次とTOPIXの始値, 高値, 安値, 終値が入っていると仮定する.

日付始値高値安値終値
2013年10月3日1174.591180.261171.451173.99
2013年10月2日1193.991199.881171.061175.16
2013年10月1日1198.181204.321193.311193.44
2013年9月30日1200.151205.161192.281194.1
2013年9月27日1220.771223.121214.691217.52
2013年9月26日1200.921220.491191.631220.49
2013年9月25日1212.911214.661207.671211.15
2013年9月24日1208.671217.91206.471214.87
2013年9月20日1219.371221.81215.291218.98
2013年9月19日1205.671215.481199.631215.48
2013年9月18日1188.951201.081186.051193.07
2013年9月17日1190.551192.351181.561181.64
2013年9月13日1179.261190.271174.511185.28
2013年9月12日1187.351188.691178.871184.36
2013年9月11日1199.031199.31186.471189.25
2013年9月10日1181.311192.161180.741190.22


data <- reat.table("topix.txt", header=T, sep=" ")

1列目の引数はデータ名称, 2番目の引数はテキスト・ファイルの最初の列がフィールド名称であることを意味している. 3番目の引数は区切り文字がスペースであることを示している.


head(data, 5)

と入力すると変数dataの5行目までが表示される.

日付始値高値安値終値
12013年10月3日1174.591180.261171.451173.99
22013年10月2日1193.991199.881171.061175.16
32013年10月1日1198.181204.321193.311193.44
42013年9月30日1200.151205.161192.281194.1
52013年9月27日1220.771223.121214.691217.52

インデックスに戻る


データをプロットする

plot()関数を用いることでデータをグラフとして表示することができる. TOPIXの始値をプロットしてみよう.


plot(data[,2],type="o", xlab="date", ylab="TOPIX")

以下の図のように表示される. xlabはX軸のラベルをylabはY軸のラベルを指定している.


データの表示例

インデックスに戻る


対数収益率の計算

ある時系列データx(t) (t=1,...,n) に対して階差系列y(t) = x(t+1) - x(t) (t=1,\ldots,n-1)を計算するにはdiff()関数を用いる. 先程のTOPIXの始値に対して階差系列を計算するには


y <- diff(data[,2])

とする. また, diff()関数を利用すると対数収益率は


r <- diff(log(data[,2]))

として計算される.

インデックスに戻る


標本平均

標本平均を計算するにはmean()関数を用いる.


mean(r)

と入力すると, いまの例では


[1] 0.0003803228

が得られる.

インデックスに戻る


パッケージのインストール

CRANで提供されている外部パッケージのインストールにはinstall.packages()関数を用いる. 例えば, 3次元の散布図を描くための scatterplot3d パッケージを新たにインストールする場合,


install.packages(“scatterplot3d”)

と入力する.

インデックスに戻る


パッケージの利用

CRANで提供されている外部パッケージをインストールした後, パッケージを利用する場合には, 必要とするパッケージのシステムへの読込みが必要となる. このパッケージの読込みのためには library()関数を用いる. 例えば, 上述のscatterplot3dパッケージをシステムへ読み込む場合,


library(scatterplot3d)

と入力する.

インデックスに戻る


別ファイルのソースコード読込み

別のファイルで定義されたソースコードを読み込みたい場合には, source()関数を用いる. 例えば, ファイル名test.R内で定義された関数を利用するためにこのファイルをシステムへ読み込む場合,


source(“test.R”)

と入力する. この関数を用いることにより, 複数のファイルに分割してプログラムを作成することができる.

インデックスに戻る


関数の定義

関数を定義する場合functionを用いる. 例えば, 引数xとyを持つf()という関数を定義したい場合,


f <- function(x,y){
    return
}

と入力する. 例えば, この関数f()では,


f(5,2)

と入力すると, 2つの数の積


[1] 10

が求められる.

インデックスに戻る


ドキュメント

R言語に関するより詳細な入門に関するドキュメントおよび基本関数についてのマニュアルはCRANからダウンロードすることができる. R言語のより詳しい使い方については, 例えば以下ドキュメントを参考にされたい.

R入門 https://cran.r-project.org/doc/contrib/manuals-jp/R-intro-170.jp.pdf

Rの基本関数マニュアル https://cran.r-project.org/doc/contrib/manuals-jp/Mase-Rstatman.pdf

インデックスに戻る





(C)2016 Takaki Hayashi and Aki-Hiro Sato. All rights reserved. 無断転用を禁ず