佐賀大学農学部 生物生産学科 動物生産学分野 和田研究室

統計パッケージR入門 I

統計パッケージとは

各種の統計手法やデータ処理技法が統一してまとめられたソフトウエア。 SASやS、SPSSなどが有名。最近のものは、利用者がプログラムして 新しい手法を追加できるようになっているものが多い。グラフや表も 作成できる。

Rの特徴

Rの起動と終了

Rの起動(Linux)
R (return)
Rの起動(Windows)
Rgui.exe
Rの終了
q() (return)

データの作成

Rでは変数やベクトル、配列やリストなどを簡単に作成することができる。 テキストファイルからデータを読み込むこともできる。
新しい変数を作る
pai <- 3.1415
新しいベクトルを作る
v <- c(1, 2, 3, 4, 5)
str <- c("a","b","c")
ファイルから読み込む
qdata <- read.table("qdata.txt")
読み込んだデータはデータフレームという形式で変数名、行ラベル(個体コードなど)とデータを一括して格納する。

read.table()で読み込むファイルの書式

1行目に変数名、2行目からデータを入力する。 2行目以降の最初の項目は行ラベル(個体コードなど)を入力する。 欠測値はNAを入力する。MS-Excelなどの表計算ソフトで作成して、 text形式でファイルに出力すると簡単。
           sei       BodyWeight    AgeAtFirstEggs  NumberOfEggs  
2000-01    male         100.5          NA              NA
2000-02    female       105.4          40.5            31.3
2000-03    male          98.9          NA              NA
2000-04    male         116.2          NA              NA
2000-05    female       120.2          52.5            48.4
2000-06    female       127.4          49.6            43.2
2000-07    female       112.6          45.6            39.0
2000-08    female       109.8          43.5            37.1
2000-09    male          97.1          NA              NA
2000-10    male         102.3          NA              NA

基本統計量の計算

平均
> mean(qdata$BodyWeight)
[1] 109.04
標準偏差
> sd(qdata$BodyWeight)
[1] 10.01745
相関係数
> cor( qdata$BodyWeight, qdata$AgeAtFirstEggs, use="pairwise.complete.obs")
[1] 0.8683118

散布図

> plot(qdata$NumberOfEggs, qdata$BodyWeight)

単回帰 (直線回帰)

NumberOfEggsに対するBodyWeightの単回帰直線を求めます。 式で示すと NumberOfEggs = (Coefficient)BodyWeight + (Intercept) となります。
> result <- lm( qdata$NumberOfEggs ? qdata$BodyWeight)
> summary(result)

Call:
lm(formula = qdata$NumberOfEggs ? qdata$BodyWeight)

Residuals:
      2       5       6       7       8 
-2.6602  5.5112 -4.0324  0.6961  0.4853 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)  
(Intercept)      -29.6256    28.0992  -1.054   0.3691  
qdata$BodyWeight   0.6033     0.2436   2.476   0.0896 .
---
Signif. codes:  0  `***'  0.001  `**'  0.01  `*'  0.05  `.'  0.1  ` '  1 

Residual standard error: 4.26 on 3 degrees of freedom
Multiple R-Squared: 0.6715,     Adjusted R-squared: 0.562 
F-statistic: 6.133 on 1 and 3 degrees of freedom,       p-value: 0.08955 


大学院生、編入学生、転学生、募集中!

最終更新年月日 2011年12月26日

佐賀大学農学部動物生産学研究室ywada@cc.saga-u.ac.jp