佐賀大学農学部 生物生産学科 動物生産学分野 和田研究室

最小自乗分散分析法

分散分析法とは、ある効果の分散とそのモデルの残差分散に ついて、分散比の検定(F検定)をして、その効果の分散が残差分散と 比較して有意に大きいものであるか どうかの判定を行う手法です。

重回帰分析の項でも述べたように、処理区のような質的変量であっても ダミー変数を用いることで線形モデルの中に組み込むことが可能である。 性や処理区のような質的変量を分散分析では主効果と呼び、連続変量を 回帰と呼ぶが、根本的には重回帰と同じ線形モデルである。また、主効果 間の積や主効果と回帰との積の効果を交互作用と呼ぶ。さらに、1つの 主効果に別の主効果が含まれる枝別れモデルも家畜育種においては よく使用される。

上記のような手法は旧来の分散分析法とは異なり、欠測値について特別 の扱いをする必要がなく、扱える効果の種類と数についての制限が大幅に 緩和されたことから、最小自乗分散分析法と呼ばれることもある。

ただし、重回帰分析の項でも述べたように線形モデルの選択には注意が 必要である。すなわち、実験的にあるいは生物学的に無意味な効果を 含めてはならないし、有意でない効果はモデルからはずし、有意な効果は モデルに含めなくてはならない。特に、交互作用については慎重に 検討する必要がある。

例題

ウズラの5系統の74世代から78世代までの受精率について、世代については 有意ではなく、系統についてのみ有意であるかどうかを、分散分析に よって確かめてみます。

まず、次のデータをExcelで作成し、「ファイルの種類」を「テキスト(タブ区切り)」にして anova1.txtとして保存します。

	Line	Generation	Fertilization
1	LL	74G	63.7 
2	LL	75G	65.0 
3	LL	76G	70.1 
4	LL	77G	66.5 
5	LL	78G	61.1 
6	LS	75G	66.7 
7	LS	76G	70.3 
8	LS	77G	61.3 
9	LS	78G	80.1 
10	RR	74G	91.1 
11	RR	75G	88.9 
12	RR	76G	81.4 
13	RR	77G	84.1 
14	RR	78G	87.7 
15	SL	74G	74.4 
16	SL	75G	83.7 
17	SL	76G	79.9 
18	SL	77G	75.0 
19	SL	78G	85.6 
20	SS	74G	76.3 
21	SS	75G	78.7 
22	SS	76G	77.5 
23	SS	77G	84.1 
24	SS	78G	75.3 

Rを起動してanova1.txtを読み込みます。

> data <- read.table("anova1.txt")

線形モデルの当てはめを行います。

> attach(data)
> result <- lm( Fertilization ? Line + Generation)

分散分析表を表示します。Lineは0.1%水準で有意で、Generationは 有意ではないことを確認してください。


> anova(result)
Analysis of Variance Table

Response: Fertilization
           Df  Sum Sq Mean Sq F value    Pr(>F)    
Line        4 1401.15  350.29 13.2016 8.342e-05 ***
Generation  4   43.27   10.82  0.4077    0.8003    
Residuals  15  398.01   26.53                      
---
Signif. codes:  0  `***'  0.001  `**'  0.01  `*'  0.05  `.'  0.1  ` '  1 
> 
系統(Line)は1%水準で有意で、世代(Generation)は5%水準で有意ではありませんでした。 この場合、有意でなかった世代の効果をはずしてもう一度、分散分析をして みましょう。
> result2 <- lm( Fertilization ? Line )
> anova(result2)
Analysis of Variance Table

Response: Fertilization
          Df  Sum Sq Mean Sq F value    Pr(>F)    
Line       4 1401.15  350.29  15.082 1.044e-05 ***
Residuals 19  441.28   23.23                      
---
Signif. codes:  0  `***'  0.001  `**'  0.01  `*'  0.05  `.'  0.1  ` '  1 
> 
残差の平均平方が小さくなったので、F値は大きくなりました。


最終更新年月日 2000年6月29日

ホームページ

ywada@cc.saga-u.ac.jp