重回帰分析の項でも述べたように、処理区のような質的変量であっても ダミー変数を用いることで線形モデルの中に組み込むことが可能である。 性や処理区のような質的変量を分散分析では主効果と呼び、連続変量を 回帰と呼ぶが、根本的には重回帰と同じ線形モデルである。また、主効果 間の積や主効果と回帰との積の効果を交互作用と呼ぶ。さらに、1つの 主効果に別の主効果が含まれる枝別れモデルも家畜育種においては よく使用される。
上記のような手法は旧来の分散分析法とは異なり、欠測値について特別 の扱いをする必要がなく、扱える効果の種類と数についての制限が大幅に 緩和されたことから、最小自乗分散分析法と呼ばれることもある。
ただし、重回帰分析の項でも述べたように線形モデルの選択には注意が 必要である。すなわち、実験的にあるいは生物学的に無意味な効果を 含めてはならないし、有意でない効果はモデルからはずし、有意な効果は モデルに含めなくてはならない。特に、交互作用については慎重に 検討する必要がある。
まず、次のデータをExcelで作成し、「ファイルの種類」を「テキスト(タブ区切り)」にして anova1.txtとして保存します。
Line Generation Fertilization 1 LL 74G 63.7 2 LL 75G 65.0 3 LL 76G 70.1 4 LL 77G 66.5 5 LL 78G 61.1 6 LS 75G 66.7 7 LS 76G 70.3 8 LS 77G 61.3 9 LS 78G 80.1 10 RR 74G 91.1 11 RR 75G 88.9 12 RR 76G 81.4 13 RR 77G 84.1 14 RR 78G 87.7 15 SL 74G 74.4 16 SL 75G 83.7 17 SL 76G 79.9 18 SL 77G 75.0 19 SL 78G 85.6 20 SS 74G 76.3 21 SS 75G 78.7 22 SS 76G 77.5 23 SS 77G 84.1 24 SS 78G 75.3
Rを起動してanova1.txtを読み込みます。
> data <- read.table("anova1.txt")
線形モデルの当てはめを行います。
> attach(data) > result <- lm( Fertilization ? Line + Generation)
分散分析表を表示します。Lineは0.1%水準で有意で、Generationは 有意ではないことを確認してください。
> anova(result) Analysis of Variance Table Response: Fertilization Df Sum Sq Mean Sq F value Pr(>F) Line 4 1401.15 350.29 13.2016 8.342e-05 *** Generation 4 43.27 10.82 0.4077 0.8003 Residuals 15 398.01 26.53 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 >系統(Line)は1%水準で有意で、世代(Generation)は5%水準で有意ではありませんでした。 この場合、有意でなかった世代の効果をはずしてもう一度、分散分析をして みましょう。
> result2 <- lm( Fertilization ? Line ) > anova(result2) Analysis of Variance Table Response: Fertilization Df Sum Sq Mean Sq F value Pr(>F) Line 4 1401.15 350.29 15.082 1.044e-05 *** Residuals 19 441.28 23.23 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 >残差の平均平方が小さくなったので、F値は大きくなりました。
最終更新年月日 2000年6月29日