佐賀大学農学部 応用生物科学科 動物資源開発学分野 和田研究室
佐賀大学農学部応用生物科学科 生物情報処理演習 講義テキスト 科目ホームページ
重回帰
説明変数の数を2つ以上にした回帰式を重回帰式と言います。説明変数は
通常は連続変数ですが、1つの連続変量を2乗、3乗としたり、2つの
連続変量の積(交互作用)であってもかまいません。また、処理区のような
離散変量を説明変数にしたい場合には、0と1とで表すダミー変数を使用します。
重回帰分析で大切なことはモデルの選択です。有意でない説明変数はモデルからはずさなければなりませんし、有意な説明変数はモデルに入れなければなりません。できるだけたくさんの説明変数から、有意でないものを1つずつモデルから外していく方法を変数減少法、逆に1つの説明変数から1つずつ有意な説明変数をモデルに入れていく方法を変数増加法と呼びます。
適当なモデルから説明変数の増減を繰り返して行く方法を変数増減法と呼びます。
また、t検定ではなくて、AIC(赤池の情報量規準)などの指標をもとにモデルを決めていく手法もあります。
- 重回帰モデル
- y = a +
b1x1 +
b2x2
+ ... + e
ここで、yは目的変数ベクトル、xiは説明変数ベクトル、
eは誤差ベクトル、aとbjはパラメータで、aは定数項、
bjは偏回帰係数
です。
注意事項
- 説明変数の数が増えると必然的に寄与率や重相関係数が大きくなります。説明変数の数が多くなりすぎる場合には、自由度調整済の寄与率やAICなどの指標を参考にしてください。
- 説明変数の間の相関が高い場合には注意が必要です。可能ならば、相関のある変量のうちで1つだけを説明変数とするか、それらの変量について主成分分析や因子分析をして代表となる変量を作成してください。
- 直線回帰と同様に寄与率が高いからといって因果関係があるとは限りません。
個々の変数間の散布図、相関係数を算出し、研究課題の内容から慎重に
因果関係を予測して仮説を立ててください。場合によっては、目的変数が
結果ではなくて原因である可能性もあります。
- 正規分布から大きくはずれる変量の場合には、何らかの変換が必要です。
質的変量が主体の場合には数量化分析のI類を用いてください。
例題
家畜改良センターから発表されている2000-I 乳用種雄牛評価成績
(精液供給可能牛)のデータを使用します。
ここを右クリックして「リンクを名前を付けて保存」
を選択してデータをダウンロードします。体型の評価値から乳量の評価値を
説明できるかどうか検討してみましょう。
Excelを起動して、sire001.csvを読み込みます。
「ツール」の「分析ツール」の「回帰分析」を選択します。
「入力Y範囲」に乳量(kg)のデータ範囲を、「入力X範囲」に体型の決定得点から
乳器までのデータ範囲を指定して、OKボタンをクリックすると、
別のシートに回帰分析の結果が表示されます。
この例では、寄与率R2は0.10と低く、分散分析の結果も5%水準でも
有意ではありません。
t検定の結果を見ても4番目の体型形質だけが1%水準で有意となっており、
体型形質の評価値から乳量の評価値を説明することは困難であることが
わかります。
大学院生、編入学生、転学生、募集中!
最終更新年月日 2008年10月1日
佐賀大学農学部 応用生物科学科 動物資源開発学分野 和田研究室
ywada@cc.saga-u.ac.jp