分散分析で標準偏回帰係数を求める

複数の独立変数と1つの従属変数からなる重回帰分析を想定しよう。もし、独立変数間が直交しており、相関がゼロであるとするならば、重回帰分析における標準偏回帰係数は、各独立変数と従属変数との相関係数と等しくなる。そして、各独立変数が、従属変数の分散のどれだけを説明しているかについては、相関係数の二乗すなわち偏回帰係数の二乗と等しくなる。

この場合、偏回帰係数は、おのおのの独立変数が、ほかの独立変数と比べて、相対的にどれだけウエイトが高いかを把握する指標となる。例えば、Yという従属変数が、A、B、Cという三つの要因によってもたらされる場合、そしてこの3つの変数はお互いに独立して生起するような場合、重回帰分析によって求められる偏回帰係数が、この3つの相対的な重要度を示すことになるわけだ。

さて、上記のように、相互に直交している重回帰分析の独立変数群が、0か1というようなダミー変数であったり、分類変数であったりする場合には、分散分析によって、重回帰分析の偏回帰係数と同様の値を求めることができる。それは、先ほど説明した逆の手順を踏めばいい。すなわち、各変数あるいは因子が、従属変数の分散のどれだけを説明しているかを計算したのち、その値の平方根をとればいいということである。

各因子が従属変数を説明する度合いをエータ(η)二乗と通常言うが、これを求めるには、その因子に関する平方和を、従属変数全体の平方和で割ればよい。そして、エータ二乗の平方根をとったエータ自体については、それが間隔尺度のようなものに順ずる場合には、重回帰分析を実施したときに得られる偏回帰係数と同等と考えてよいのである。

よって、Yという従属変数を規程するA、B、C、という3つの独立する要因が存在し、その相対的重要度を求めるときには、エータを計算すればいいのである。