回帰係数

 (1)個別データの回帰係数
2つの変数 X,Yのデータがあって、(Xi,Yi)の形で与えられているとき、Xと Yの関係づけ を行う基本的な方法に、Xと Yを1次式で結びつける方法があります。    理論
1つの Xの値に対して、複数の Yの値が対応しているとき、Xの変化に伴う Yの平均を辿 ると、一般に折線の形状を呈します。これを Xに対する Yの回帰線といいます。回帰線を 最もよく代表する直線を、回帰直線といいます。
Xに対する Yの回帰直線の式は、
Y=AX+B (1)
の形で表され、Aを Xに対する Yの回帰係数と言います。 Aと Bはデータから計算されます。即ち先ず、
A={NΣXiYi-(ΣXi)(ΣYi)}/{NΣXi2-(ΣXi)2}   (2)
によって Aを求め、次に
B=ΣYi/N-AΣXi/N (3)
によって Bを求めます。 Aと Bを求めるには、データから次の6個の値を算出しておく必要があります。      N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi
(変数が原因と結果を示しているようなときは、Xを原因、Yを結果とするのが普通です。 変数が因果関係にない場合でも、回帰の理論は成り立ちます。)
Xと Yの立場を逆にすると、もう1つの回帰線と回帰直線ができます。Yに対する Xの回帰 直線の式は
X=CY+D (4)
で、この場合
C={NΣXiYi-(ΣXi)(ΣYi)}/{NΣYi2-(ΣYi)2}   (5)
によってCを求め、次に
D=ΣXi/N-CΣYi/N (6)
によってDを求めます。式(1)と(4)は異なります。 回帰係数は相関係数と関係があります。 Xと Yの相関係数をρとすると、
ρ=±√|AC|
となります。複号の選択は Aまたは Cの分子の符号とします。 -------------------------------------    計算例
8人の学生の身長 X(cm)と体重 Y(kg)のデータが (Xi,Yi)の形で有ります。 式(1),(4)等を用いて身長に対する体重の回帰直線、体重に対する身長の     回帰直線、身長と体重の相関係数を求めます。
(168,60) (162,55) (171,65) (159,60) (166,57) (175,61) (176,66) (168,56)
    必要な6個の値を算出してみると       N=8, ΣXi=1345, ΣYi=480, ΣXi2=226371, ΣYi2=28912, ΣXiYi=80806
これらにより A=(8*80806-1345*480)/(8*226371-13452) =848/1943=0.4364
B=480/8-0.4364*1345/8=-13.3762 となるので、Xに対する Yの回帰直線の式は
      Y=0.4364X-13.3762
となります。更に        C=(8*80806-1345*480)/(8*28912-4802) =848/896=0.9464
D=1345/8-0.9464*480/8=111.3393 となるので、Yに対する Xの回帰直線の式は
      X=0.9464Y+111.3393
となります。なお、Xと Yの相関係数は
       ρ=√(0.4364*0.9464)=0.6427
     です。    --------------------------------------
回帰係数の意味と計算手順のまとめ

意味:2変数を直線的関係で近似したときの変数の平均変化率(2つあり)

計算手順:1、データの配列を確かめる。
2、次の6つの値を求める。 N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi
3、これらを上式 (2),(5)などにあてはめる。
注意:データによっては、式(2)だけ、又は(5)だけの場合もある。

練習問題
次のような (X,Y) 型のデータがあります。Xに対する Yの回帰直線、 Yに対する Xの回帰直線、XとYの相関係数を求めなさい。
(8,0) (2,-5) (11,5) (-1,0) (6,-3) (15,1) (16,6) (8,-4)
(注)このデータは、上記の計算例のデータにおいて、Xから160 を引き、Yから60を引いたものです。 ヒント:先ずデータから、N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi を算出します。 (答)Y=0.4346X-3.5461 X=0.9464Y+8.125 ρ=0.6427

統計計算例集目次