相関係数

 (2)度数分布の相関係数(その1)
   階級に幅がない場合
相関係数は、2つの変数の直線的関係の程度を測る尺度で、普通、ρ(ロー)で表わします。 直線的でない関係は、この相関係数では測れません。 相関係数は、常に -1 と +1 の間にあります。 相関係数には、単位呼称はありません。
相関関係は、因果関係とは別です。データの内容によって、因果関係として 捉えてよい場合もあるし、そうでない場合もあります。
  理論
相関係数は、2つの変数 X と Y の積和を核として、X の平均と標準偏差、    Y の平均と標準偏差を組み合わせて求めます。    データは、(Xi,Yi,fi)の形で与えられます。
相関係数の基本式は
    ρ=Σfi(XiX)(YiY)/(FσXσY) (1) ここに Σは iについて 1から K(階級の数)まで計をとる記号 Fは各fiの合計、 μXは Xの平均、μYは Yの平均、 σXは Xの標準偏差、σYは Yの標準偏差、          いずれも度数分布から計算したもの。
     計算の便宜のため、次の式によることもできます。
     ρ={FΣfiXiYi-(ΣfiXi)(ΣfiYi)}/ √[{FΣfiXi2-(ΣfiXi)2}{FΣfiYi2-(ΣfiYi)2}] (2)
式(1)と(2)は数理的に同じで、どちらを使っても構いません。 実務では式(2)が便利です。
相関係数は、変数に一定数を加減しても、変わりません。また、     0でない一定数で乗除しても、符号を除いて変わりません。     符号は、負で乗除した回数が奇数のときだけ、変化します。 ---------------------------------------    計算例
H氏は、健康に留意して、毎朝散歩するよう心掛けていますが、必ずしも 毎朝とはいきません。一方、職場で残業をする日もあります。       次のデータは、H氏の週の散歩回数(X)、残業日数(Y)、週の数(f)を       (X,Y,f)の形で表わしたものです。(2)式を用いて Xと Yの相関係数を求めます。
(6,0,1) (7,0,1) (3,1,1) (4,1,1) (5,1,2) (6,1,1) (2,2,1) (3,2,3) (4,2,4) (5,2,2) (6,2,1) (1,3,1) (2,3,4) (3,3,5) (4,3,3) (5,3,1) (1,4,2) (2,4,4) (3,4,6) (4,4,1) (0,5,2) (1,5,1) (2,5,2) (3,5,2)
   (2)式を用いる場合、次の6個の値を算出する必要があります。      F,ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
計算してみると       F=52, ΣfiXi=163, ΣfiYi=156, ΣfiXi2=627,ΣfiYi2=558, ΣfiXiYi=415
これらにより ρ=(52*415-163*156)/√{(52*627-1632)*(52*558-1562)} =-3848/5314.49=-0.7241
となります。
--------------------------------------
相関係数の意味と計算手順のまとめ

意味:2変数の直線的関係の強さを表わす尺度。

計算手順:1、データの配列を確かめる。
2、次の6つの値を求める。 F,ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
3、これらを上式 (2)にあてはめる。

練習問題
ある結婚式場における新郎新婦の年齢 (夫 X,妻 Y)と結婚組数 (f) が、(X,Y,f) の形で次のように示されています。夫婦の年齢の相関係数を求めなさい。
(22,20,1) (26,27,1) (24,22,1) (27,24,3) (25,22,2) (27,25,1) (25,23,1) (27,26,2) (25,25,1) (28,25,2) (26,23,4) (28,26,1) (26,24,2) (29,27,1) (26,25,2) (29,30,1)
ヒント:式(2)を用いるとして、 先ず所要の6つの計数を求めます。 F=26, ΣfiXi=684, ΣfiYi=633, ΣfiXi2=18052,ΣfiYi2=15513, ΣfiXiYi=16714
これらにより相関係数は ρ=(26*16714-684*633)/√{(26*18052-6842)*(26*15513-6332)} =1592/1990.704=0.7997
となります。 [答 0.7997]  

統計計算例集目次