(1)個別データの分散、標準偏差など   Variance, Standard deviation, etc.


  分散(Variance)  データとその平均の差の2乗平均です。普通 σ2で表わします。
   分散を求めるには、併せて平均を求める必要があります。
    分散は、データの値に単位呼称があるときは、その呼称の2乗の呼称となります。
   (集団の構成単位そのものの呼称はない(無名)として。以下同じ。)
 標準偏差(Standard deviation) 分散の平方根(正の方)をいいます。普通 σで 表わします。標準偏差は、データの値に単位呼称があるときは、それと同じ呼称とな ります。
 変動係数(Coefficient of variation, Relative standard deviation) 標準偏差 と平均の比をいい、CV などで表わします。このため、変動係数は、相対標準偏 差ともいいます。変動係数には、単位呼称はなく、無名数です。
  一式のデータが与えられると、その平均、分散、標準偏差、変動係数などが、一連の 統計値として計算されるのが普通です。 総変動が出ていれば、それから簡単に導くことができます。
計算例
次の8個のデータ
      28,7,11,22,9,16,15,19
について、先ず平均は
     (28+7+11+22+9+16+15+19)/8 =15.875
となるので、
分散は
{(28-15.875)2+(7-15.875)2+(11-15.875)2+(22-15.875)2+ (9-15.875)2+(16-15.875)2+(15-15.875)2+(19-15.875)2}/8 =43.1094
標準偏差は √43.1094=6.5658
変動係数は 6.5658/15.875=0.4136
となります。   
   −−−−−−−−−−−−−−−−       理論
変数 X のとる値を
X1,X2,.....,XN
とするとき
X1-,X2-,.....,XN-
を考えると、これらは個々の値の、その平均からの距離を表わし、偏差とい います。これらはプラス・マイナスがあって、平均すると常に0になります。 そのため、2乗して平均したものを採用し、
(1) 重要注意
と表わし、これを分散といいます。この式は
=(ΣX2)/N-{(ΣX)/N}2 (2)
と変形できます。式 (1),(2)は数理的に同じで、どちらを使っても構いません。 実務では(2)式がよく用いられます。
標準偏差は
σ=√(σ2)
変動係数は
CV=σ/
です。   −−−−−−−−−−−−−−−−−−−
意味と計算手順のまとめ

意味:分散は散布度(2次)の基本的尺度、主に理論で使用。
標準偏差は散布度(1次)の基本的尺度、主に実務で使用。
変動係数は散布度(0次)の基本的尺度、主に実務で使用。

計算手順:1、データから N, ΣX, ΣX2 を求める。
2、これらを上式 (2)にあてはめる。
3、分散、標準偏差、変動係数の順に求める。

練習問題
25 世帯が住むアパートがあり、各世帯の人数は次の通りです。
3, 4, 2, 4, 6, 2, 5, 3, 2, 5, 4, 2, 3, 1, 5, 3, 4, 4, 2, 3, 2, 3, 2, 5, 4
世帯人員の分散、標準偏差、変動係数を求めなさい。
[答(計算値) 分散 1.5776(人2)、標準偏差 1.2560(人)、変動係数 0.3783]
関連ページ 重要注意 このシリーズの定義系では、分母が N-1 となっている分散は、与えられた大きさ N の集 団の分散ではなく、その集団を1群の標本とする元の母集団の分散の推定量です。名称が 同じでも意味が違いますので、注意が必要です。 (例) 大きさ5の集団を、1、8、5、3、5 とするとき、 この5個の値の分散は、5.44(分母は5)となります。 一方、この5個が、別にある母集団から抽出(等確率、独立)された標本であるとき、母 集団の分散は6.8(分母は4)と推定されます。
元の位置へ

統計計算例集目次