統計量の分散を計算する方法

目次:

Anonim

統計の最も基本的な概念の1つは、平均です。 算術平均 数字のセットの。平均値はデータセットの中心値を意味します。の 分散 データセットの平均は、そのデータセットの要素が平均からどれだけ離れているかを測定します。数値がすべて平均に近いデータセットは、分散が低くなります。数値が平均値よりはるかに大きいまたは小さい集合は、高い分散を持ちます。

データセットの平均を計算

二乗差を計算する

次のステップでは、データセット内の各要素と平均値の差を計算します。いくつかの要素は平均より高く、いくつかは低くなるので、分散計算は差の二乗を使用します。

1日目の売上 - 平均売上:$ 62,000 - $ 65414.29 =( - - 3,414.29); (-3,414.29)2 = 11,657,346.94

2日目の売上 - 平均売上:64,800ドル - 65414.29ドル=( - 614.29ドル); (-614.29)2 = 377,346.94

3日目の売上 - 平均売上:62,600ドル - 65414.29ドル=( - - 2814.29ドル); (-2,814.29)2 = 7,920,204.08

4日目の売上 - 平均売上:69,200ドル - 65414.29ドル=(+ 3,785.71ドル); (+3,785.71)2 = 14,331,632.65

5日目の売上 - 平均売上:$ 66,000 - $ 65414.29 =(+ $ 585.71); (+585.71)2 = 343,061.22

6日目の売上 - 平均売上:63,900ドル - 65414.29ドル=( - - 1,514.29ドル); (-1,514.29)2 = 2,293,061.22

7日目の売上 - 平均売上:69,400ドル - 65414.29ドル=(+ 3,985.71ドル); (+3,985.71)2 = 15,885,918.37

注意:差の二乗はドルで測られていません。これらの数値は、分散を計算するために次のステップで使用されます。

差異と標準偏差

分散は、差の2乗の平均として定義されます。

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

分散は差の二乗を使用するので、分散の平方根は実際のスプレッドをより明確に示します。統計学では、分散の平方根は以下と呼ばれます。 標準偏差.

SQRT(7,544,081.63)= $ 2,746.65

差異と標準偏差の使用

分散と標準偏差はどちらも統計分析に非常に役立ちます。分散は、平均からデータセットの全体的な広がりを測定します。標準偏差は検出に役立ちます 外れ値あるいは、データセットの要素が平均からかけ離れている。

上記のデータセットでは、分散はかなり高く、1日の合計売上高は平均の1,000ドル以内になっています。データセットはまた、7つの日次売上合計のうち2つが平均を上回る1標準偏差を超えているのに対し、他の2つは平均を下回る1標準偏差を超えていることを示しています。