分散は、データセットのデータポイントがどの程度分散しているかを測定します。標準偏差は極端な異常値の影響を大きく受け、それが平均値に影響を与えます。平均絶対偏差は中央値に基づいています。中央値は、いくつかの極端なデータポイントの影響を受けずにコアデータの尺度を提供します。 Naval Bajpaiによる「Business Statistics」によると、中央絶対偏差(MAD)は、平均値と標準偏差に基づく統計分析を排除することができる極端な異常値の影響を受けない分散の絶対尺度を提供します。
あなたが必要とするアイテム
-
データセット
-
電卓
中央値の計算
データセット内のすべての観測値を最小値から最大値までリストします。複数回出現する場合は、出現回数と同じ回数を記載してください。
観測数を数えます。
観測数を2で割ります。観測数が奇数であるために均等に分割できない場合は、中央の観測値が中央値になります。それ以外の場合は、この2つの中間値の平均が中間点です。
中間点の真上と真下にある2つの観察を取ります。次に、これら2つの観測値を平均します。この値は中央値です。
中央絶対偏差の計算
中央値からデータセットの各値を引きます。これは各データ点の中央値からの偏差を表します。
データセットのすべての偏差を合計します。これは電卓を使用して高速化することができます。
データセットのすべての偏差の合計を観測数で割ります。結果は中央絶対偏差です。
ヒント
-
MADは標準偏差の推定値ではありませんが、書籍「分析科学者のための実用的な統計量」によれば、データ分布がほぼ正規分布であれば、MADに1.483を掛けると標準偏差の概算値が得られます。
警告
中央値ベースの統計は、6シグマ品質ベースの統計では使用できません。