統計分析では、 分散 データセットのメンバー間で、データポイントがトレンドラインからどれだけ離れているかを示します。 回帰直線 。分散が大きいほど、データポイントは広がります。分散分析の研究は、分散のどの部分がデータの特性によって説明でき、どの部分がランダムな要因に起因しているのかを示します。 説明できない分散の部分は、残差分散と呼ばれます。.
Excelスプレッドシートを使用して残差分散を計算する
残差分散を計算する式は、多数の複雑な計算を含みます。小さなデータセットでは、残差分散を手動で計算するプロセスは面倒です。大規模なデータセットの場合、タスクは尽きることがあります。 Excelスプレッドシートを使用すると、データポイントを入力して正しい式を選択するだけで済みます。プログラムは複雑な計算を処理し、結果を素早く提供します。
データポイント
新しいExcelスプレッドシートを開き、2つの列にデータポイントを入力します。回帰直線では、各データポイントに2つの要素があることが必要です。統計学者は通常、これらの要素に「X」と「Y」のラベルを付けます。たとえば、Generic Insurance Co.は、従業員の身長と体重の残差分散を求めます。 X変数は身長を表し、Y変数は体重を表します。 A列に高さを入力し、B列に重量を入力します。
意味を見つける
の 平均 データセット内の各要素の平均を表します。この例では、Generic Insuranceは10人の従業員の身長と体重の平均、標準偏差、および共分散を求めます。 A列に表示された高さの平均は、セルF1に関数「= AVERAGE(A1:A10)」を入力するとわかります。列Bにリストされている重みの平均は、セルF3に "= AVERAGE(B1:B10)"関数を入力することによって見つけることができます。
標準偏差と共分散を求める
の 標準偏差 データポイントが平均からどれだけ離れているかを測定します。の 共分散 データポイントの2つの要素がどれだけ一緒に変化するかを測定します。高さの標準偏差は、セル "F2"に関数 "= STDEV(A1:A10)"を入力して求めます。重みの標準偏差は、関数 "= STDEV(B1:B10)"をセルF4に入力することによって求められます。身長と体重の間の共分散は、セル "F5"に関数 "= COVAR(A1:A10; B1:B10)"を入力することによって求められます。
回帰直線を見つける
の 回帰直線 はデータポイントの傾向に従う線形関数を表します。回帰直線の式は、Y = aX + bのようになります。
ユーザーは、平均値、標準偏差、および共分散の計算を使用して、 "a"と "b"の値を見つけることができます。 "b"の値は、回帰直線がY軸と交差する点を表します。値は共分散を取り、それをX値の標準偏差の2乗で割ることによって求められます。 Excelの数式はセルF6に入り、= F5 / F2 ^ 2のようになります。
"a"の値は回帰直線の傾きを表します。 Excelの数式はセルF7に入り、= F3-F6 * F1のようになります。
回帰直線の式を見るには、セルF8に次の文字列連結を入力してください。
= CONCATENATE( "Y ="; ROUND(F6; 2); "X"; IF(SIGN(F7)= 1; "+"; " - "); ABS(ROUND(F7; 2)))
Y値を計算する
次のステップでは、データセット内の特定のX値について回帰直線上のY値を計算します。 Yの値を求める式は列Cに入り、次のようになります。
= $ F $ 6 * A(i)+ $ F $ 7
ここで、A(i)は行(i)の列Aの値です。スプレッドシートでは、式は次のようになります。
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7など
列Dのエントリは、Yの期待値と実際の値の違いを示しています。式は次のようになります。
= B(i)−C(i)、
ここで、B(i)とC(i)は、それぞれ列Bと列Cの行(i)の値です。
残差分散の検索
の 残差分散の式 セルF9に入り、このようになります。
= SUMSQ(D1:D10)/(COUNT(D1:D10)-2)
SUMSQ(D1:D10)は、実際のY値と予想されるY値の差の2乗の合計です。(COUNT(D1:D10)-2)は、データ点の数です。データ。