データの精度を計算する方法

目次:

Anonim

科学的または統計的分析を行う場合、データの正確さは最も重要な考慮事項の1つです。一般的に正確さの概念と混同されている、ハワイ大学によって明確にされたダーツボードの類推は、正確なデータポイントは平均して期待される結果と等しく、正確なデータポイントは近くでなくても密集しています。予想される結果ダートマス大学によると、精度は一連の結果の再現性の尺度です。地理情報システムの分析においてテキサス大学オースティン校のKenneth E. FooteとDonald J. Huebnerが示しているように、データセットの精度は技術関連の取り組みにおいても重要な概念です。精度の計算は、かなり主観的な練習ですがかなり簡単です。

あなたが必要とするアイテム

  • データセットのグラフィカル表現

  • データに表示されている関連単位に関する情報

  • 実験における最小許容誤差

散布図などのデータポイントの視覚的表現を作成します。非常に単純な視覚的表現は、各データ点について対応する従属変数値および独立変数値をデカルト座標系にプロットすることを含む。

データポイントのグループ分けを評価し、パターンを探します。正確なデータはデータポイントのクラスタで表され、類似の入力変数が類似の出力変数と相関することを示しています。

データの収集に使用された測定単位に関する情報を適用して、データポイント間の平均間隔を決定します。単純な定規測定を使用してグラフ上の点間の距離を決定し、次にデータ点を生成するために使用される測定の単位に対応する任意の便利な尺度を使用して変換することができます。これは、距離の平均をとることによって、互いに対するデータポイントの精度を計算することを可能にします。

実験で許容される最小誤差範囲とデータポイントの平均精度を比較して、実験の全体的な相対精度を決定します。異なるタイプの実験は多かれ少なかれエラー許容度を持つでしょう:工学プロジェクトはたぶん非常に小さい単位まで正確さを必要とするでしょうが、社会実験はおそらくより多くの分散を許容するでしょう。

ヒント

  • データポイントのグラフィック表現を作成する前に、ありそうな単位スケールを評価してみてください。これにより、特に注目すべき精度または不正確な部分を特定するために、精度を視覚的に評価することが容易になります。

    視覚的表現で生じる明確なパターンのデータは、実験の正確さおよび再現性を非常に示している。継続的な実験では、すでに存在しているものに近い正確なクラスタにさらにデータポイントを追加する必要があります。

警告

精度と精度を混同しないでください。実験の目的がすべての入力に対してgiveの平均出力値を達成することであり、これが-12から14までの範囲の平均値によって達成される場合、これは正確かもしれませんが、正確な測定にはなりません。正確な測定では、すべてのデータポイントが17付近に集まる可能性があります。これは不正確ですが、正確で予測可能です。