データ分析の分野がすべてのチャネルにわたってより一般的になるにつれて、人々はますます有効な結果の重要性に気付き始めています。 Facebookにフレンドリーなアンケートを投稿する場合でも、雇用主のために広範な市場調査を行う場合でも、調査結果から正確なデータを入手できるようにする必要があります。これは今日利用可能な多くのツールの1つを使用することを意味します。
収集されたデータについて
どの統計ツールを使用するかを決定する前に、まず収集するデータを理解しておく必要があります。調査はアンケート形式で行われることが多く、回答は複数の選択肢から自由回答までさまざまです。統計学者は標本抽出を使用することもできます。これにより、標本が全体を表すと仮定することを選択して、より大きな母集団のサブセットを取得できます。結果には、すでに特定の機能を共通に持っている参加者を選択することによってゆがめる可能性があるため、データコレクターも変数を考慮に入れる必要があります。たとえば、特定の地域と肺がんの有病率との関連性を特定しようとしている場合は、喫煙習慣などの機能を考慮に入れる必要があります。
統計には、記述型と推論型の2つの主要なタイプもあります。記述統計は母集団の全メンバー間の類似性を探しますが、推論統計はデータに見られる傾向に基づいて母集団についての仮定をします。推論統計では、調査はしばしば仮説から始まります。たとえば、「家を共有する高齢者よりも独居高齢者のほうが鬱病が多い」ということです。次に、その仮説を収集したサンプルからの回答に適用し、その仮説が正しいかどうかを判断します。
ツールの知識
調査からのすべての回答が収集されたら、統計学者は調査できるように調査を整理する方法を見つけなければなりません。簡単な調査はExcelのスプレッドシートにまとめられ、各回答を表す行が設定されます。しかし、基本的なスプレッドシートには限界があるため、より高度な統計学者はデータの収集と分析に固有の統計ツールを使用したいと考えています。
多くの場合、調査データを収集するために使用されるソフトウェアを使用してそれを管理することもできます。 SurveyMonkeyのようなツールは、結果をパーセンテージと数で表示します。また、回答した人々の種類に基づいて回答を相互参照することもできます。たとえば、調査が男性と女性のサンプリングに及ぶ場合、参加者を調査した時点でこのデータを収集していれば、データを年齢、性別、および地理的な場所でセグメント化できます。
技術のおかげで、基本的な調査を作成して使用する方法を学ぶのがこれまでになく簡単になりました。ただし、高度なデータ分析は統計作業を専門とする専門家によって収集されることが多く、MATLABやSAS Business Intelligenceなどの集中的なツールを使用しています。これらのツールは高価で、厳しい学習曲線を伴うことがあり、それらを使用するためには専門的なトレーニングが必要になることがよくあります。