多変量解析とは
多変量解析と聞くと、数学への苦手意識から引いてしまう方もいるかもしれませんが、マーケティングにおいて多変量解析を使う場合は、数式の展開や計算の実行は必要ないと言っても過言ではありません。
数学的な理解よりも、「多変量解析で何ができるのか」「どのような分析目的の場合にどの手法が適切なのか」「分析結果のデータをどう解釈するか」といったことが、より重要であると言えます。
また、有用な情報を導くためには分析データの予備解析が非常に重要で、この部分に時間も一番とられます。
そして多変量解析をした結果から、マーケティングに役立つ情報を導くことができるかどうかが最大のポイントです。
多変量解析の基礎知識
「多変量解析」とは、複数の変数に関するデータをもとに、これらの変数間の相互関連を分析する統計的技法の総称です。データが集まった後、いきなり多変量解析にはかけるのではなく、前段階としてまずは「一変量解析」、「二変量解析」を充分に行うことが重要です。
図1 多変量解析で前処理したい目的
外れ値
多変量データが得られても、間違ったデータや特殊なデータを除去しなければ、いくら高度な多変量解析を行っても意味がありません。多変量解析の前に、一変量解析、二変量解析を行い、多変量解析に適したデータであることを充分に確認する必要があります。また、多変量解析に先立ち、二変量解析を行う理由は、外れ値の処理にあります。不適当なサンプルを除去するだけでなく、設問に関しても削除が必要であれば思い切って捨てることが大切です。
しかし、外れ値からは重要な発見があることもあり、除去するには慎重な判断が必要です。
図2 外れ値
多変量解析の実際
扱うデータの種類
多変量解析に限らず、すべての分析で扱うデータには以下の4種類があります。扱うデータの種類によって、用いることのできる分析手法が変わります。
表1 データの種類と特徴
※「アンケートデータの尺度データ(「満足度」等)」は、原則「順序尺度」となります。ただし、「等間隔」であると見なして「間隔尺度」として扱うケースもあります。
多変量解析の目的
多変量解析の目的は、大きく分けて「予測」と「要約」の2つがあります。この2つの目的によって、手法が異なります。
図3 予測の手法
図4 要約の手法
多変量解析の種類
多変量解析には、扱う変数の種類とその目的に応じて様々な手法があります。下表の「説明変数(独立変数)」とは、原因となる事柄に関する変数で、「目的変数(従属変数)」とは、結果となる事柄に関する変数です。多変量解析は、この「説明変数」と「目的変数」との関係や、「説明変数」同士の関係を調べ、関係式を作り、その関係を明らかにします。
表2 多変量解析で扱う変数の種類と目的
※一部の分析においては、質的データを量的データと見なしたり、ダミー変換をおこなうことで対処するケースがあります。
表3 多変量解析の種類
※横にスクロールしてご覧ください
重回帰分析 | 複数の説明変数から1つの目的変数を推定します。例えば、目的変数を従業員の年収として、年齢・会社の規模(資本金)・売上高・利益等の説明変数の影響度を求め、年収を推定します。(1つの変数から1つの目的変数を推定するのは、単回帰分析と言います。身長から体重を推定するのが、単回帰分析の例です) |
---|---|
数量化1類 | 量的な目的変数(外的基準)に対して説明変数が質的な場合、数量化1類により、重回帰分析と同様な推定を可能にします。例えば、店員のサービス・品揃え・立地等の質的説明変数から店の売上を予測します。 |
判別分析 | 目的変数が質的変数になります。よく使われるのは、2カテゴリーのデータで、例えば、購入/非購入・継続/中止などの判別を、価格・予算・使用量・支払い金額等の量的な説明変数によって行います。 |
数量化2類 | 判別分析の場合量的だった説明変数に質的変数を適応可能にさせたものです。例えば、サービスの印象・売り場の印象・商品評価などの質的説明変数から、購入/非購入を判別します。 |
主成分分析 | 多くの量的説明変数がある場合、これを少数の総合指標(合成変数)で表す目的で用いられます。1番目に得られる総合指標を特に第1主成分と言います。例えば、ある商品の満足度について色々な属性から評価を得て、これを主成分分析にかけると、第1主成分として総合的満足度のようなものが得られます。 |
因子分析 | 多くの量的説明変数がある場合、これらの変数に共通して影響を与えていると考えられる少数の変数(因子)によって、説明変数を表そうとするものです。各説明変数は、少数の共通因子と各変数独自の因子(誤差)によって表されます。例えば、各教科の点数を、理系能力因子・文系能力因子等を仮定して説明するものです。 |
個体間の類似度の高さに応じて、似ている個体を近い距離、似ていない個体を遠い距離に配置します。出力は幾何学的で軸に意味はないと言えます。 | |
数量化3類 | 外的基準がない場合、質的データの内部構造から尺度化を行うものです。Yesなら1、Noなら0の反応パターンに基づき、アイテム、カテゴリーと個体(対象者)をそれぞれ尺度化するものです。全く同じ原理の手法として、コレスポンデンス分析(対応分析)があります。コレスポンデンス分析はデータとして頻度を扱います。その意味で、コレスポンデンス分析は数量化3類を特殊な場合として含む上位の分析法になります。頻度は1か0も含むからです。 |