
マーケティングにおいて耳にする機会が多い多変量解析や単変量解析ですが、具体的に内容を理解できていない人も多く見られます。この記事では基本情報や違い、多変量解析の目的や活用するデータなどについて解説します。業務でマーケティングに関わるため、具体的に知っておきたい人は参考にしてください。
- 多変量解析と単変量解析の基本情報・違い
- 多変量解析の目的とは
- 多変量解析によって理解できること
- 多変量解析に活用する2種類のデータ
- 多変量解析を実施する手順
- 多変量解析で予測を目的とした分析手法
- 多変量解析で要約を目的とした分析手法
- まとめ
多変量解析と単変量解析の基本情報・違い
多変量解析とは、さまざまな要因が関係する事象を分かりやすく説明する統計手法で、データに含まれる複雑な関係性を明らかにします。単変量解析とは、ある1つの変数の分布や代表値を調べ、その変数の特徴を詳しく分析する手法です。全体の特徴を把握できるため、前処理の基本ステップとして重要とされています。
2つの違いは、回帰分析をはじめとする分析で扱う変数の数です。複数の変数を同時に扱うのが多変量解析、1つの変数を扱うのが単変量解析です。
多変量解析の目的とは
多変量解析には、予測と要約という2つの主要な目的があります。それぞれの目的について解説します。
データから予測する
多変量解析の1つの目的である「予測」とは、曜日・時間帯ごとの顧客数や商品の売れる量、店員や在庫の数、立地、天候などのデータを多変量解析し、未来の事象やトレンドを推測することです。複数の変数を用いて将来の結果や傾向を予測することで、的確なビジネス戦略を立てる際の根拠として活用できます。
データから要約する
多変量解析のもう1つの目的である「要約」とは、生活者の購入商品決定のメカニズムや市場の特性など、複雑でさまざまな要素が絡む事象を単純化することです。多変量解析で扱う多くのデータは複雑ですが、多変量解析を行うことでデータ間の関連性が分かり、深い理解につながります。
多変量解析によって理解できること
多変量解析によって理解できる事柄の例は、以下の通りです。
- 顧客の来店履歴や過去の天気のデータを基に、曜日や天気などの複数の要因が、売上にどの程度寄与しているかを明らかにし、予測する
- 消費者に対し、商品を選んだ理由や使い心地、価格に納得するかなどのアンケートを実施して商品・サービスの改善点を発見する
- 広告宣伝費の内訳や宣伝の方法や場所、時間帯、曜日ごとの消費者の反応などのデータをもとに、より効果的な宣伝方法を考える
- 年齢や性別、既往歴、血圧、身長、体重などのデータから、病気にかかりやすい人について把握する
上記のように、複数のデータから特定の事柄に関する情報を導き出せます。
多変量解析に活用する2種類のデータ
多変量解析には、量的データと質的データの2種類を活用します。それぞれの特徴について解説します。
量的データ
量的データとは、数値で表せるデータのことで、間隔尺度と比例尺度という2つの尺度に分類されます。間隔尺度とは、温度や西暦、偏差値など数値間の差が一定で、間隔の差に意味がある尺度を指します。間隔尺度ではデータの差を比較できるものの、比率の直接比較はできません。
比例尺度とは、身長や給料、販売価格など絶対的なゼロを原点として、比率や間隔に意味を持たせた尺度を指します。比例尺度は、間隔尺度としての性質に加え、データ間の比率についての議論も可能です。
質的データ
質的データとはカテゴリーや属性など数値で表せないデータのことで、名義尺度と順序尺度の2つの尺度に分類されます。名義尺度とは、住所や性別、職業など、データを分類するための名義となる尺度を指します。名義尺度では、データの順序や数値の大小関係については議論しません。
順序尺度とは満足度や学歴、売上のランキングなどデータの順序に意味があり、間隔には意味のない尺度を指します。たとえば、売上のランキングは1位・2位・3位と順序が決められ、順位についての数字の大小に意味がありますが、1位と2位、2位と3位の点差は等間隔ではないため順序尺度に該当します。
多変量解析を実施する手順
多変量解析を実施する際にどのような手順で実施すべきか、基本的な4つの手順について解説します。
データを収集する
まず、解析で使用するデータを収集します。目的や用途が明確でなければどのようなデータを集めるべきかはっきりせず、データを集めても適切な情報が得られない可能性があります。そのため、あらかじめデータを収集する目的と活用方法を決めたうえで収集を始めましょう。その後、データクリーニングを実施して使用できる状態にします。
単変量解析を実施する
次に、単変量解析を実施します。単変量解析では、平均値や中央値などの基本統計量の算出、外れ値や異常値の処理、図による分布状況確認を行います。外れ値とは多くの値が分布する数値から大幅に外れた値です。一見外れ値だと思われる数値が正常値という場合もあり、慎重に扱うことが重要です。外れ値において正常でない数値は異常値と認識して削除、修正を実施します。
二変量解析を実施する
単変量解析に続いて、データの相関性や関連性を調査するため二変量解析を実施します。クロス集計表や散布図など、データの相関性が可視化できるものを活用しましょう。クロス集計や散布図を活用して二変量解析を実施すると、外れ値が見つかる場合があります。その場合は内容を精査し、明らかな異常値であれば削除、修正を行います。
多変量解析を実施する
二変量解析後は多変量解析を実施しましょう。多変量解析では複数の変量を同時に扱い、複雑な関係性を明らかにします。一般的に、専用ソフトを用いて実施します。多変量解析には多様な手法があるため、目的に合ったものを選択する必要があります。分析が終わったのち、解釈を加えて意思決定に活用します。
多変量解析で予測を目的とした分析手法
多変量解析には多様な分析手法が存在し、予測・要約を目的としたものに分けられます。ここでは、予測を目的とした手法について解説します。
重回帰分析
重回帰分析とは、1つの事象を複数の要素で説明する手法です。たとえば、ある商品の売上を価格や気温など複数の要素から予測したり、店舗のサイトへのアクセス数や広告などの多くの要素から新規会員数を予測したりします。重回帰分析は予測の精度がどの程度であるかを算出でき、多変量解析の中で最も活用されることの多い手法です。
判別分析
判別分析とは、複数のグループに分類されたデータがどういった基準であるかを分析する手法です。新しいデータがどのグループに分類されるか予測します。たとえば、ある商品を購入したグループと別の商品を購入したグループに分け、各顧客のデータを分析します。それにより、新規顧客が興味を持つ可能性の高い商品の予測が可能です。
ロジスティック回帰分析
ロジスティック回帰分析とは、予測するデータが、2つのカテゴリーのどちらかに分類できる場合に使用する手法です。たとえば、合格か不合格か、購入するか購入しないか、薬が効くか効かないなどです。
この手法はマーケティングに加え、医療、金融など幅広い分野で活用できます。重回帰分析と混同されがちですが、重回帰分析は連続する「数値」を予測するのに対し、ロジスティック回帰分析は「ある事象が起こる確率」を予測する手法であるという違いがあります。
コンジョイント分析
コンジョイント分析とは、さまざまな要素を数値化し、最適な組み合わせを発見してマーケット予測に役立てる手法です。コンジョイント分析を用いて価格やデザインなど、消費者が商品・サービスを購入する際に重視する機能を予測することで、新商品を考える際の参考にできるでしょう。
多変量解析で要約を目的とした分析手法
多変量解析の分析手法のうち、ここでは要約を目的としたものである5つについて解説します。
主成分分析
主成分分析は、多変量解析の中でも最も使用される頻度の高い手法です。大規模な多次元データを扱う場合に、重要な要素を抽出することで全体像を把握しやすくします。たとえば、商品の味に関するアンケートの多岐にわたる評価項目を数個の「主成分」に合成することで、総合評価の指標などとして要約でき、商品の味にどのような魅力があるか分かりやすくなるでしょう。
因子分析
因子分析とは、さまざまなデータに隠れた原因を洗い出す手法です。観測されたデータの背後にある「共通因子」を探り、データ内に存在する本質的な構造やパターンを理解することで、データの解釈や理解を深めるために用いられます。たとえば、ある商品・サービスが売上トップである理由を把握したいときに活用できます。
クラスター分析
クラスター分析とは、似た特性を持つデータをグループへと分類する手法です。データ間の相似性や距離を計算し、それに基づいたデータをグループに分類します。クラスター分析はデータの内部構造やパターンを把握することが目的であり、データの相関関係や類似性を見つける際に役立つでしょう。
コレスポンデンス分析
コレスポンデンス分析とは、集計したデータの内容を一目で分かるよう可視化する手法です。アンケート結果をまとめるときに用いる、クロス集計表について実施します。分かりにくいアンケート結果を図で表現し、解釈を容易にします。
多次元尺度法
多次元尺度法は「多次元尺度構成法」や「MDS」とも呼ばれます。この手法では、分析する対象群を類似性の高さに応じて、似ているものは近く、似ていないものは遠くに配置します。競合を含めた、ブランドのポジショニング分析の際に一般的に用いられます。
まとめ
多変量解析は、さまざまな要因が関係する事象を分かりやすく説明する統計手法です。また、単変量解析とは、ある1つの変数の特徴を把握するための手法です。どちらもマーケティング分析の各プロセスで使用するため、業務で関わる場合は理解しておきましょう。
株式会社マクロミルはマーケティングリサーチを中心に、多様な社会・消費者ニーズを分析し、クライアントに的確な消費者インサイトを提供する企業です。
当社が提供するデータと顧客が保有するデータを融合させ、その利活用にともに取り組む「データ利活用支援事業(データ・コンサルティング)」や広告配信・CRMなど、顧客企業のマーケティング活動と連動するソリューションを提供する「マーケティング施策支援事業」を一気通貫で提供しています。
