決定木分析(ディシジョン・ツリー)
決定木分析は「予測」や「判別」、「分類」を目的として使われるデータマイニング手法です。顧客情報やアンケート結果などについて、“従属変数”に影響する“説明変数”を見つけ、樹木状のモデルを作成する分析方法となります。
決定木分析の活用シーン
- 自社商品・サービスの購入見込みが最も高い人は、どのような人であるかを知りたい
- 満足度やロイヤリティの高い生活者には、どのような属性があるのかを知りたい
- 商品が持つ要素のうち、生活者の満足度やロイヤリティに最も影響しているものを知りたい
決定木分析の特長
- 説明変数はSA(単一回答)、MA(複数回答)、数値回答など、様々な設問タイプの調査結果から分析が可能
- “目的変数”に最も影響すると考えられる“説明変数”を、何度もクロス集計を繰り返すことなく明らかに
- 対象者の分割で利用される基準や分析手法は、以下のようなものが有名である
分割に利用される基準 |
分析手法名称 |
モデルの特徴 |
カイ二乗統計量 |
CHAID |
多分岐が可能 |
ジニ係数 |
CART |
2分岐のみ |
平均情報量(エントロピー) |
C5.0 |
多分岐が可能 |
活用事例
事例 ゴルフ未経験者における、ゴルフ実施見込みが高い集団の特定・抽出
ゴルフをしない人たちの中で、ゴルフをやる見込みが最も高いのはどのような集団かを把握するために決定木分析を実施します。データは、意識調査で聴取した「ゴルフへの興味関心度(目的変数)」と、「それ以外の各種条件/意識(説明変数)」を用います。
決定木分析(CART)を実施した結果が以下の通り。樹木のように経路図が形成されます。
左の「YES」ゾーンは、階層が深くなるほど「興味関心あり」の割合が高くなります。逆に右の「NO」ゾーンは、階層が深くなるほど「興味関心なし」の割合が高くなります。
この分析結果から、最もゴルフへの興味関心の高い「ポジティブ層」(一番左側)の条件が把握きました。また、今後ゴルフをする見込みのある「ポジティブ層予備軍」の流れも、分岐から把握することができ、今後のターゲットを選定する際の判断材料/優先順位づけに用いることができます。ツリーの深さはユーザーが指定することができます。
- お客さまの課題・ニーズを伺って
リサーチの企画・提案を行います。
- 各種資料・調査レポートのダウンロードもこちらから