決定木分析(ディシジョン・ツリー)

決定木分析は「予測」や「判別」・「分類」を目的として使われるデータマイニング手法です。顧客情報やアンケート結果などについて、【目的変数】に影響する【説明変数】を見つけ、樹木状のモデルを作成する分析方法となります。

このようなときに

  • 自社の商品(サービス)を購入する見込みが一番高い人はどんな人なのかを知りたい
  • 満足度やロイヤリティの高い生活者がどのような特性を持っているのかを知りたい
  • 商品が持つ要素のうち、生活者の満足度やロイヤリティに最も影響を及ぼしているものを知りたい

特長

  • SA(単一回答)、MA(複数回答)、数値回答など、様々な設問タイプの調査結果から分析が可能です。
  • 最も【目的変数】に影響すると考えられる【説明変数】を、何度もクロス集計を繰り返すことなく明らかにすることができます。
  • 対象者を分割していくにあたり、利用される基準は以下のようなものがあり、それぞれ異なる分析名称で呼ばれています。
分割に利用される基準 分析手法名称 モデルの特徴
カイ二乗統計量 CHAID 多分岐が可能
ジニ係数 CART 2分岐のみ
平均情報量(エントロピー) C5.0 多分岐が可能

活用事例

ゴルフ未経験者における、ゴルフ実施見込みが高い集団の特定・抽出

現在ゴルフをやっていない人たちにおいて、【「ゴルフをやってみたい」見込みが一番高いのはどのような集団か?】を把握するために決定木分析を実施します。

データとしては、意識調査で聴取した「ゴルフへの興味関心度(目的変数)」と、「それ以外の各種条件/意識(説明変数)」を用います。

ゴルフ未経験者における、ゴルフ実施見込みが高い集団の特定・抽出

決定木分析を実施した結果が以下の通り。樹木のように経路図が形成されます。

決定木分析(ディシジョン・ツリー)

左の「Yes」ゾーンは、階層が深くなるほど「興味関心あり」の割合が高くなっています。 逆に右の「NO」ゾーンは、階層が深くなるほど「興味関心なし」の割合が高くなります。

この分析結果から、最もゴルフへの興味関心の高い「ポジティブ層」(一番左側)の条件が把握できました。また、今後のゴルフを行う見込みのある「ポジティブ層予備軍」の流れも、分岐から把握することができます。

→ 今後のターゲットを選定する際の判断材料/優先順位づけに用いることが可能です。

お客さまの課題・ニーズを伺って
リサーチの企画・提案を行います。
各種資料・調査レポートのダウンロードもこちらから

関連コンテンツ