判別分析

1.判別分析の原理

判別分析は、個体(対象者)の特性(回答データ)から、その個体(対象者)がどの群に属するかを判別する手法です。

fig.1

これは、つまり重回帰分析における従属変数が、離散量になったモデルだといえます。例えば、上図のように判別対象が2群の場合、予測される変数が0か1の2値データになったものと考えられます。

要約すれば、判別分析は、従属変数が質的変数で、説明変数は量的変数の(重)回帰分析ともいえます。(線形判別関数を使う場合)

判別の方法は、大きく分けて次の2種類があります。

  1. 直線で仕切る(線形判別関数)
    fig.2
    で、Z>0かZ<0かで判断します。上式は、重回帰分析の式と同じ形をしています。
  2. マハラノビス平方距離を用いる
    ユークリッド距離を標準偏差で割った値の2乗をマハラノビス平方距離といい、標準偏差で割ることで、散らばりの大きさを勘案したものになっています。ある個体のデータと各群のマハラノビス平方距離を計算し、距離が最も近い群をこの個体が属する群とします。

2.判別分析の適用事例

判別分析は、他の多くの多変量解析手法のように集団の情報を得るためというより、個人(個体)を分類する目的で使われることが多いといえます。例えば、下記のような場面で用いられます。

  1. セールスの効率化のために、見込み客をデータを元に、購入しそうなお客様と購入しそうにないお客様に分ける
  2. 現在の顧客をランク分けする場合の資料に使う
  3. クレジット申し込み者に対する与信(クレジットカードを発行するかどうかの決定資料とする)
  4. 検査結果から、疾病の有無を判断する

判別分析は、説明変数が量的変数の場合に用いられますが、説明変数が質的変数の場合は、数量化2類を用います。

お客さまの課題・ニーズを伺ってリサーチの企画・提案を行います。
お気軽にお問い合わせください。