コレスポンデンス分析

1.コレスポンデンス分析

コレスポンデンス分析(対応分析、コレポンと短縮して呼ばれることもあります)は、数量化3類と同様の手法です。

ただし、その歴史と背景が異なります。数量化3類は林知己夫氏によって1952年に着想されましたが、コレスポンデンス分析は、その10数年後に、フランスのベンゼクリ氏によって提案されました。また、1980年代に西里静彦氏によって双対尺度法が提案されていますが、こちらも同様の手法です。

以上の手法は、その発展過程や適用分野の違いなどのため、対象とするデータの形に若干の違いがあります(多変量解析の基礎知識2-3.参照)が、基本の考え方は同じです。

コレスポンデンス分析の基本の考え方は、行列(分割表)において、行項目と列項目の相関が最大になるように、行と列の双方を並び替えることです。この場合の行列は、データシート、クロス集計表など、第1行(表頭)と第1列(表側)に注目する項目があり、他の部分にこの項目に対応するデータがあるものであれば何でもかまいません。相関が最大になるように並べ替えるということは、クロスセルにあるデータを見ながら、近い項目が隣り合うように並べ替えるということです。

0と1の2値データで説明します。下左図のような行列があったとします。ここで、項目A,Bは、対象者でも集計単位(性・年代など)でも質問項目でも回答カテゴリでもかまいません。下左図の1のセルがなるべく対角線上に並ぶように、行と列を入れ替えます。その結果が下右図です。

項目A,Bをこの順番に並べたことで、項目AとBの相関が高くなったといえます。

fig.1

もちろん実際は、このようにうまく対角線上のデータが集まるとは限りません。例えば、下記のような場合は、どう並べ替えてもデータは対角線上に集まらず、1軸だけではデータを説明できません。したがって、データを説明するために、順次、軸が抽出されることになります。軸の選択は、軸の固有値を見ながら行うことになります。

fig.2

2.いろいろなコレスポンデンス分析

コレスポンデンス分析は適応範囲が広い分析法です。扱うデータも0、1のカテゴリデータでも、パーセンテージなどの実数でもかまいません。

したがって、ローデータからでもクロス集計表からでも分析ができます。例えば、下記のような個人別データも、行列の形になっていれば分析可能です。ただしこの場合データは、あてはまる、あてはまらないなどの2値データを使います。(この場合、数量化3類と呼ぶことが多い)

ローデータ(個人別データ)

また、下記のように性・年代別に集計したクロス集計表から分析すると、表頭項目と表側項目を1つの図にプロットして比較することができます。

性年代別集計データ
グラフ

さらに、下記のように設問項目間のマトリクスを使うと、例えばブランドや商品とそのイメージやベネフィットを1つの図にプロットして比較することができます。

データマトリクス
グラフ

このような分析は、ブランドイメージの分析などで頻繁に用いられます。ただし、結果を読む際は下記の点に注意する必要があります。

  1. 軸に意味づけをした方が、結果の解釈がしやすい。この場合、意味がつけやすいように軸を回転させてもよい。
  2. 関連の強いカテゴリは近くに、弱いカテゴリは遠くにプロットされるが、これはあくまでカテゴリ間の相対的な関係で、絶対的なボリュームを表わすものではない。
  3. 縦軸の目盛りと横軸の目盛りはあわせた方がよい。そうしないと距離を見誤ることがある。
  4. ただしこのとき、縦軸と横軸の選んだ軸の固有値(あるいは寄与率)に注意する必要がある。
  5. クロス集計表から作成しているので、サンプルサイズは結果に反映されない。サンプルサイズが少ない際には注意が必要。(ブランドイメージを質問するときなど、認知者だけに質問すると、ブランドごとのサンプルサイズが異なるので注意する。例えば、Aブランドは認知者が10人で、5人が「はい」と答えて50%、Bブランドは認知者が100人で、50人が「はい」と答えても50%で、この差は結果に反映されない。)
  6. 異なる項目、例えば前の例では、飲料と飲用シーンのカテゴリの位置関係は、原点からの方向で判断する。原点から見て同じ方向にあれば、一見距離があっても、同様の意味づけが可能である。

お客さまの課題・ニーズを伺ってリサーチの企画・提案を行います。
お気軽にお問い合わせください。