カテゴリー : 09-multivariatefactor-analysis

因子分析

因子分析とは、観測された複数のデータから、その背後に潜む共通因子を探り出す分析手法です。直接観測することができない共通因子と観測されたアイテムとの関係性の強さを把握したり、数多くの観測データをいくつかの因子に集約することで、サンプルの特徴が理解しやすくなります。

■ 調査の設計

心理特性を問う設問項目を用意し、マクロミルで調査を行います。

設問の形式

設問はSAマトリクス形式で作成します。(通常5段階スケールであることが多いですが、増減は可能です)
※MA形式だとQuickCrossで因子分析は行えないのでご注意ください。
また、因子分析用の設問は回答負荷を考えて最終設問にすることが一般的です。

質問項目

生活価値観や買い物意識、情報感度などの項目を調査の目的によって使い分けます。どういった軸でサンプルをグルーピングしたいかが重要です。

【KEYPOINT】

①項目数は12~40くらいが一般的です。 ⇒項目が多くなると因子数が多くなり、うまくクラスター分けできない原因になります。

②1つの因子について4~5項目の質問を用意します。 ⇒因子分析で得られる因子はある程度想定して項目を作成してください。調査票設計の時点で因子の想定がない場合は因子分析の結果が上手く出ない場合があります。

生活価値観の項目例

  • 自分の成長を実感できることが大切
  • 達成感や充実感を実感できることが大切
  • マイペースで無理がないことが大切
  • その時その時を楽しく過ごせることが大切
  • 健康で元気であることが大切
  • 新しいものや刺激に触れられることが大切
  • 社会的な地位を得ることが大切
  • 資産や貯蓄を増やすことが大切

買い物意識の項目例

  • 情報は人より早く知っていることが多い
  • 雑誌で特集された新商品に注目している
  • 話題のお店やスポットに必ず足を運ぶ
  • 新しい商品やサービスはすぐ試してみる方だ
  • 見聞きしたことを話題にすることが多い
  • いいと思ったものは人に勧めたい
  • 試しに買った商品の感想は人に言いたくなる
  • 誘われるより誘うことの方が多い

■ QuickCrossで因子分析を行う

調査で取得したデータを使用してQuickCrossで因子分析を行います。
回答の背景にある軸を選定する作業なので、因子数を変えて何度か集約させることで最適な因子を見つけ出します。

[メニュー画面]→[多変量解析]→分析処理で[因子分析]を選択し、[設定]を押します。

アイテム一覧より因子分析用の設問を選択し、[>]で右枠に移動させます。

回転方法と抽出方法を選択します。QuickCrossでは回転方法に「プロマックス」、抽出方法に「最尤法」を標準としています。
抽出方法について詳しく見る>>

抽出する因子数を指定します。
・任意の因子数を指定する場合 ⇒ [抽出する因子数]に数値を指定
・固有値1以上となる因子を抽出する場合 ⇒ [固有値1以上]を選択
※特に因子の数を決めていない場合は「固有値1以上」で分析します。
固有値について詳しく見る>>

今回の調査票では[スケール設問逆値で分析する]にチェックを入れて、右下 [実行] を押します。
逆値について詳しく見る>>

因子分析の実行後、「分析結果」と「サンプルごとの因子得点」がExcel形式で出力されます。

■ 因子決定の基準とアウトプット

因子決定の基準について一般的には
・固有値(回転前)1以上
・累積寄与率が80%以上
・スクリープロットが落ち込む手前
上記に加えて、因子の分析しやすさを総合的に考え因子数を決定します。

各因子の特徴は因子負荷量で測定でき、分析した各項目との相関が表示されているので、相関が高い項目をもとにその軸の因子特徴を読み取れます。
※相関が高いとされる±0.4以上のセルは色付けされています。

下図のアウトプットは「抽出する因子数」に「5」を指定して分析した結果ですが、因子負荷量の因子5(一番右列)を見ると相関の高い設問が一つもありません。

この因子はどういった因子なのか読み取りにくく、またスクリープロットでも1~5因子の手前までは数値が落ち込んでいるのに対し、5因子以降はなだらかになっているのを見ると因子の集約は4因子が適切ではないかと仮説ができます。

抽出する因子数に「4」を指定して再度因子分析を行います。
※3因子などでも試し、最適な因子を利用します。

【KEYPOINT】因子アイテム名の編集

①分析画面に作成した因子のアイテム名が表示されます。このアイテムを使用してクラスタ分析を行うため、決定した各因子に名前を付けておきます。

手順としてはまず最適な因子アイテムを選択し[編集]を押します。質問文を因子の名前に書き替えたら[次へ]を押し、最後の因子まで名前を付けたら[登録]を押します。

②サンプルごとの因子得点はデータ参照から見ることができます。

スクリープロット 各因子の初期固有値の大きさをグラフ化したもので、因子数を決定するときの参考とするものです。
初期固有値 固有値は各因子が持つ固有因子の値で、これが大きいほど因子自体の説明力が大きくなります。回転後は差が小さくなってしまいますので、回転前で判断します。全因子の固有値の構成比を寄与率と呼び、その累積は説明力の累積といえます。
共通性 因子負荷量の二乗値を設問毎に全因子分足し上げた値であり、この値が大きいほどその項目は因子の影響を強く受けているということになります。
回転後因子負荷量平方和 因子抽出後の固有値のことです。累積寄与率80%が因子決定の1つの基準と言われていますが実務レベルでは40%前後となります。
因子負荷量 各設問が各因子から受ける影響力の程度を表す係数で、各設問と因子の間の相関の程度を表します。
因子相関 因子間の相関係数を出力したものです、斜交回転のみ出力されます。

■ FAQ

因子分析方法は何を使用していますか?
主因子法と最尤法を選ぶことが出来ます。回転方法に応じて設定してください。
一般的にバリマックスの際は主因子法、プロマックスの際は最尤法を使用します。
固有値とは何ですか?
固有値とは抽出した因子がどれだけ項目を説明しているかの指標であり、固有値が1というのは計算上1つの項目を説明することを意味します。ある程度の説明力を持つ因子のみを抽出したいときのために、「最小の固有値を1とする」選択肢があります。
「スケール設問逆値で分析する」とは何ですか?
ローデータに入っている選択肢番号をポジとネガで逆にする機能です。スケール設問で調査を行うと、ローデータに入る数値(=選択肢)が、ポジティブな回答の方が小さくなりネガティブな回答の方が大きくなることが多く、そのまま分析すると結果が解釈しにくくなるため、こちらの機能を推奨しています。
因子負荷量のセルが黄色く色付けされていますが、そのルールは何ですか?
相関が強いとされる±0.4以上のセルに黄色い色付けをしています。
回転方法の違いは何ですか?
直交回転(バリマックス)、斜交回転(プロマックス)はどちらも因子の意味を解釈しやすくするための手法ですが、直交回転は因子間の相関がないものと仮定した回転で、斜交回転は因子間の相関があるものと仮定した回転です。

Myリサーチページログイン

ID

パスワード