回帰分析

回帰分析のモデルと基本式

1つ(単回帰分析)または複数(重回帰分析)の説明変数と、1つの目的変数の関係を求め、説明変数から目的変数を推定します。

回帰分析のモデルと基本式
Y=定数+b1X1+b2X2+・・・+bpXp+誤差

回帰分析の例

例としてある店の顧客に対する販売実績と、顧客の属性の関係を分析します。目的変数として、ある年の各顧客の購入額をとります。説明変数として、顧客の属性(年齢、性別、家族人数、年収など)を用いることとします。すなわち、

購入額=定数+ a ×(年齢)+ b ×(性別)+ c ×(家族人数)+ d ×(年収)+(誤差)

※性別などの名義尺度は数量として扱えないため、男性=1、女性=0といったダミー変数を与えて分析します。

という式において、a,b,c,d(これを偏回帰係数といいます)の値と定数を推定します。求め方は、最小二乗法または最尤法が用いられますがその理論の説明は省略します。その結果、求められた式、例えば、

購入額の予測値=5,000+30×(年齢)+300×(性別)+450×(家族人数)+0.001×(年収)

などという関係式が得られるのです。これを回帰方程式と呼びます。この式に新しい顧客の属性データを入れれば、購入額が推定できるというのが、重回帰分析の考え方です。

一方、この関係式において、説明変数(属性)が、購入額(目的変数)に対しておよぼす影響の大きさを知りたいということがよくあります。上の関係式では、年齢や年収は単位が違います。したがって年齢の項の偏回帰係数30と年収の項の偏回帰係数0.001は直接比較できません。そこで、あらかじめ説明変数を平均0、分散1に標準化()しておくと、単位が同一の条件下で分析できます。

このように、説明変数を標準化して求めた偏回帰係数を標準偏回帰係数といい、この標準偏回帰係数の大きさで、説明変数の説明力(目的変数への影響の大きさ)を比較できます。ただし何%のウェイトを持つというような、数量的な評価はこのままではできません。

回帰分析モデルの評価

重相関係数と決定係数

重相関係数とは、1つの目的変数と、その予測値との相関を表わすものです。すなわち、さきほどの例では、目的変数である実際の購入額と、重回帰分析式で求めた予測値の相関を表わします。したがって、当然、この重相関係数(rと表わすことが多い)が1に近いほど、重回帰分析モデルが購入額をよく表わしていることになります。

また、この重相関係数(r)の2乗を、決定係数(r2)といいます。決定係数は、基準変数の分散に占める予測値の分散の比率を意味するので、重回帰分析の精度を表す指標としてよく用いられます。

説明変数の選択

実際に重回帰分析を行う場合、説明力が高い少数の説明変数で、適合度の高いモデルができることが理想です。説明変数の選択方法には、

  • 強制投入法(すべての変数を説明変数として重回帰式を作る)
  • 変数増加法(変数のない重回帰式に、新たな変数を追加しては、評価していく)
  • 変数減少法(全変数を入れた重回帰式から、1つずつ変数を減少させて、評価していく)
  • ステップワイズ法(変数増減法)

などがあります。

ステップワイズ法は、最も代表的な説明変数の選択方法で、1つずつ説明変数を、入れたり除いたりしながら、だんだんと効率のよいモデルに近づけていくやり方です。

多重共線性(マルチコ)

重回帰分析で注意すべきことは、本来説明変数間は独立であるべきという仮定です。説明変数A、B間に高い相関関係があると、偏回帰係数の推定精度が極端に落ちます。これを、多重共線性(正確にはマルチコリニアリティ)といいます。いわゆるマルチコは俗称です。多重共線性は、ステップワイズ法の過程で偏回帰係数の符号が次々と逆転することなどによって発見することもありますが、説明変数間の相関行列をもとにCNと呼ばれる指標を求めて発見することができます。

なお、共分散構造分析(SEM)を用いれば、相関の高い変数AとBを一つの潜在変数の測定変数としてモデリングすることで多重共線性の問題を回避できます。

関連コンテンツ

ワンちゃんに対する健康意識からペットオーナーの特徴や意識を紐解く!ペットに関する調査

コロナ禍により私たちの暮らしが変化した影響もあり、生活におけるペットとの接し方や、ペットへの健康意識も変化しています。 今回ご紹介する調査では、ワンちゃんのペットオーナーに焦点を当て、ペットに対する健康意識(居住環境・食 […]

  • 時事・社会
  • エネルギー・住まい
  • ヘルスケア
  • 市場調査レポート
  • 流通・小売・飲食
  • 雑貨・化粧品
  • 食品・飲料
市場調査レポート

データドリブンという罠

「データドリブン」というキーワードは相当浸透してきた。多くの業界で「データドリブン〇〇〇」が語られるようになっている。 しかし、このキーワードの落とし穴の一つに、“すでに持っているデータを起点に、ビジネスやソリューション […]

  • デジタルマーケティング×リサーチ
ナレッジブログ

【ベトナム編】各世代の価値観に影響を与えた政治・社会背景とは

アジアのターゲット市場で消費者調査を行うと、「なぜこういった傾向がみられるのか」と、スコアの解釈への悩みに直面することがあります。その裏には、各国の消費者意識に影響をあたえる「社会背景」「文化背景」等が必ず存在し、海外で […]

  • リサーチャーコラム
コラム

募集中のセミナー

オンデマンド

【大好評につきアーカイブ配信】初心者OK、1日で習得!GA4ブートキャンプ

  • #学習
  • #今すぐ見られる

オンデマンド

ChatGPTの導入による業務効率化とイノベーション ~AIがもたらすビジネス変革~

  • #トレンド
  • #今すぐ見られる

オンデマンド

【15分で解説!】メイク男子ってどんな人?メンズメイクユーザーの特徴を解説!

  • #トレンド
  • #今すぐ見られる

動画配信

マーケティングリサーチ基礎講座

  • #学習

動画配信

マーケティングリサーチ基礎講座(定性調査編)

  • #学習

動画配信

“本当の広告効果”を計測出来ていますか?広告効果測定のキホンから実践まで、教えます

  • #学習

その他のサービス

  • オンラインリサーチ
  • オフラインリサーチ
  • セルフ型アンケート
  • 海外調査
  • デジタル&データマーケティング
  • コンサルティング
  • マーケティングプロモーション
  • ヘルスケアマーケティング

おすすめコンテンツ

ナレッジブログ

マーケティングリサーチ有識者の見解を知る

コラム

マーケティングの基礎を学ぶ

マーケティング用語集

基礎的な用語を身に付ける

市場調査レポート・お役立ち資料

明日から使えるデータと活用術を手に入れる

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします