回帰分析

回帰分析のモデルと基本式

1つ(単回帰分析)または複数(重回帰分析)の説明変数と、1つの目的変数の関係を求め、説明変数から目的変数を推定します。

回帰分析のモデルと基本式
Y=定数+b1X1+b2X2+・・・+bpXp+誤差

回帰分析の例

例としてある店の顧客に対する販売実績と、顧客の属性の関係を分析します。目的変数として、ある年の各顧客の購入額をとります。説明変数として、顧客の属性(年齢、性別、家族人数、年収など)を用いることとします。すなわち、

購入額=定数+ a ×(年齢)+ b ×(性別)+ c ×(家族人数)+ d ×(年収)+(誤差)

※性別などの名義尺度は数量として扱えないため、男性=1、女性=0といったダミー変数を与えて分析します。

という式において、a,b,c,d(これを偏回帰係数といいます)の値と定数を推定します。求め方は、最小二乗法または最尤法が用いられますがその理論の説明は省略します。その結果、求められた式、例えば、

購入額の予測値=5,000+30×(年齢)+300×(性別)+450×(家族人数)+0.001×(年収)

などという関係式が得られるのです。これを回帰方程式と呼びます。この式に新しい顧客の属性データを入れれば、購入額が推定できるというのが、重回帰分析の考え方です。

一方、この関係式において、説明変数(属性)が、購入額(目的変数)に対しておよぼす影響の大きさを知りたいということがよくあります。上の関係式では、年齢や年収は単位が違います。したがって年齢の項の偏回帰係数30と年収の項の偏回帰係数0.001は直接比較できません。そこで、あらかじめ説明変数を平均0、分散1に標準化()しておくと、単位が同一の条件下で分析できます。

このように、説明変数を標準化して求めた偏回帰係数を標準偏回帰係数といい、この標準偏回帰係数の大きさで、説明変数の説明力(目的変数への影響の大きさ)を比較できます。ただし何%のウェイトを持つというような、数量的な評価はこのままではできません。

回帰分析モデルの評価

重相関係数と決定係数

重相関係数とは、1つの目的変数と、その予測値との相関を表わすものです。すなわち、さきほどの例では、目的変数である実際の購入額と、重回帰分析式で求めた予測値の相関を表わします。したがって、当然、この重相関係数(rと表わすことが多い)が1に近いほど、重回帰分析モデルが購入額をよく表わしていることになります。

また、この重相関係数(r)の2乗を、決定係数(r2)といいます。決定係数は、基準変数の分散に占める予測値の分散の比率を意味するので、重回帰分析の精度を表す指標としてよく用いられます。

説明変数の選択

実際に重回帰分析を行う場合、説明力が高い少数の説明変数で、適合度の高いモデルができることが理想です。説明変数の選択方法には、

  • 強制投入法(すべての変数を説明変数として重回帰式を作る)
  • 変数増加法(変数のない重回帰式に、新たな変数を追加しては、評価していく)
  • 変数減少法(全変数を入れた重回帰式から、1つずつ変数を減少させて、評価していく)
  • ステップワイズ法(変数増減法)

などがあります。

ステップワイズ法は、最も代表的な説明変数の選択方法で、1つずつ説明変数を、入れたり除いたりしながら、だんだんと効率のよいモデルに近づけていくやり方です。

多重共線性(マルチコ)

重回帰分析で注意すべきことは、本来説明変数間は独立であるべきという仮定です。説明変数A、B間に高い相関関係があると、偏回帰係数の推定精度が極端に落ちます。これを、多重共線性(正確にはマルチコリニアリティ)といいます。いわゆるマルチコは俗称です。多重共線性は、ステップワイズ法の過程で偏回帰係数の符号が次々と逆転することなどによって発見することもありますが、説明変数間の相関行列をもとにCNと呼ばれる指標を求めて発見することができます。

なお、共分散構造分析(SEM)を用いれば、相関の高い変数AとBを一つの潜在変数の測定変数としてモデリングすることで多重共線性の問題を回避できます。

関連コンテンツ

今後の旅行で何を体験したい?調査レポート!(2023年2月実施)

分析結果によると、「温泉」が単語として最も多く挙げられた。
ランキング2位以降の複数のワードを総合すると、"食べる事"に関するワードが最多!
男女別マップでは、男性のほうが「体験したいこと」をより具体的にイメージしている傾向が見られた。

  • 旅行・観光・運輸
市場調査レポート

新時代のマスメディア「TikTok」解体新書

新たな動画配信プラットフォームとして急激な成長を遂げているTikTok。 2021年9月に月間利用者数が10億人を突破したことがTikTokより発表され、国内ではTikTokで紹介された商品やコンテンツが爆発的に拡散しヒ […]

  • エンターテインメント・サービス
  • 市場調査レポート
  • 情報・通信
市場調査レポート

No.1表示広告は「事実に基づくべき」が8割。購買意欲に影響するも、効果は減退傾向

テレビCM やWeb広告などでたびたび目にする「No.1」「ランキング1位」「業界トップ」などを謳った広告について、消費者はどのように感じているのでしょうか。 昨今、一部の企業による恣意的な調査によって不当な「No.1」 […]

  • 時事・社会
  • 市場調査レポート
  • 広告
市場調査レポート

募集中のセミナー

オンデマンド

【10分で解説!】「TikTok」の利用時間は増えている?アプリログデータから利用動態を解説!

  • #トレンド
  • #今すぐ見られる

オンデマンド

【10分で解説!】VTuberブームの裏側、視聴者のリアルな姿を分析!!

  • #トレンド
  • #今すぐ見られる

オンデマンド

【15分で解説!】「仮想通貨保有者」は情報マニア!?仮想通貨保有者のプロファイルを解説!

  • #トレンド
  • #今すぐ見られる

動画配信

有意差・サンプルサイズの考え方から、相関分析・回帰分析・クラスタ分析まで一挙解説!マーケティング・リサーチ基礎講座 <統計・多変量解析編>

  • #学習

動画配信

海外市場開拓のためのカラーマーケティング

  • #トレンド

生放送

データ分析と有識者からアジア市場のインサイトを考える-Asia Market Masterclass-

  • #事例
  • #トレンド

動画配信

マーケティングリサーチ基礎講座

  • #学習

動画配信

マーケティングリサーチ基礎講座(定性調査編)

  • #学習

その他のサービス

  • オンラインリサーチ
  • オフラインリサーチ
  • セルフ型アンケート
  • 海外調査
  • デジタル&データマーケティング
  • コンサルティング
  • マーケティングプロモーション
  • ヘルスケアマーケティング

おすすめコンテンツ

ナレッジブログ

マーケティングリサーチ有識者の見解を知る

コラム

マーケティングの基礎を学ぶ

マーケティング用語集

基礎的な用語を身に付ける

市場調査レポート・お役立ち資料

明日から使えるデータと活用術を手に入れる

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします