第7回『集まるデータ』のマーケティング活用術(7) MDSで併買パターンを可視化してみよう

カテゴリー
マーケターコラム

2020/9/10(木)

MDS(多次元尺度構成法)とは

複数のサンプルごとにX座標とY座標が与えられていればそれをXY平面図に表すことができ、さらに各サンプル間の距離を計算することもできる。逆に、サンプル間の距離だけが与えられていた場合、その情報から2次元の図に落としこむために必要な各サンプルの座標を求めるのがMDS(多次元尺度構成法)である。

例えば図1(1)のように、四国4県の県庁所在都市間の距離行列(直線距離)があった場合、これにMDSを適用するとその下の図のように4都市が2次元空間にプロットできる※1。この場合は直線距離なので実際の4都市間の位置関係がほぼ正しい座標で復元できている。図2で、実際の地図上における4都市の位置関係と比較してみると、ほぼ正しく復元できていることがわかるだろう。
一方、図1(2)は鉄道による4都市間の最短距離、図1(3)は高速バスによる4都市間の最短所要時間の距離行列であり、それをもとにMDSで4都市を2次元空間にプロットすると、実際の位置関係とは大きく異なっていることがわかる。実際の4都市は相互の距離がほぼ均一に分布しているが、鉄道や高速バスでは高松と徳島は相対的に非常に近くに配置され、一方松山は実際の位置関係以上に遠くに配置される。高松~徳島は鉄道や高速道路でほぼ直線で結ばれているのに対し、松山~高知間は鉄道や高速バスでは大きく迂回となるため(図2)、実際の距離以上に離れて布置されるのである。
このように何らかのサンプル間の距離行列が得られれば、それらのサンプル間の相対的な位置関係を2次元座標に落とし込め、視覚的にサンプル間の関係の強弱(近さ/遠さ)を把握しやすくできるのがMDSである。

図1

図1

図2

図2

ID-POSデータから併買商品行列を作りMDSで可視化してみよう

マーケティングにおけるMDSの利用は、商品ブランド間の距離を求めポジショニング戦略に活用したり、サービスごとの知覚マップを描いたうえで顧客の選好ベクトルを算出し、顧客はどういうサービスを求めているのかを探るなどがある※2。サンプル間の何らかの距離(必ずしも地理的な距離でなくてもよい)さえ求められれば、その距離行列をもとにサンプルを2次元空間にプロットできるので、可視化の手段としても活用の幅が広い手法である。
今回はID-POSデータから顧客ごとの併買商品※3を集計し、その情報から「どの商品とどの商品が一緒によく買われるのか?」を可視化する例を紹介する。

実際の分析手順は次の通りである。表1の(1)のようなID-POSデータ(約1,000顧客ID、約7,000レシートのスーパーマーケットの架空データ)から、(2)のように顧客ごとに大カテゴリー商品の購入有無を1/0のフラグにして集計する。この(2)から、大カテゴリーの商品ペアごとの併買顧客ID数を集計し、(3)のような表を作成する※4。(3)はまさしく大カテゴリー商品間の距離行列であるが、ここでは「2商品の併買顧客数が多い⇒数字が大きい⇒距離が遠い」となっているため、(4)のように非対角要素は逆数を取って距離の尺度を逆転させる。なぜなら今回MDSで可視化したいのは、「より併買されている商品は距離が近くに、あまり併買されていない商品は距離が遠くに」配置したいからである。
また対角要素はその大カテゴリー商品を購入した顧客の人数であるが、同じ商品間の距離は0とするのが自然なため、0に置き換える。以上のようにして作った(4)の距離行列にMDSを適用させ、2次元に大カテゴリー商品をマッピングすると図3のようになった。

表1 どの商品とどの商品が一緒によく買われるのか?

※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください

表1

図3 どの商品とどの商品が一緒によく買われるのか?

図3

図3を見ると、このスーパーマーケットの顧客の一定期間における大カテゴリー商品間の併買の様子が概観できる。
スーパーマーケットなので、顧客は1回の購入において同時に買わなくても一定期間を通せば様々な商品を買っていると想定されるが(図3の右上の辺りに多くの商品が塊になって[=相対的な距離が近く]配置されている)、酒類だけは他の商品とは遠く離れたところに布置されているので、他の商品はあまり買わないのに酒類だけを買いに来ている顧客が一定数いそうなことが示唆される。このスーパーマーケットを酒屋のように単品店舗と考えて利用している顧客であろうか。また水産品もその傾向があり、「魚だけこのスーパーマーケットに買いに来る」という顧客もいそうである。この店舗の魚は評判がいいのか、周辺に専門店がないのか、深堀りしてみると理由が見えてくるかもしれない。

このようにID-POSデータから併買をわかりやすくMDSで可視化することで、店舗の品ぞろえや棚配置検討、顧客へのキャンペーン企画などに活用可能である。
またID-POSに限らず、Web閲覧ページの履歴から顧客ごとのページ閲覧有無を集計し、ページ間の同時閲覧の距離行列を作るなど、eコマースサイトなどでも同様の分析が可能である。併買パターンを明らかにする手法はアソシエーション分析※5などが良く使われクロスセルなどに応用されるが、個々のルールではなく全体としての傾向を可視化できるMDSは、集まるデータから知見を引き出す最初の1歩としてぜひ利用してもらいたい。

※1:MDSでは距離行列を3次元空間などに落とし込む(圧縮)こともできるが、多くの場合は視覚的な見やすさ・解釈のしやすさを重視し、2次元(XY座標)に落とし込むのが一般的である。

※2:知覚マップや選好ベクトルの事例は、里洋平「Rによるマーケティング分析」(『データサイエンティスト養成読本』技術評論社,2013,p90~101)などを参照。

※3:併買には「同時購買」(レシート単位で集計)と「期間併買」(一定期間の顧客ID単位で集計)の2つがあるが、今回の事例は「期間併買」を集計するものである。

※4:表1の(2)の集計表から(3)の距離行列を作るのは、行列計算を使えば簡単にできる。

図5 行列計算

※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください

図5 行列計算

※5:アソシエーション分析については、本連載の第1回、※4を参照。

渋谷直正著 連載『集まるデータ』のマーケティング活用術

著者の紹介

渋谷直正

渋谷 直正

株式会社デジタルガレージ 執行役員 CDO(チーフデータオフィサー)
2002年に日本航空株式会社に入社。JALホームページのログ解析や顧客情報分析、航空券などのレコメンド施策の立案・企画・実施を担当。2014年、日経情報ストラテジー誌による「データサイエンティスト・オブ・ザ・イヤー」受賞。2019年より現職、デジタルガレージグループでのデータ活用を統括・推進する。ビジネスアナリティクスや実務に役立つ分析手法に詳しく、データを使ったマーケティングを得意とする。総務省統計局講座や大学での講演・記事掲載など多数。

著者の人気記事

カテゴリー

アクセスランキング

コラムランキング

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします

おすすめコンテンツ

ナレッジブログ

マーケティングリサーチ有識者の見解を知る

コラム

マーケティングの基礎を学ぶ

マーケティング用語集

基礎的な用語を身に付ける

市場調査レポート・お役立ち資料

明日から使えるデータと活用術を手に入れる

メールマガジン

マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします