
MDS(多次元尺度構成法)とは
複数のサンプルごとにX座標とY座標が与えられていればそれをXY平面図に表すことができ、さらに各サンプル間の距離を計算することもできる。逆に、サンプル間の距離だけが与えられていた場合、その情報から2次元の図に落としこむために必要な各サンプルの座標を求めるのがMDS(多次元尺度構成法)である。 例えば図1(1)のように、四国4県の県庁所在都市間の距離行列(直線距離)があった場合、これにMDSを適用するとその下の図のように4都市が2次元空間にプロットできる※1。この場合は直線距離なので実際の4都市間の位置関係がほぼ正しい座標で復元できている。図2で、実際の地図上における4都市の位置関係と比較してみると、ほぼ正しく復元できていることがわかるだろう。 一方、図1(2)は鉄道による4都市間の最短距離、図1(3)は高速バスによる4都市間の最短所要時間の距離行列であり、それをもとにMDSで4都市を2次元空間にプロットすると、実際の位置関係とは大きく異なっていることがわかる。実際の4都市は相互の距離がほぼ均一に分布しているが、鉄道や高速バスでは高松と徳島は相対的に非常に近くに配置され、一方松山は実際の位置関係以上に遠くに配置される。高松~徳島は鉄道や高速道路でほぼ直線で結ばれているのに対し、松山~高知間は鉄道や高速バスでは大きく迂回となるため(図2)、実際の距離以上に離れて布置されるのである。 このように何らかのサンプル間の距離行列が得られれば、それらのサンプル間の相対的な位置関係を2次元座標に落とし込め、視覚的にサンプル間の関係の強弱(近さ/遠さ)を把握しやすくできるのがMDSである。
図1

図2
ID-POSデータから併買商品行列を作りMDSで可視化してみよう
マーケティングにおけるMDSの利用は、商品ブランド間の距離を求めポジショニング戦略に活用したり、サービスごとの知覚マップを描いたうえで顧客の選好ベクトルを算出し、顧客はどういうサービスを求めているのかを探るなどがある※2。サンプル間の何らかの距離(必ずしも地理的な距離でなくてもよい)さえ求められれば、その距離行列をもとにサンプルを2次元空間にプロットできるので、可視化の手段としても活用の幅が広い手法である。 今回はID-POSデータから顧客ごとの併買商品※3を集計し、その情報から「どの商品とどの商品が一緒によく買われるのか?」を可視化する例を紹介する。 実際の分析手順は次の通りである。表1の(1)のようなID-POSデータ(約1,000顧客ID、約7,000レシートのスーパーマーケットの架空データ)から、(2)のように顧客ごとに大カテゴリー商品の購入有無を1/0のフラグにして集計する。この(2)から、大カテゴリーの商品ペアごとの併買顧客ID数を集計し、(3)のような表を作成する※4。(3)はまさしく大カテゴリー商品間の距離行列であるが、ここでは「2商品の併買顧客数が多い⇒数字が大きい⇒距離が遠い」となっているため、(4)のように非対角要素は逆数を取って距離の尺度を逆転させる。なぜなら今回MDSで可視化したいのは、「より併買されている商品は距離が近くに、あまり併買されていない商品は距離が遠くに」配置したいからである。 また対角要素はその大カテゴリー商品を購入した顧客の人数であるが、同じ商品間の距離は0とするのが自然なため、0に置き換える。以上のようにして作った(4)の距離行列にMDSを適用させ、2次元に大カテゴリー商品をマッピングすると図3のようになった。

※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください
表1

図3
※1:MDSでは距離行列を3次元空間などに落とし込む(圧縮)こともできるが、多くの場合は視覚的な見やすさ・解釈のしやすさを重視し、2次元(XY座標)に落とし込むのが一般的である。
※2:知覚マップや選好ベクトルの事例は、里洋平「Rによるマーケティング分析」(『データサイエンティスト養成読本』技術評論社,2013,p90~101)などを参照。
※3:併買には「同時購買」(レシート単位で集計)と「期間併買」(一定期間の顧客ID単位で集計)の2つがあるが、今回の事例は「期間併買」を集計するものである。
※4:表1の(2)の集計表から(3)の距離行列を作るのは、行列計算を使えば簡単にできる。


※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください
図5 行列計算
※5:アソシエーション分析については、本連載の第1回、※4を参照。
渋谷直正著 連載『集まるデータ』のマーケティング活用術
著者の紹介

渋谷 直正
株式会社デジタルガレージ 執行役員 CDO(チーフデータオフィサー)
2002年に日本航空株式会社に入社。JALホームページのログ解析や顧客情報分析、航空券などのレコメンド施策の立案・企画・実施を担当。2014年、日経情報ストラテジー誌による「データサイエンティスト・オブ・ザ・イヤー」受賞。2019年より現職、デジタルガレージグループでのデータ活用を統括・推進する。ビジネスアナリティクスや実務に役立つ分析手法に詳しく、データを使ったマーケティングを得意とする。総務省統計局講座や大学での講演・記事掲載など多数。
著者の人気記事
カテゴリー
アクセスランキング
コラムランキング
メールマガジン
マーケティングに関するホットな話題やセミナーなどの最新情報をお届けします