DATA & INSIGHTS
マーケターコラム
一覧へ

『集まるデータ』のマーケティング活用術(5)
購買/訪問の間隔やパターンを分析してみよう

RFMをさらに進化させる訪問月パターンの集計

集まるデータの代表格であるID-POSやWebログデータにRFM分析をかけることはマーケティングの世界でよく行われる。顧客ごとにR(期間中の直近の購買・訪問日)、F(期間中の購買・訪問総回数)、M(期間中の総購入金額)の値を算出し、いくつかのセグメントに分けることで、効率的なマーケティング施策を行おうとするものである。単純な集計のみでできる便利な手法であるが、特にRとFについては集計元データにすべての購買日(訪問日)の情報があるにもかかわらず、全体の回数と最終購買日(訪問日)の日付しか利用しないため、顧客の購買・訪問パターンを見逃す可能性がある。例えば、同じRとFの値であった場合、毎月コンスタントに訪問している人と、ある1つの月だけに集中して訪問している人の違いを見分けることができない。

そこで、図1のように、顧客ごとに月ごとの訪問回数をカウントし、何回訪問していようがその月に訪問していれば1、していなければ0として、訪問している月の数を集計してみるとよい。このようにして集計した訪問した月の数(1~12)とF(総訪問回数)によって顧客数をカウントしたクロス集計表を作ることができる。これを見ると、同じF値であってもまんべんなく毎月訪問している顧客か、ある特定の月だけに訪問が集中している顧客かの判別が付けられるようになり、より実態を反映したセグメントに利用できるようになるだろう。

図1 その月に何回訪問があっても1回でもあれば1なければ0

image1

View larger image
image1

To return to the previous page, click on the part of the window where the image is not displayed, or press the close button.

顧客の様々な購買・訪問のパターンを区別できるか?

顧客の購買や訪問間隔について、さらに詳細な分析ができないだろうか?そこで図2のようにある1年間における7人の顧客の訪問履歴をもとに考えてみよう*1

顧客「ア」~「カ」の6人はいずれも1年間の訪問回数(F)が6回であり、そのうち顧客「ア」~「オ」の5人は最終訪問日(R)も2019年11月1日で 同一である。つまりこの5人は最終訪問日(R)と訪問回数(F)が全く同じであるため(期間中の総購入金額(M)も同じと仮定した場合)RFM分析では同一の指標値となるが、その訪問パターンの様子はずいぶん異なることがわかるだろう。顧客「ア」と「エ」は等間隔に定期的な訪問パターンであるが、顧客「イ」「ウ」「オ」はある一定期間に集中して訪問している。これらをRFM指標以外で区別しようとすると、例えば期間中の最初の訪問日から最終訪問日までの日数を調べたり、その日数を訪問回数(今回の場合はいずれも6回)で割ることでの平均訪問間隔(日数)を算出したりすることがすぐに頭に浮かぶかもしれない。それらを使うことで顧客「ウ」と「エ」は区別することができそうだが、依然として顧客「ア」「イ」「オ」はそれらも同じ値を取るため判別することはできない。しかし顧客「ア」「イ」「オ」がその訪問パターンにおいて同一とは言えないのは明らかだろう。

図2 A~Gの7人の顧客の訪問パターンと各指標

図2 7人の顧客(ア~キ)の訪問パターンと各指標

View larger image
image2

To return to the previous page, click on the part of the window where the image is not displayed, or press the close button.

購買・訪問間隔の不均一性を測る「クランピネス指標」

そこで、どれだけ集中して購買や訪問がされたかを測る指標として近年開発された「クランピネス指標(Clumpiness)」を紹介しよう*2。この指標は購買や訪問が等間隔でなされる場合は最小値となり、逆にそれが集中して発生し塊をもってなされる場合は値が大きくなるように算出されるものである。ただしこの指標は期間中の総購買回数や訪問回数(F)が異なる顧客同士の比較は同じ水準でできない。よって利用する際は下記の2つの手順を踏むことになる※3

  1. 各顧客における訪問回数(F)とクランピネス指標(Hp)を算出する
  2. 訪問回数(F)ごとに異なる臨界値※4を算出し、1で算出した顧客ごとのHp値と比較して、クランピネス性があるか否かの判定を行う

このようにして先ほどの「ア」~「キ」の7人の顧客について、それぞれHp値とクランピネス性判定の臨界値を算出したものを図2の右側に記載した。顧客「ア」~「キ」は同じF値であるため、Hp値の大小を比較することでクランピネスの大小を測ることが可能だが、どれくらいの値以上であれば「クランピネス性がある」と言えるのかは、臨界値と比較することで判断する。その結果、顧客「イ」「ウ」「オ」「カ」については訪問間隔に塊があり、ランダムに6回訪問したとしたら得られたであろう訪問間隔のばらつきからは著しくかけ離れて(=5%以下の確率でしか発生しない)塊をもっている。つまりクランピネス性がある訪問パターンである、と判定された。実際の訪問日の分布をみてみるとこの結果は極めて妥当だと言えるだろう。一方顧客「キ」については訪問回数(F)が11回と顧客「ア」~「カ」とはFが異なるため、単純にHp値を比較することはできないが、同様に臨界値を算出し判定することで、顧客「キ」はクランピネス性がないと判断される。この結果も異論はないだろう。

このようにクランピネス指標を利用することで、顧客の購入・訪問日履歴のデータから、まとまって集中的に訪問するのか、比較的等間隔にまんべんなく訪問するのかの特徴を顧客ごとに判別することが可能になる。顧客の訪問や購買のクランピネス性に注目することは、特に定期的には訪問していない顧客であっても、ある一定の時期に急に訪問頻度が高まることが大量・高額購買のきっかけになっていることをつかんだり、逆に離反の前兆行動を知ったりすることにつながるかもしれない※5。また顧客ごとの購買確率予測モデルを作る際の説明変数としても高い寄与を示す可能性もある。購買日や訪問日の情報はマーケティング上重要なファクターであるので、積極的に利用していくべきだろう。

※1:なおここでは同一日に複数回の訪問があったとしても、1回としてカウントするものとする。

※2:クランピネス指標や本稿の内容については中山雄司(甲南経営研究 第57巻第2号2016)の論文を参考にしている。

※3:1のHp算出の数式や2のシミュレーションの方法については、中山(2016)にRのコードとともに詳細に記されているので詳しくはそちらを参照のこと。なお筆者が知る限り通常の分析ソフトウエアで1や2を計算できる既存のパッケージはないようなので、中山(2016)のコードなどを参考に自作する必要がある。

※4:ここでの臨界値は、N=365、M=10,000のシミュレーションにおいて上位5%以上(α=0.05)となる境界の値である。なお参考として、筆者が算出したN=365(1年間)、N=183(半年間)、N=91(3か月間)の場合のFごとのα=0.05の臨界値(M=10,000)を図3に掲載しておく。

図3 訪問回数ごとのクランピネス性の臨界値(α=0.05、M=10,000)

図3 訪問回数ごとのクランピネス性の臨界値(α=0.05、M=10,000)

View larger image
図3

To return to the previous page, click on the part of the window where the image is not displayed, or press the close button.

※5:星野崇宏・上田雅夫『マーケティング・リサーチ入門』(2018、有斐閣)P217においても、RFMにClumpinessを加えたRFMC分析の必要性が述べられている。

渋谷直正
渋谷直正
株式会社デジタルガレージ 執行役員 CDO(チーフデータオフィサー)
2002年に日本航空株式会社に入社。JALホームページのログ解析や顧客情報分析、航空券などのレコメンド施策の立案・企画・実施を担当。2014年、日経情報ストラテジー誌による「データサイエンティスト・オブ・ザ・イヤー」受賞。2019年より現職、デジタルガレージグループでのデータ活用を統括・推進する。ビジネスアナリティクスや実務に役立つ分析手法に詳しく、データを使ったマーケティングを得意とする。総務省統計局講座や大学での講演・記事掲載など多数。

お客さまの課題・ニーズを伺ってリサーチの企画・提案を行います。
お気軽にお問い合わせください。

関連コンテンツ