DATA & INSIGHTS
マーケターコラム
一覧へ

『集まるデータ』のマーケティング活用術(1)
ホワイトボックスのAIがマーケティング・インサイトを浮き彫りにする

  • このエントリーをはてなブックマークに追加

「集まるデータ」の活用が企業のマーケティングを進化させる

データからマーケティングのインサイトを得て実際の施策に役立てることはマーケターにとって必須の業務であるが、マーケティングリサーチに代表される「集めるデータ」だけでなく、企業内に存在している業務データやIoTデータなどの「集まるデータ」の活用はより重要度を増してきている。しかし「集まるデータ」は分析やマーケティング目的に収集されておらず、多くの場合でビッグデータとなるため、目的をもって主体的に収集する「集めるデータ」に比べると取り扱いが難しい。だいぶ安くなってきたとはいえデータは保管しておくだけでもコストがかかるので、そのまま何もせずに「お荷物」にしてしまうのか、分析してマーケティングに活用して「お宝」にするのか、その取り組みの差が企業のマーケティング活動の明暗を分けることになる。

「集まるデータ」と「集めるデータ」の特徴は表の通りである※1。そのままでは食べられない乾燥昆布やシイタケもうまく調理すれば美味しい出汁が出てくるように、特にビッグデータになりやすい「集まるデータ」は、適切に加工して分析にかけることで従来のデータでは明らかにできなかった事象をも浮かび上がらせることができる。この連載では主に「集まるデータ」に焦点をあて、それに適切な分析を施すことでマーケティング上の有益な知見やヒント、施策につながる事実の発見を引き出せることを紹介していきたいと思う。

「集まるデータ」と「集めるデータ」の特徴
画像を大きなサイズでみる
「集まるデータ」と「集めるデータ」の特徴

※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください

ホワイトボックスのAIがマーケティング・インサイトを浮き彫りにする

昨今は空前のAIブームであるが、個人的にはマーケティングの分析では使いづらいと感じていた。それはAIのアウトプットの背景がブラックボックスだからである※2。結果が当たればいいという状況はもちろんあるが、やはり「なぜか?」という疑問とそれに対する説明責任がマーケティングでは求められる。AIが出力した見込み顧客のリストだけでも施策は実施できるが、上司から「このリストはどういう特徴を持った顧客なのか?」と問われても「AIがそう言っています。ロジックはわかりません。」では通用しない。ロジックや知見のないマーケティング活動は単純なオペレーション作業に過ぎず、マーケターのやる仕事ではない。AIに頼ることは自らの存在を否定することにつながらないだろうか、という思いがAIを私から遠ざけていた。

そんななかで2017年春に、ローデータからマーケティングに有益なインサイトを得るために活用できるポテンシャルを秘めたdotData※3という出色のツールに出会った。

このツールのすごさは、

  1. ローデータを読み込ませるだけで予測に効く特徴量(説明変数)を自動的に生成する
  2. 予測に効いている特徴量を人間がわかる形で出力する(ホワイトボックス型のAI)

という2点である。

データ分析で一番難しいのはモデリングプロセスではなく、予測したい対象に対して影響するであろう特徴量を見つけ出すことである。それには業務をよく知るマーケターや現場担当者が筋のいい仮説をいくつ出せるかが何よりも重要である。加えて大量のデータの中からそれらの仮説を裏付けるであろう変数をマーケターや分析者が自ら作り出す作業は、とてつもないパワーと時間を要するものになる。このハードルが「集まるデータ」のマーケティングへの活用を阻害している大きな要因であるが、まさにこの部分にAIを使おうというのがdotDataの発想なのだ。

AIを使ってID-POSデータからある商品Aを購入する顧客の特徴をあぶりだす

わかりやすいように、ある小売企業が保有しているID-POSのローデータにこのAIを適用するとどんな結果が得られるのか具体例で紹介しよう(説明用の架空事例)。ここでは小売業=ID-POSデータであるが、Eコマースサイト=Webログデータでも、航空会社=会員搭乗履歴でも同じである。自分の会社が保有している「集まるデータ」をそのままこのAIにかけるとどうなるかをイメージしていただければよいだろう。

図はID-POSデータとある商品Aを購入した顧客IDのリストをAIにかけた出力結果である。ある商品Aを購入する顧客の購買パターン(特徴量)がそのウエイトとともに出力される。

ポイントは、

  1. AIの解析結果であるが人間にもわかる形で特徴量が示されている
  2. 特徴量が時間軸とミックスされて作られている

という点だ。

特に2についてはよく使われるアソシエーション分析※4では導出するのが難しい。時間×曜日×カテゴリの組み合わせは膨大であるし、直近1週間や、過去半年前~3カ月前などの期間の区切り方は無数にあるため、これらの特徴量をすべて作るのは非現実的であるから、たいていは分析者の仮説をもとに特徴量を分析にかける前に設計する必要がある。しかしこのAIを使うとそうした仮説を持たずとも、「集まるデータ」から特徴量を抽出できる点が優れている。今回はID-POSだけを利用したが、顧客IDで紐づく顧客属性のマスターデータなど他のデータをかけ合わせて分析することも可能だ。その場合は「直近1週間にタバコを10時台に多く購入する30代の男性」などの特徴量が生成されることになる。加えて商品Aを購入するより前の一定期間に区切った履歴だけを見て特徴量を作る(商品Aの購入後の履歴は無視)なども、手作業でやるのは大変骨が折れる作業だが、このAIはそれも自動で探索する優れものだ。こうした手間のかかる特徴量生成作業にこそAIを活用すべきで、人間の仮説に限界がある中、思いもしなかったパターンをデータから発見できる可能性も開けるだろう。

ID-POSデータとある商品Aを購入した顧客IDのリストをAIにかけた出力結果

画像を大きなサイズでみる
ID-POSデータとある商品Aを購入した顧客IDのリストをAIにかけた出力結果

※前のページへ戻るには、ウィンドウの画像が表示されていない部分をクリックするか、閉じるボタンを押してください

※1:「集まるデータ」「集めるデータ」については、星野・上田『マーケティング・リサーチ入門』(2018年)の第2章が詳しい。

※2:計算上のロジックはもちろんあるが、それを人間が目で見て理解できる形になって表れてこない、ということである。また目に見える形であったとしても、例えば「年齢を5.6乗してそれに19.7をかけた数値の絶対値の大きさが、ツナのおにぎりを買うことに0.73のウエイトで貢献している」と言われても、何のことだか理解不能である。数学的には正しくても。

※3:当時は製品発売前で名前も付いていなかった。
詳しくは、dotData公式WebサイトまたはdotDataサービス紹介ページ(NEC)

※4:ID-POSデータなどから「ある商品A」と「ある商品B」が同時に購入されるパターンや確率を探索する分析手法。あるスーパーで「おむつと缶ビールが一緒に買われる」ことを発見した例で有名。

  • このエントリーをはてなブックマークに追加
渋谷直正
渋谷直正
株式会社デジタルガレージ CDO(チーフデータオフィサー)
2002年に日本航空株式会社に入社。JALホームページのログ解析や顧客情報分析、航空券などのレコメンド施策の立案・企画・実施を担当。2014年、日経情報ストラテジー誌による「データサイエンティスト・オブ・ザ・イヤー」受賞。2019年より現職、デジタルガレージグループでのデータ活用を統括・推進する。ビジネスアナリティクスや実務に役立つ分析手法に詳しく、データを使ったマーケティングを得意とする。総務省統計局講座や大学での講演・記事掲載など多数。

お客さまの課題・ニーズを伺ってリサーチの企画・提案を行います。
お気軽にお問い合わせください。

関連コンテンツ