データ分析

そのクーポン実は解約届かも? データで見抜くアップリフトモデリング入門

そのクーポン実は解約届かも? データで見抜くアップリフトモデリング入門

こんな方におすすめ

  • 離脱防止やLTV改善の施策を打っているが、効果が頭打ちだと感じている方
  • クーポンやキャンペーンの「反応率」は追っているが、本当に利益に繋がっているか不安な方
  • データ分析の結果を施策に落とし込む方法を探している経営者・事業責任者

Before:施策の「反応率」は測っているが、誰に効いて誰に逆効果だったかは分からない。全員に同じアプローチをしている

After:顧客を4タイプに分けて考える視点が身につき、「打つべき相手」と「そっとしておくべき相手」の見極め方が分かる


「離脱防止のために、休眠顧客へクーポンを配布しよう」 「LTV向上のために、定期的にメルマガを送ろう」

こうした施策、多くの企業で当たり前のように行われていますよね。でも実は、良かれと思って打っているその施策が利益を削っているだけでなく、一部の顧客にとっては「解約の引き金」になっている可能性があります。

多くのマーケティング現場では、施策の「反応率(CVR)」を追いかけていても、「本当に利益を生んだのかどうか(増分)」までは追えていません。

この記事では、データサイエンスの分野で注目される「アップリフトモデリング」の考え方をビジネス文脈で紹介します。技術的な実装の話ではなく、「アプローチすべき顧客」と「そっとしておくべき顧客」をどう見極めるかという、意思決定の視点に役立つ観点で解説していきます。

「効いた」の中身を疑ってみよう

A/Bテストで「効果あり」と判定された施策があったとします。

たとえば、クーポンを配ったグループの購買率が5%から7%に上がった。「2ポイント改善した!」と喜びたくなりますが、ここでちょっと立ち止まってみてください。

その「7%の購買者」は、全員がクーポンのおかげで買ったのでしょうか?

実は、クーポンがあったから買う決心をした人と、クーポンがなくても定価で買っていた人が混ざっています。もし購入者の大半が後者だったとしたら、本来得られたはずの定価分の利益を、自分たちの手で削っていることになってしまいます。

しかも、もう一つ見落としがちなことがあります。クーポンが送られてきたこと自体が引き金になって、「しつこいな」と離脱した人が隠れている可能性です。平均値だけを見ていると、こうした見えない損失に気づくことは難しいです。

顧客が持っている「4つの顔」

因果推論の分野では、施策に対する反応の違いによって、顧客を4つのタイプに分けて考えます。この分類を知っておくだけでも、施策の設計がかなり変わってくるはずです。

説得可能層(Persuadables)

背中を押せば動く層です。施策があれば買うけど、なければ買わない。マーケティング予算を本来集中させるべきは、この層です。

確実層(Sure Things)

放っておいても買ってくれるロイヤル顧客です。ありがたい存在ですが、ここにバラマキ型のクーポンを渡しても「値引きしなくても買っていた利益」を失うだけ。感謝を伝えることは大事ですが、過剰なインセンティブは利益を圧迫します。

無関心層(Lost Causes)

何をしても響かない層です。コストをかけるほど赤字が膨らむので、施策の対象から外す判断が必要です。

離反予備軍(Sleeping Dogs)

罠というか、一番やっかいな層です。そっとしておけば継続してくれたのに、DMやメルマガを送ったことで「しつこい」「売り込みが激しい」と感じて、かえって離れてしまう層。いわば「寝た子を起こしてしまう」パターンです。

従来の分析だと「説得可能層」と「確実層」が混ざって「効果あり」と判定されがちですし、「離反予備軍」の存在は平均値の中に埋もれてしまいます。本当に利益を残すには、「説得可能層」だけを狙い撃ちし、「確実層」への無駄打ちと、「離反予備軍」への逆効果を同時に排除する必要があります。

アップリフトモデリングという発想

この4タイプをどうやって見分けるのか。ここで出てくるのがアップリフトモデリングという考え方です。

従来のAI予測モデルは、「(施策の有無に関係なく)買ってくれそうな人は誰か」を予測するものでした。これだと「確実層」ばかりが上位に来てしまいます。

アップリフトモデリングが見ているのは、そこではありません。「施策をした場合」と「しなかった場合」の購買確率の差(リフト値)を、個人ごとに予測します。

例を挙げてみましょう。

Aさんは、クーポンありなら購買率80%、なしでも70%。差は+10%。もともと買う気がある「確実層」に近い顧客です。Bさんは、クーポンありなら60%、なしだと10%。差は+50%。クーポンがあることで大きく気持ちが動く「説得可能層」な顧客です。

この変化の幅に注目することで、買ってくれそうな人ではなく、施策によって行動が変わる人だけを見つけることができます。

「もしも」の世界を計算するカラクリ

とはいえ、差を予測すると言われても、一人の人間に施策を打った結果と打たなかった結果を同時に見ることはできませんよね。では具体的にどうやってその差分を弾き出すのか。フィットネスジムの退会防止メールを例に、もう少し踏み込んで説明します。

まず、過去にランダムにメールを送ったときのデータを使って、2種類の異なるAI(予測モデル)を作ります。一つは、メールを送った人たちだけのデータで学習させたモデル。もう一つは、メールを送らなかった人たちだけのデータで学習させたモデルです。前者は「メールが来ると、こういう属性の人は何%の確率で継続する」ということを覚えていて、後者は「何もしなくても、こういう属性の人は何%の確率で継続する」んだということを覚えています。

ここに、最近ジムに来ていない会員の佐藤さんがいるとします。佐藤さんのデータ(年齢、来店頻度、過去の利用履歴など)を、この2つのモデルに同時に入力してみます。

すると、それぞれのもしもの世界での予測が出てきます。メールを送った場合の継続率は90%、送らなかった場合の継続率は85%。差は+5%。佐藤さんはメールを送っても送らなくてもほぼ続けてくれる人なので、わざわざメールを送るコストが無駄になる「確実層」だと判定できます。

一方、別の会員の鈴木さんを同じように分析してみると、面白いことが起きます。メールありの継続率は40%、メールなしの継続率は70%。差は−30%。メールを送った方が、継続率が大きく下がってしまうのです。

鈴木さんは、そっとしておけば7割の確率で続けてくれたのに、メールが来たことで「あ、退会するの忘れてた」と思い出してしまうタイプ。これがデータから浮かび上がる「離反予備軍(Sleeping Dogs)」の正体です。

このように、「メールありの世界」と「メールなしの世界」をそれぞれのモデルでシミュレーションし、その差分を一人ひとりに対して計算することで、初めて誰に送るべきで、誰をそっとしておくべきかが見えてきます。

※本記事で解説しているアップリフトモデルは「施策がアウトカム(結果)に与える因果効果」を、ユーザー属性Xで条件づけて推定する考え方です。因果推論の文脈では Conditional Average Treatment Effect(CATE)とほぼ同型の概念として扱います。

データが教えてくれないインサイトを掘るには?

ここまでの話は、データ分析で誰に施策を打つべきか、を見極める方法でした。実務で使うには、で、どうするの...となりますよね。

たとえば、モデルの結果から「この顧客群は離反予備軍(Sleeping Dogs)の傾向が強い」と分かったとします。でも、なぜその人たちは施策で離れてしまうのか? ここはデータだけでは見えてきません。

メールの配信頻度が多すぎたのか。お勧めされた商品がまったく的外れだったのか。そもそも企業から売り込まれること自体が嫌だったのか。同じ「離反予備軍」でも、理由が違えば打ち手もまったく変わります。

私たちKumonoでは、こういう場面でN1インタビュー(定性調査)を組み合わせます。

あるサブスクリプションサービスの例では、休眠顧客へのクーポン施策後にかえって解約が増えたケースがありました。データ上は「施策が逆効果だった」としか読めません。しかし実際にインタビューを行うと、「もう使わないと決めていたのに、メールが来て退会手続きを思い出した」という声が複数出てきたのです。

問題はクーポンの内容ではなく、「すでに離脱を決めていた人に接触してしまったこと自体」だった。この文脈が分かれば、次に取るべきアクションはクーポンの内容を変えることではなく、「接触対象の絞り込みを見直す」ことになります。

データで「誰に(Who)」を特定し、N1インタビューで「なぜ・どのように(Why / How)」を深掘りする。この組み合わせで初めて、顧客にとって心地よい距離感を保ちながら関係を続ける方法が見えてきます。

解約理由の調査でアンケートよりもインタビューが有効な理由については、「解約理由をアンケートで聞かない方がいい理由」で詳しく書いています。また、解約した顧客だけでなく「続けている顧客」に聞くことの重要性は、「なぜ継続顧客にもインタビューすべきなのか」で解説しています。

「打ち分ける」マーケティングの始め方

アップリフトモデリングと聞くと、高度なAIシステムが必要に思えるかもしれません。ただ考え方を取り入れるだけなら今からでも始められます。

まず見直したいのは、「確実層」へのバラマキです。直近で購入履歴がある、頻繁にログインしているといったロイヤル顧客に対して、一律でクーポンを送っていないでしょうか。この層を施策対象から外すだけでも、利益率は変わるはずです。

次に試したいのが、過去のA/Bテスト結果の再分析です。「効果なし」と判断して棚上げにした施策の中に、特定の属性やセグメントでは劇的に効いていたものが埋もれている可能性があります。全体の平均ではなく、セグメント別に数字を切り直してみるだけで、新しい発見があるかもしれません。

そしてもう一つ。施策に反応してくれた顧客だけでなく、「反応しなかった人」や「施策の直後に離脱した人」に話を聞いてみてください。データからは見えない改善の糸口が、会話の中に眠っています。たった10人のインタビューでも、驚くほどの発見があるものです。詳しくは「たった10人のインタビューで売上改善の糸口が見つかる理由」をご覧ください。

まとめ

全員に同じアプローチをすることは、平等で丁寧なようでいて、実は相手を見ていないコミュニケーションかもしれません。

「確実層」には、値引きではなく感謝と特別感、「説得可能層」には背中を押すオファー、「離反予備軍」には適度な距離感を提供する方向性で考えていくのが良いと思います。

因果推論というデータの視点と、N1インタビューによる顧客理解を組み合わせることで、施策の精度は大きく変わります。

「自社の施策が、実は誰に逆効果になっているのか知りたい」 「データはあるけれど、どう施策に落とし込めばいいか分からない」

そうお感じの方は、ぜひ一度Kumonoにご相談ください。データと対話の両面から、貴社の続く理由を一緒に作ります。

注釈・参考

推定が成立する前提(なぜランダム割当が必要?)

理想はA/Bテスト(RCT)のようなランダム割当です。ランダムでない場合は、施策が当たった人と当たっていない人が元々違う(交絡)ため、モデルが「効果」ではなく「当たりやすさ」を学習しやすくなってしまいます。観測データでやる場合は、割当確率のモデル化やマッチング等で条件付きにランダムとみなせる状況を作る必要があります。

お問い合わせ

Kumonoでは、スタートアップの支援に関するご相談を承っております。
お気軽にお問い合わせください。

無料相談を予約する