今さら聞けない相関と因果の違い。事例100本ノック、あなたはどこまで笑って見破れる?

「データ分析? 相関があれば十分でしょ」 「グラフが右肩上がりなんだから、これが原因に決まってる」

もしそう思っているなら、この記事を読む価値があります。

私たち人間は、データを見て会社クスPJ祭に、簡単に勘違いを起こしてしまいます。

前半の事例を見て、きっと「こんなの引っかかるわけないじゃん(笑)」と笑うでしょう。しかし、読み進めるうちに笑えなくなるはずです。

なぜなら、同じロジックの罠に、簡単に自分がハマるかもしれないからです。

今回は、マーケターやビジネスパーソンが陥りやすい「因果と相関の取り違え」を、4つのパターンに分けて100本ノック(厳選版)形式で叩き込みます。

パターンA:【擬似相関】の罠

~「黒幕(共通要因)」は別にいる!~

AとBが一緒に増えている。でも、AがBの原因ではありません。背後で糸を引く「C」を見抜けますか?

レベル1:【常識】小学生でも笑うレベル

Q1. アイスクリームが売れると、水難事故が増える?

  • データ: 夏の統計データ。アイスの売上と溺れる人の数は完全に比例して増減している。
  • 間違った分析: 「水難事故を防ぐために、アイスを販売禁止にしろ!」
  • ツッコミ: 「そんなバカな? 『夏(気温)』になれば、アイスも売れるし海に行く人も増える。どっちも増えるに決まってるじゃん」

レベル2:【日常】ちょっと考えればわかるレベル

Q2. 古着好きは邦ロック好き?

  • データ: 古着屋の来店客にアンケートを取ると、邦ロック好きの割合がやたら高い。
  • 間違った分析: 「古着を着ると邦ロックを聴きたくなるのか? 古着屋でバンドTを売れば爆売れだ!」
  • ツッコミ: 「古着も邦ロックも、一点ものを掘り当てる快感と自分が好きな人が寄ってきてるんじゃない?。共通要因は『サブカル志向』...いや、もう少し解像度を上げると『発掘の快感』『納得感で選ぶ美学』あたり。古着を着せたって邦ロック好きにはならないよ」

レベル3:【ビジネス】職場でやりがち

Q3. 広告費を増やすと、売上が増える?

  • データ: 過去のデータを見ると、広告費を多く使った月は売上も伸びている。グラフは完全に一致。
  • 間違った分析: 「広告の効果は絶大だ! 来月も予算を倍増させて、売上倍増を狙おう!」
  • ツッコミ: ...ちょっと待って。その月は「12月(商戦期)」ではありませんか?
  • 解説: 「季節要因(C)」が、客の財布の紐を緩め(B増)、同時に企業に予算消化の広告を出させている(A増)だけかもしれません。この「季節性」という共通要因を無視して、「広告のおかげ」と断定していませんか?

パターンB:【逆因果】の罠

~「原因」と「結果」の取り違え~

Aがある場所にBがある。だからAがBの原因だ!...本当に? BだからAが集まってきたのでは?

レベル1:【常識】笑い話レベル

Q4. 警察官が多い地域ほど、犯罪が多い?

  • データ: 犯罪発生件数が多いエリアには、必ず大量の警察官がいる。
  • 間違った分析: 「警察官が犯罪を誘発している! 警察を減らせば平和になる!」
  • ツッコミ: 「逆だよ! 『犯罪が多いから』、警察官をたくさん配備したんじゃない?」

レベル2:【日常】冷静になればわかるレベル

Q5. 個性的な人だから古着を着る?(さっきの続き)

  • データ: 古着好きを観察すると、独自のスタイルを持っていて「個性派だから古着を選んでいる」ように見える。
  • 間違った分析: 「個性を磨けば自然と古着に行き着く。個性教育が古着市場を伸ばす!」
  • ツッコミ: 「本当にそっちの矢印? 邦ロックのライブに通い始める → 周りが着てるバンドTやミリタリーが"正装"になる → それを探して古着屋に行くようになる → 結果として古着好きになる。こう考えると、個性があるから古着を選んだんじゃなくて、コミュニティの記号に寄っていった結果かもしれない」

もちろん「個性派だから両方選んだ(パターンAの擬似相関)」という面もあるでしょう。この例のような「共通要因もありそうだし、逆因果もありそう」という状態は色々なシーンでもよくみられます。だからこそ、「これが原因だ」と一つに決めつけるのは危ないですよね。

レベル3:【ビジネス】職場でやりがち

Q6. 解約ページをよく見る人は、解約率が高い?

  • データ: ログ解析の結果、解約方法のFAQページや利用規約を長時間見ているユーザーは、その後の解約率が極めて高い。
  • 間違った分析: 「解約ページを見せるのが悪いんだ! ページにアクセスしにくくして、解約を阻止しよう!」
  • ツッコミ: ページを見たから解約するのではなく、「解約する意思が固まっている(原因)」から、手続きのためにページを見ている(結果)のは?
  • 解説: すでに心は離れています。ここでページを隠すと、解約を阻止できるどころか、「解約させない悪質企業」として評判(ブランド)を毀損してしまったり、将来復帰しようという気持ち自体も削がれてしまうかもしれません。

パターンC:【選択バイアス】の罠

~「見えているデータ」が全てだと思い込む~

データ分析の最大の敵は、集計されていない「見えないデータ」です。特定の条件でフィルタリングされたデータだけで判断していませんか?

レベル1:【日常】飲み会のネタレベル

Q7. SNSを見ると「みんな成功してる」?

  • データ: 29歳、同期のインスタは結婚と海外旅行で埋まっている。
  • 間違った分析: 「世の中みんな幸せそうやなぁ。なおワイ...」
  • ツッコミ: 「上手くいってる瞬間は切り出して投稿しやすいでしょ。うまくいってない日常をわざわざアップする人いないって」

レベル2:【歴史】戦闘機の弾痕の事例

Q8. 帰還した戦闘機の「弾痕がない場所」を補強せよ?

  • データ: 戦場から帰ってきた飛行機を調べると、翼や胴体ばかり撃たれていて、エンジンやコックピットは無傷だった。
  • 間違った分析: 「翼や胴体が撃たれやすい弱点だ! そこを重点的に補強しよう!」
  • ツッコミ: 「逆だ! エンジンやコックピットを撃たれた機体は、『墜落して帰ってこれなかった(データがない)』んだ。無傷に見える場所こそが、撃たれたら終わりの弱点だよ」

レベル3:【ビジネス】明日、営業戦略でやりがちなレベル

Q9. 問い合わせログを見ると「この機能が不満」だらけ?

  • データ: サポート問い合わせの大半が機能Xへの不満。圧倒的に多い。
  • 間違った分析: 「機能Xが最大の課題。ここだけ直せば継続率アップ間違いなし!」
  • 真実: 問い合わせるのは「まだ期待してる人」。黙って去る人の不満はログに出ない。
  • 解説: サポートログは苦情の母集団ではなく、「苦情を言いに来た母集団」です。静かな離脱理由は別にあるかもしれません。

パターンD:【偶然】の罠

~神様のいたずらか、データの綾か~

論理的な理由は一切ない。でも、データ上は完璧に一致してしまう。「数打ちゃ当たる」で見つかった奇跡の相関。

レベル1:【ネタ】全米が笑ったレベル

Q10. ニコラス・ケイジが映画に出ると、プールで溺れる人が増える?

  • データ: 俳優ニコラス・ケイジの年間映画出演数と、米国のプールでの溺死者数の推移の一致度が高い(相関係数0.66)。
  • 分析: 「ニコラス・ケイジの演技を見ると、つい泳ぎたくなるのか?」
  • 正解: 「ただの偶然」。世の中には何億というデータがあるため、探せば「たまたま形が似ているグラフ」は必ず見つかります。意味を見出そうとしてはいけません。

レベル2:【ジンクス】投資家も担ぐレベル

Q11. アメフトの「NFCチーム」が勝つと、株価が上がる?

  • データ: スーパーボウルでNFC(特定のリーグ)のチームが勝った年は、NYダウ平均株価が上がる確率が高い(「スーパーボウル・インジケーター」と呼ばれ、一時期は的中率80%超)。
  • 分析: 「アメフトの結果が経済を動かしている!」
  • 正解: これも偶然。サンプル数が少ない(年1回×数十年)場合、コイン投げで10回連続表が出るような奇跡がたまに起きるだけです。

レベル3:【ビジネス】データ分析担当が一番やりがちなレベル

Q12. 雨の日に売れたこの商品、雨対策グッズとして売り出そう?

  • データ: 新発売の商品が、たまたま雨の降った3日間に連続で売れた。
  • 間違った分析: 「これは雨の日に需要がある商品だ! 雨の日セールをしよう!」
  • 真実: たった3件のデータで判断していませんか? サンプルサイズ(データ数)が少ないと、「たまたま雨の日に3人が買っただけ」の誤差を、法則だと勘違いしてしまう。
  • 教訓: 「n=1(私の体験談)」や「n=3(たまたま続いた)」を鵜呑みにしない。統計的に有意か確認をする。

因果と相関を見分ける魔法の質問

ここまで多くの失敗事例を見てきましたが、現場で迷ったときは、このたった一つの質問を自分に投げかけてください。

「もし私が無理やり〇〇を変えたら、△△も変わるか?」

  • 相関関係: AとBは一緒に動いているだけ。
  • 因果関係: Aを動かすと、Bも動く。

ケース1:アイスクリームと水難事故

  • 質問: 「もし私が無理やりアイスクリームの販売を禁止したら、水難事故は減るか?」
  • 答え: 減らない。(暑いから海に行く人は変わらない)
  • 判定: これはただの「相関(擬似相関)」です。

ケース2:広告費と売上

  • 質問: 「もし私が無理やり広告費をゼロにしたら、売上は減るか?」
  • 答え: 減る可能性が高い。(広告を見て買う人がいなくなるから)
  • 判定: これは因果の可能性があります。(※ただし、季節要因などを除外して考える必要あり)

ケース3:交番の数と犯罪数

  • 質問: 「もし私が無理やり交番を撤去したら、犯罪は減るか?」
  • 答え: 減らない、むしろ増える。(犯罪が多いから交番があるだけ)
  • 判定: これは逆因果(または相関)です。

ただし、この質問だけで安心しないでください。「無理やり変えたら結果も変わりそうだ」と思えても、変えたことで別の何かも一緒に動いてしまうことが実務ではよくあります。たとえば広告費をゼロにすれば売上は下がるかもしれませんが、同時に営業の動き方やブランド認知も変わる。変えたら動くの裏に、もう一つ他に何が動くか?を添えるクセをつけるのがおすすめです。

まとめ

これで、「因果関係がないのに相関してしまう」よく見る4つのパターンが出揃いました。

  1. 擬似相関(交絡): 裏で「C」が操っている
  2. 逆因果: 矢印が逆(B→A)
  3. 選択バイアス: 偏ったデータしか見ていない
  4. 偶然: たまたま似てしまっただけ

もちろんバイアスの種類はこの4つだけではありません。でも、まずはこの4パターンを押さえておくだけで、会議で「それって因果なの?」と立ち止まれる場面は格段に増えるはずです。

データ分析の目的は色々ありますが、突き詰めるとシンプルで、「どこを押せば(原因)、結果が変わるかを見つける」ことに尽きるのではないでしょうか。

相関を見つけただけでは、まだスタートライン。 この4つの罠をくぐり抜けた先にある真の因果を見つけたとき初めて、私たちは未来を変えるアクションを確信を持って打つことができるのです。

お問い合わせ

Kumonoでは、スタートアップの支援に関するご相談を承っております。
お気軽にお問い合わせください。

無料相談を予約する