タワマンに住む女性は不妊になるって本当? わかりやすいデータ分析とは?

ビジネス

公開日:2017/7/11

『データ分析の力 因果関係に迫る思考法』(伊藤公一朗/光文社)

「ある企業では社長が代わった次の年に株価が上昇した。これは新社長の改革の成果である」

「ある学校では新たなカリキュラムを導入した。すると、生徒の理解度と成績が前年に比べて向上した。よって、新カリキュラムは旧カリキュラムよりも優れていることが示された」

「マンションの高層階に住む女性の不妊率が高いことがデータから示された。よって、子供を産みたい女性がマンションの高層階に住むのは危険である」

 このような文章を新聞や雑誌などでよく目にする。これらは株価や生徒の成績という「データ」に基づいており、一見それらしく見える。しかし、実はこれは正しいとは限らない。
 どこが? なにが? と疑問に思う人、あるいは仕事で同様のことをやってしまっている人にはぜひ本書『データ分析の力 因果関係に迫る思考法』(伊藤公一朗/光文社)をお薦めしたい。

直感的にデータ分析する

 データから何がしかの事柄を引き出すには、ただデータをとって集計するだけではだめだ。きちんとした理論に基づく必要があり、これがいわば「統計学」にあたるわけだが、「統計」と言う言葉を聞いただけでやる気をなくす人も多いだろう。だが安心してほしい。なにせ本書は「数式を使わず、具体例とビジュアルな描写を用いて解説していきます」と前書きにあるのだから。その言葉どおり、数式を使わず直感的に、でも統計学をベースに、データ分析の基本を教えてくれる。

 例えば、アイスクリームを売る企業で、ウェブサイト上に広告を出すことによってどれくらい売り上げが伸びるのかを分析したい場合を考えてみよう。過去のデータから次のことがわかったとする。・ウェブ広告を出した2010年は、広告を出さなかった2009年と比較して、売り上げが40%上昇した。

advertisement

アイスクリームと広告に因果関係はある?

 この結果をもとに「広告を出した影響で2010年の売り上げは前年比40%アップ」と結論づけたなら、これは間違っている可能性がある。なぜなら、売り上げ増加の原因が広告だけとは限らない。「2010年が猛暑だった」「景気が上向いた」など、売り上げに影響しそうな要因は他にもあり、広告の効果だけを取り出すことはできないからだ。2つのデータに連動性があることを、統計学では「相関関係がある」と呼ぶ。アイスクリームの売り上げとウェブ広告に相関関係があっても、ウェブ広告がアイスクリームの売り上げに影響を与えたという「因果関係」があるとは言えない。因果関係と相関関係は違うのだ。

 冒頭の例は、因果関係と相関関係を混同している。株価上昇は社長交代以外の要因があり得るし、学校のカリキュラムと成績の関係もそうだ。マンションの高層階と女性の不妊率にいたっては、そもそもマンションの高層階に住む女性の所得・年齢・職業などが一般とは違う可能性があり、高層階に住む女性というくくり自体が適切なのかという疑問がわいてくる。

 では、データ分析はどのようにすればよく、データから何が言えるのだろうか。それについては本書を参照していただきたいが、いずれにしても数式は使わずに文章と図と事例で丁寧に解説されている。データ分析の必要性に迫られている人はもちろん、データがあふれる時代だからこそデータ分析の勘所を身につけておくことは、誤った情報にふりまわされないためのチカラになるだろう。

文=高橋輝実