音楽CDが売れるとサバの漁獲量が増える!? ビッグデータを分析して見えてくる奇妙なアレコレ
公開日:2019/10/27

「音楽CDが売れるとサバの漁獲量が増える」
「自民党支持率と生たらの漁獲量の推移は見事に一致している」
――聞いたらきっと「そんなバカな!」「いったい、何の関係が?」と思ってしまうようなデータを、至極真剣に分析し公開しているチームがある。それが、「Yahoo!ビッグデータレポートチーム」だ。
このチームがこれまでに発表してきた選りすぐりのレポートのダイジェストと、ビッグデータ分析に関するさまざまな知識についてコメントつきで解説するのが、『ビッグデータ探偵団(講談社現代新書)』(安宅和人、池宮伸次、Yahoo!ビッグデータレポートチーム/講談社)である。
本書の主筆者であり、慶応義塾大学環境情報学部教授の安宅和人氏が統轄する「Yahoo!ビッグデータレポートチーム」とは、検索ポータルを筆頭に、Yahoo!が提供する多種多様なコンテンツ(乗換案内、地図、ショッピング他)が集積する、まさに膨大なビッグデータを分析・研究するチームだ。
ともあれ、まずはこんなグラフを見ていただこう。
●音楽CDが売れるとサバの漁獲量が増える

●自民党支持率と生たらの漁獲量の推移は見事に一致している

いやはやなんとも、奇妙なまでのシンクロ率を示していておもしろい。もちろん、どちらのグラフにも「因果」はなく、まったくの偶然だ。本書によれば、こうした「相関関係はあるが因果はない」データのことを、「擬似相関」と呼ぶそうだ。

ちなみに、同チームが使ったデータは、音楽CD売り上げの部分だけがYahoo!ショッピングのビッグデータで、他はすべて農林水産省統計や自民党統計の活用である。
この「擬似相関」に関する紹介は、本書においてはコラムとして扱うネタなのだが、あまりにおもしろいため、本書が語るデータ分析の世界を知ってもらう入り口として、まずは紹介してみた次第である。
ビッグデータ分析の本流はと言えば、因果関係の明確な、社会的に役立つ研究である。
例えば本書では、検索ワードのビッグデータ分析により、「新社会人の悩みや関心の傾向」や「育児ママの悩みや関心の傾向・ニーズ」などについても解説されている。
データ分析によると、育児ママたちの間には、「子供を出産後、旦那へのイライラがもっともつのるのは生後45日目頃」「子供の指しゃぶりが気になるのは生後56日目頃」「わが子をモデルに応募したくなるのは生後102日目頃」などの共通傾向も見られるそうだ。
本書には他にも、ビッグイベント時などの「混雑ぶり」を事前に予測するための混雑予測、災害地で救援活動をスムーズにするためのデータ分析、リニア開通後どれだけ日本が時間的に狭くなるのかという未来予測、政治、スポーツ他、日本人の関心傾向を分析するデータ分析など、チームが研究するさまざまな事例が具体的にレポートされている。
■TOKIOとミスチル、矢沢永吉と郷ひろみの意外な類似性
疑似相関にも似たテーマとして、J-POPアーティストの歌詞にはどんな特徴があるのかをデータとして分析し、類似性のある歌手を割り出した研究も興味深い。
本書に記された中のほんの一例だが、「TOKIOとMr.Chirdren」「矢沢永吉と郷ひろみ」には、それぞれ意外な類似性があるそうだ。
これら各事例においては、データ分析をどう行えばいいのかの基礎的な学術解説もあるので、ビッグデータを仕事で扱っている人や、将来的に扱いたい人にとっても、大いに役立つだろう。
説明を読まないと信じられないかもしれないが、本書によれば、政党名や政治家の個人名など、「検索量を分析することで、選挙の議席数予測は96%も的中する」そうだ。
こうした多様なネットデータ分析を通して安宅氏は、「ネットとリアルは別個の世界であるどころか、切り離しえないもの」であり、今後はデータをしっかりと分析・応用する力を持つことが、生きていく上で重要な時代になると述べる。
そんな時代の先駆け的なビッグデータ分析の実際を、本書で楽しみつつ日本の将来を思い浮かべながら学んでみてはいかがだろうか。
文=町田光