いま知っておくべき知識・教養がここに! データ・AI時代を生き残るための「データサイエンス」

ビジネス

公開日:2021/6/17

教養としてのデータサイエンス
:『教養としてのデータサイエンス』(北川源四郎、竹村彰通:編、内田誠一、川崎能典、孝忠大輔、佐久間淳、椎名洋、中川裕志、樋口知之、丸山宏:著/講談社)

 インターネットが爆発的に普及し始めた1990年代から約四半世紀。この間、私たちを取り巻く技術や機器は飛躍的な進化を遂げてきた。近年では音声入力で作動するスマートスピーカーやハンドルから手を離してもOKな自動運転車が登場、センサーとカメラシステムによって財布やスマホがなくても無人決済できるコンビニも出現している。これらを可能にしているのが、膨大なデータを収集するテクノロジーと、データを解析するAI(人工知能)の発達だ。

 現代は文系・理系問わず、また仕事や職種が異なっていたとしても、もはやデータやAIが関係する「データサイエンス」が使われていない分野はない、といっても過言ではないだろう。しかし「データサイエンスとは何か?」「技術の話は難しくて理解できない」という方も多いことだろう。また会社でDX(デジタルトランスフォーメーション)やAIの導入を議論しているが、どこから手を付けていいのかわからず途方に暮れている方もいらっしゃるかもしれない。そんな方におすすめなのが、本稿でご紹介する『教養としてのデータサイエンス』(北川源四郎、竹村彰通:編、内田誠一、川崎能典、孝忠大輔、佐久間淳、椎名洋、中川裕志、樋口知之、丸山宏:著/講談社)だ。本書は日本を代表する統計学者やデータサイエンティストが執筆を担当し、知識のない方にもわかりやすく解説してくれる。

advertisement

 本書の編者である、滋賀大学の竹村彰通教授は「巻頭言」で、データサイエンスを「データを処理・分析し、データから有益な情報をとりだす方法論」と定義している。さらに「従来からの統計学とデータサイエンスに必要な情報学の二つの分野を基礎としますが、データサイエンスの教育のためには、データという共通点からこれらの二つの分野を融合的に扱うことが必要」であり、そのため本書は「これまでの統計学やコンピュータ科学の個々の教科書とは性格を異にしており、ビッグデータの時代にふさわしい内容を提供」している――つまり最新の情報が1冊にギッチリと詰まっているのだ。

 本書は全3章で構成されている。第1章「[導入]社会におけるデータ・AI利活用」では、ビッグデータやAIの進化によって起きた「知能革命」や「第4次産業革命」について、そしてデータやAIはどんな場面でどのように使われているのかといった身近な例を取り上げ丁寧に説明されている。また耳にしたことがあるけれどよく理解できていなかった文言も幅広く扱っており、データサイエンスの現状を横断的に理解・整理できる(この章が本書の3分の2を占めている)。続く第2章「[基礎]データリテラシー」ではデータをどう扱い、どう読めばよいのかといったさらに突っ込んだ内容となり、最後の第3章「[心得]データ・AI利活用における留意事項」では、AI倫理や個人情報の取り扱い方、セキュリティ、プライバシーの問題など、多くの人が懸念している問題が提起されている。また各節には練習問題が付記され、理解したかどうかのチェックも可能だ。

 日本政府は2019年に「AI戦略2019」を策定し、文系、理系を問わず、国内全ての大学・高専生(毎年約50万人)を対象に、初級レベルの「数理・データサイエンス・AI」についての知識と教養を習得する方針を打ち出している。本書はこの策定を踏まえた内容となっており、そのモデルカリキュラムに完全準拠した公式テキストである。慶應義塾大学教授でヤフーCSOを務める、ベストセラー『シン・ニホン AI×データ時代における日本の再生と人材育成』著者安宅和人さんも内容に太鼓判を押しているそうだ。

 本書を読むとデータサイエンスがどれほど毎日の生活に根ざし、さまざまなことを便利にしているのか、さらには持続可能な社会を実現するために不可欠であることがとてもよくわかる。地球上のすべての人に必要な教養である「データサイエンス」、この1冊でしっかりと身につけたい。

文=成田全(ナリタタモツ)

あわせて読みたい