1. TOP
  2. これまでの掲載書籍一覧
  3. 2018年10月号
  4. データサイエンス入門

2018年10月の『押さえておきたい良書

『データサイエンス入門』

チョコレート消費量とノーベル賞獲得数はどう関係している?
今後、ビジネスパーソンに必要なスキルとは

『データサイエンス入門』
竹村 彰通 著
岩波書店(岩波新書)
2018/04 192p 760円(税別)

amazonBooks rakutenBooks

 スマホやポイントカードが普及し、購入情報や位置情報、さらにはSNSの会話までネットワーク経由で蓄積される現代社会。あらゆる情報=ビッグデータをAIで分析すれば、新しい価値創造が起きそうなことは想像に難くない。では、そのメカニズムはどうなっていて、そのためには何をすればよいのだろう?

 そんな門外漢の疑問に、入門レベルから答えるのが、東京大学大学院情報理工学研究科教授を経て2016年に滋賀大学データサイエンス学部を開設した著者の竹村彰通氏だ。ビッグデータを活用するアマゾン、グーグル、アリババといった米・中の企業が統計学の学生を奪い合うなか、彼らに遅れまいと、日本でデータサイエンティストの養成に邁進(まいしん)している。

広がりゆくデータサイエンス

 データサイエンスは3つの要素から成り立つ。ビッグデータをコンピューターで扱う情報処理技術、その分析を行う統計知識、そしてデータから価値を引き出す価値創造だ。この3要素のスキルを有するのがデータサイエンティストである。データサイエンティストはデータに基づく科学的思考のうえで「データ自体に語らせる」ことができるのだという。

 その基本にあるのが統計的な手法を活用して予測や判別、分類を行うモデリングである。父親の身長データから息子の身長を予想する関数を導くといったモデリングは従来から行われていたが、最近では、画像データやSNSの書き込みなどの情報からもモデリングによりさまざまな知見を得ることが可能になってきた。これは人間の神経の情報伝達を模した関数を使うニューラルネットワークモデルや、それを多層化した深層学習(ディープラーニング)などの人工知能につながる手法が発達したためだ。特に顔認識などの画像データによる判別の性能向上が著しい。背景には、ビッグデータを複数のコンピューターで分散処理する技術の発展がある。飛躍的に進歩する分析手法と情報処理技術をつなげるデータサイエンティストの役割は、今後ますます高まっていくと著者は述べている。

データ至上主義の落とし穴

 一方で、データの取り扱いには注意が必要だ。特に相関と因果の関係の取り違えには気を付けたい。例えば、ある調査結果によると国別のチョコレート消費量とノーベル賞獲得数の相関はかなり高い。だからといってチョコレートを大量に食べればノーベル賞が取れるとは言えまい。チョコレートを多く消費できる経済力や文化水準のある国は、学術研究への資源配分が多いという因果関係から説明した方が妥当だろう。こうした「見かけの相関」には注意が必要だ。他にも、結論ありきで、望む結果を導くデータばかり選んでしまう「確証バイアス」もよくある問題事例だ。

 さるテレビ番組では社会問題解決型AIの分析結果として「健康になりたければ病院を減らせ」という提言がされた実例もある。相関だけを重視して因果関係を無視したとしか思えない。AIも使い方を誤ると変な答えを導き出したりしてしまう。

“人工知能と言っても、コンピューターが人間と同じように「考えて」いるわけでなく、人間の判断に関するビッグデータの中から、人間の判断パターンを統計的に分析して確からしい解を提示しているのである。”(『データサイエンス入門』p.132より)

 たまりゆくビッグデータとAIを正しく使えば新たな知見が得られることは間違いない。だが、AIの導き出した突拍子もない解やビッグデータに振り回されないためにも、データを科学的、批判的に取り扱うデータサイエンスの手法は、身につけておいて損はないだろう。もしかしたらその教養は、あなたのビジネスでの新価値創造にもつながるかもしれない。まずは本書を手に取り、データサイエンスの世界に触れてみてはいかがだろうか。

情報工場 エディター 鵜養 保

情報工場 エディター 鵜養 保

東京都出身。国際基督教大学教養学部理学科卒、INSEAD MBA。新生銀行グループで事業戦略の立案・実行に携わる傍ら、副業解禁とともに情報工場にエディターとして参画。本業ではノンバンクのM&Aが専門。国産の旧車のレストアが趣味。田舎のガレージで自らエンジンの分解・組み立てをこなす、昭和のスバル車のコレクターでもある。

amazonBooks rakutenBooks

2018年10月のブックレビュー

情報工場 読書人ウェブ 三省堂書店