また、本書は2018年12月6日に先行発売したものと同じ内容の書籍です。
ビジネスの世界でビッグデータという言葉を聞くようになってずいぶんの時間が経ちますが、多くの企業ではまだまだデータをビジネスに活用しきれているわけではありません。こうした現状をなんとかしようと、私は数名の仲間と、データの分析や活用を支援する会社「データビークル」を起ち上げ、ソフトウェアやサービスメニューを提供するようになりました。
創業以前から、私たちにはデータ活用に関するたくさんのご相談をいただきました。その内容はたとえば、今後データを活かさなければならないと考え、少なからぬ金額をハードウェアやソフトウェアに投資したものの十分に使いこなすことができない、あるいは外部のコンサルタントやデータサイエンティストに分析を依頼したものの経営に活かせるような結果は得られない、また内製化のため採用したデータサイエンティスト候補生から期待したほどの成果は得られない、さらには、時代はAIだと息巻いて導入し開発したものの、ほとんど何の役にも立てられない、といったさまざまなものです。
そうした相談の中で、もっともたくさんもらう質問は、「○○についてのデータをたくさん集めたのだが、これをどうすればよいか?」というものです。データの中身や収集方法を示す「○○」の部分については、時代を経るごとにどんどんハイテクなものになってきました。2010年頃はまだビッグデータと言ってもPOSデータや、通販の会員情報と注文およびダイレクトメールの履歴といったものが中心でした。昨今は、IoTのセンサーデータや、AIを使って店舗内のカメラ映像を処理した結果、収集された来店客の行動履歴など、技術的に興味深いデータがどんどん登場するようになりました。
データの方はハイテクになっていっても、やはりまだ多くの人が「たくさん集めたけれどどうすればよいか?」と相談してくるわけです。当然、「たくさん集める」ためには少なからずコストがかかっているわけですが、いざ集めてみると何に活用してよいかよくわからない、というわけです。日本情報システムユーザー協会(JUAS)の調査などでも、この数年ビッグデータの活用について、「目的を明確化させなければいけない」といった課題を抱えた多数の企業の存在が示されています。
近年、統計学やAIのもとになる機械学習の手法を紹介する、あるいはそうした手法を実装するためにどのようなプログラムを書けばよいか、という書籍が多く出版されるようになりました。しかし、それ以前の「どのような目的に対して、どうデータを活用すれば、企業は利益をあげられるのか」ということについてはほとんど資料が存在していません。また、データ分析やAI開発を請け負う企業は数多くありますが、相談の際に見せてもらった「役に立たなかったレポート」や「役に立たなかったAI」から判断する限り、おそらくこのような仕事を依頼する側の企業だけでなく、請け負う側の企業も、必ずしもこのあたりがわかっているとは限りません。
そもそも、統計学を使って分析するにせよ、機械学習の技術を使ってAIを開発するにせよ、ビジネスにおいてデータを活用できるとはどのような状態をいうのでしょうか? 私たちの考えでは次の5つがそろったサイクルが回り続けることを指します(図表0-1)。
- データそれ自体が活用しやすい状態になっていること
- 適切な手法を適用して、分析や予測、最適化ができていること
- そこから得られた成果をもとに適切な意志決定ができること
- 意志決定に従って、実際の現場で活用されること
- その結果、どれだけ役に立ったかのデータも収集できること
現在、すでにこうした好循環を生み出せている企業は、私たちの知る限り、ごくわずかです。それは上記の5つのうち1つでも欠けていればデータ活用がうまく進まないからです。
とにかくデータだけをひたすらキレイにしようと全社的なデータベースを整備したり、あるいは数学に明るい新卒者を積極的に採用して社内に分析やAI開発のためのチームを発足させてみたり、という投資をいくら実施しても、なかなか成果が出ないのは、意志決定や現場レベルでデータ活用がボトルネックになっているからかもしれません。たとえば数字やIT嫌いの経営者のもとではどれだけ素晴らしいデータ分析結果も高性能なAIも活かすことはできません。また、数字に明るく、進取に富んだ人たちの組織でも、データ自体が汚すぎれば、活用のためにたいへんな手間がかかるということもあります。
私たちは日々、データ、手法の適用、意思決定、現場という、それぞれの間にある溝をいかに埋められるかということにチャレンジしています。それは、このようなサイクルを何周も体験してきた私たちだからこそできることであり、その過程で私たちが学んできたことは、データをビジネスで活用する全ての人にとって有用なはずと考えます。
本書が読者の皆さまの環境、ひいてはわが国のデータ活用を促進し、成果を生み出す助けになれば幸いです。