データ駆動型ビジネスの鍵は、非構造化を含む「すべてのデータの活用と分析」──顧客行動、患者行動、犯罪発生の予兆をつかむには?
まず植松氏から、データ駆動型ビジネスへ変革する上で、すべてのデータを活用できるようにすること、中でも非構造化データ*1の分析を考えることの重要性が語られた。
*1:非構造化データ:特定の構造を持たないデータを指し、メール、文書、画像、動画、音声などのほか、Webサイトのログやバックアップ/アーカイブなども含まれる
最初に紹介されたのは、米国コロラド州デンバーにあるメンタルヘルスセンターのデジタルトランスフォーメーションの事例である。病院で処理をするデータというと、体温や血圧等、数値的なデータを想像しがちだ。しかし、そういったデータだけでは患者が粗暴な行為に走ってしまうということは予見できない。患者の行動を予見するためには、医師や臨床心理士の所見や生活の様子を記録した「非構造化データ」の分析が重要だ。デンバーのメンタルヘルスセンターでは既にこういった非構造化データの分析を自動化して、自傷行為など問題のある行動の予知に取り組んでいる。
英国の警察組織でもインターシステムズの製品を導入し、さまざまなシステムにある異なる情報を連携させ、犯罪データベースを構築してリアルタイムで共有している。また、過去の犯罪データの蓄積・分析から、犯罪が発生する可能性の予測を行っているという。
日本の事例としては、デジタル・アドバタイジング・コンソーシアム株式会社(DAC)が、インターシステムズの非構造化データの分析技術を活用して、より的確なインターネット広告サービスの提供を始めたという。インターネット広告では、顧客のWebサイト上での行動を理解し、そのページを訪れる顧客の興味や嗜好、行動をプロファイルし、それぞれの顧客に応じた情報を配信することが重要になってくる。
その際、肝となるのが非構造化データの分析だ。日本では、日常的に使われる自然言語のなかから、言葉が意味を持つまとまりを最小単位まで区切って分析する形態素解析がよく使われている。しかし、あまりに区切りすぎてしまうと、本来の意味が失われプロファイルには使用しにくくなってしまう。顧客がネットサーフィンに使っている言葉を意味のある一連のユニットとしてとらえることで、より効果の高いプログラマティック広告の提供を目指しているという。
こういった非構造化を含むリアルタイムでのデータ分析が重要なのは病院や警察組織、広告業界だけではない。様々な企業環境に置き換えて考えることができると植松氏は話す。