データの海から価値を生みだす「マルチモーダル機械学習」技術
DXの成功のために欠かせない「データ活用」。DATAFLUCTは、衛星画像解析からスタートし、近年は事業理解やデータ定義といった事業戦略から、あらゆるデータの収集・分析、モデル設計やデータ基盤構築、実務システムの運用までをフルスタックで提供できる、データサイエンス企業だ。
「埋もれたデータから新たな商いを創出し、あらゆるステークホルダーに価値を生み出しつづけること」をミッションに、データ活用の民主化をキーワードとして、サステナブルな社会作りを目標としてきた。3年間で20以上のデジタルプロダクトをローンチし、商社や通信など幅広い顧客企業に対し、新規事業やアプリ開発、オペレーション変革まで幅広く実装している。
そうした企業に対して提供されている、DATAFLUCT独自の“同時多発的に新しいビジネスが創出できるフレームワーク”とはどのようなものか。同社代表取締役の久米村隼人氏は、「1つは『Data Business Transformation(DBX)』というビジネスモデルと『マルチモーダルデータ活用』の掛け合わせによるもの」と語る。
マルチモーダルとは、画像や音声、テキストなど様々な種類の情報をAI/機械学習に取り込むことであり、近年急速に進化しつつあるテクノロジーの1つだ。その背景には、データが急速に増え続けながらも十分に活用できていない状況から、膨大なデータを活用して価値を生み出そうとシフトしていることがある。その手法としてデータサイエンスへの興味関心が高まるとともに、活躍領域が広がり、注目されるようになったというわけだ。久米村氏は「昔から統計や機械学習は存在したが、使える人は限られていた。これからはテクノロジーによって誰でも使えるようになり、様々なビジネスチャンスを生み出す」と語る。
企業でのビッグデータ活用は多彩なテーマや領域に広がっているが、実際に利用できている企業は数%にとどまり、機械学習の成功率も4%程度だという。久米村氏はこれを「決して十分に活用されている状態ではない」と評する。
そうした中で、企業は今後のデータ活用をどのように考えているのか。総務省が2020年に発表した「デジタルデータの経済的価値の計測と活用の現状に関する調査研究」によると、今後のデータ活用で取り組みたいものに、46.5%が「データの質の向上」と回答しているという。
久米村氏は、「データの“量”ではなく“質”を向上させ、AIなど新たな分析技術を活用して分析することで、企業経営を向上させたい企業が増えている」と分析し、「そのキーワードとしてマルチモーダルに注目が集まっている」と語る。つまり、Hadoopなどビッグデータ基盤が整ったことで扱えるデータの量自体は増えたが、ビッグデータ化が進んだ次に、映像や音声など非構造化データを“使えるデータ”にすることが求められるようになった。そこにマルチモーダル化が有効というわけだ。