マルチモーダルデータの活用における4つの課題
しかしながら、このようなマルチモーダルデータ活用を実現するには、乗り越えるべきハードルも多い。久米村氏は次のように4つの課題について紹介した。
まず、1つ目の課題は「ビッグデータ分析基盤がない」という問題だ。それには、IoTやソーシャル、コールセンターなどエンゲージメントのためのシステム(SoE:System of Engagement)と、EPRやCRMなどの記録システムSoR(System of Record)の間に、BIのようなデータ分析基盤やデータレイク基盤など、分析のためのプラットフォームSoI(System of Insight)がないことが大きいという。久米村氏は「まだ十分なノウハウを持つ企業が少なく、アクセスできていない可能性がある」と評した。
そして、2つ目の課題は、「モデルの精度を上げるための外部データや非構造データを扱うノウハウの不足」だ。オンプレでシステムを組んでいる企業も多く、ビッグデータ分析ができるようなクラウド環境がなかったり、社外のデータを上手く扱っていくためのノウハウがなかったり、大企業でさえもビッグデータを活用できているのは10%未満という調査結果も出ている。また、機械学習やAIを活用した分析を実現できているのは10%程度、さらに「上手くいっている」のは4%にとどまるという。
その背景には、3つ目の課題である「データサイエンティストの不足」、そして、4つ目の課題の「機械学習運用ノウハウがない」ことが挙げられる。
そこで、DATAFLUCTでは、企業のマルチモーダルデータ活用における4つの課題を解決するべく、基盤構築から実装・運用まで「Data Science as a Service」として、一気通貫で支援している。
久米村氏は「企業で実装する場合の1/5~1/10程度の費用で、DWH & Data Lake、AutoML、そしてMLOpsの運用も含めてすべてを実現できる。自社の強みは、上流工程のデータ定義、データ収集に始まり、アプリ構築や業務システムの実装・運用前まで1社で対応する『フルスタックサイエンスサービス』が可能なことになる」と強調した。
そして、特に前述したようなDBXのテンプレート型の支援モデルによって、スピーディに実現できることも強みだと語り、マルチモーダル機械学習を動かすアーキテクチャも自社開発で備えていることをアピールし、さらにマルチクラウドデータレイクのテンプレート例を紹介した。
次に、既にリリースされているAutoMLプラットフォーム「DATAFLUCT cloud terminal.」が紹介された。自社データをアップロードすれば、各クラウド上のAutoML(Automated Machine Learning:自動化された機械学習)が同時に実行できるようになっており、各モデルを比較して最適なモデルをデプロイするようになっている。
そして最後に、現在進行中のPoCに参画するパートナーについて募集が行われた。取り組み中の案件としては、「動画・音声などのマルチモーダルData Lake構築」「サプライチェーンでのデータ基盤の構築」「店舗における画像解析」「企業の環境対応(ESG)スコアリング」などがある。
久米村氏は「DATAFLUCTは新規事業を得意としており、クラウドを活用したマルチモーダルデータを活用して様々なサービスを高速に実装できる稀有な会社だ。これ以外についても、興味のあるテーマがあればぜひお声がけいただきたい」と強調して講演を締めくくった。
データ活用によるビジネス変革、新規事業創出をフルスタックでサポート
「自社のデータを有効活用したい」「データ活用による新規事業創出に取り組みたい」などニーズに合わせた提案が可能。多数の自社サービス開発や企業のDX支援による知見・技術と、スタートアップならではのスピード感のある開発でデータ活用を支援します。DATAFLUCTの詳細・お問い合わせはこちら