2026年2月24日(現地時間)、米国ニューヨーク州アーモンクおよびカリフォルニア州サンフランシスコにて、IBMとDeepgramは、Deepgramの先進音声認識(Speech-to-Text)および音声合成(Text-to-Speech)技術をIBMの生成AIソリューション「watsonx Orchestrate」に統合する協業を発表した。

今回の協業により、DeepgramはIBM初の音声パートナーとなる。IBMはエンタープライズグレードの高性能な文字起こしやリアルタイム字幕機能への需要の高まりに対応するため、Deepgramの音声技術を自社プラットフォームに導入した。これにより、多様な言語や方言への幅広い対応、地域特有のアクセントを反映した音声提供、カスタム・チューニング、リアルタイム字幕生成といった機能性が新たに加わる。
背景には、企業が背景雑音、多様なアクセント、実環境での自然な会話条件下でも高精度に動作するAI搭載音声認識システムを導入し、文字起こし業務の自動化を推進する流れがある。語彙や言語バリエーションへの柔軟な対応が企業変革の迅速化にも寄与する。特に、数十種類のアラビア語のバリエーションやインドの複数言語など、多言語・多方言への対応は国際的な企業活動における新たな強みとなる。
Deepgramの共同創業者兼CEO スコット・スティーブンソンは、「音声は人とテクノロジーを結ぶ主要インターフェースとして普及しており、高精度・低遅延・大規模利用に耐えるリアルタイム音声プラットフォームがエンタープライズには不可欠」と述べている。IBMとの統合により、10年以上にわたり開発されたリアルタイム基盤の上で、音声エージェントや音声対応ワークフローなどエンタープライズ用途の拡張が見込まれる。
また、IBMのAIテクノロジー・パートナーシップ担当バイス・プレジデントであるニック・ホルダは、「DeepgramのAPIとwatsonx Orchestrateの統合はAI活用と業務モダナイゼーションを支援し、IBMのオープンエコシステムと最先端技術の提供体制を強化する」と述べている。今回の協業によって、顧客対応自動化・通話分析・音声主導型データ入力といった領域を中心に、医療・金融分野をはじめとする多様な業界でのAI活用が拡大する。
音声インターフェースは今後、企業のAI業務自動化における必須要素となりつつある。今回の取り組みは、企業変革や新規事業創出を志向する経営企画部門にとって、グローバル対応力・業務効率化の双方で新たな選択肢となる。
【関連記事】
・日本IBM、製造業向けAIソリューション「Orchestrator」と「ORION」提供開始
・SIGNATEと日本IBM、AI活用推進に向けパートナーシップ締結
・日本IBM、NTTデータグループにAIガバナンス・プラットフォームを提供
