このフレームワークの利用により、NTTデータは業界を限定しない様々なドメインに特化したBERTを短期間で構築し、顧客に高性能な言語処理サービスを素早く提供できるようになった。
このフレームワークは、専門用語や特有の文脈を含む文書を解析する際に、言語モデル自体をお客さまの業務文書に最適化することで従来のBERTと比べて高精度の結果を得ることが可能となる。また、言語モデル構築の一連の流れは自動化されているため、専門家によるチューニングを行う場合と比べて短期間でモデルを構築することが可能となる。
NTTデータは、このフレームワークの適用により、専門用語や特有の文脈への対応が必要だった分野での自然言語処理技術活用の幅が大きく広がることを見込んでいる。2021年4月以降順次、文書を扱う業務の効率化やサービスの高度化を検討している企業を募り、2021年度中に顧客との共同検証の5件実施を目指すとしている。