今回、同社は少量の学習データ、継続的な未知語増大への対応を目的に研究を行い、本アルゴリズムを考案。BERTなどの単語辞書を有する言語AIにおいて、これまで明らかにされていなかった既存の事前学習モデルに対し未知語を判定し、未知語を加えた辞書で再事前学習を行うアルゴリズムを考案したことで特許を取得したとしている。
本アルゴリズムにより、業界特有の単語や企業内で用いられる独自表現など、未知語を多く含む文章において処理精度の向上が見込めるという。また、既存の事前学習モデルに少量のデータで再事前学習させることで、短時間で独自の事前学習モデルが生成できるとしている。
活用ケース
- 顧客の意見や要望からのニーズ・課題分析
- FAQ自動引当て
- 製品マニュアル検索
- 契約書のコンプライアンスチェック
- プロジェクト報告書のリスクチェック