凸版印刷は、明治期から昭和初期(以下、近代)の手書き文字に対応したAI-OCRを開発した。
同AI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。今後、神戸大学経済経営研究所附属企業資料総合センターなどとの実証実験を11月より実施し、2023年4月より、正式サービス開始を予定しているという。
AI-OCRの特徴は以下のとおり。
- 凸版印刷における複数のサービスと連携:サービス提供中のふみのはゼミシステムや、開発中の古文書解読スマホアプリで提供予定
- 難読文字の解読:近代の手書き文字には、書き手によるくずし方のバラつきが大きく、筆記用具の多様化、カタカナ語の混在、旧字旧仮名遣い表記などの特性があり解読が困難とされている。同AI-OCRでは、様々なパターンの文字をAIに学習させることで、これらの難読文字の解読を実現