「近代手書き文字AI-OCR」の解読例。
左は鐘淵紡績株式會社『株主総会速記録』、右は鐘淵紡績株式會社『支配人回章』
※いずれも神戸大学経済経営研究所附属企業資料総合センター所蔵凸版印刷株式会社は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発したことを発表した。


古文書解読とくずし字資料の利活用サービス「ふみのは」として提供されている江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。2022年11月から神戸大学経済経営研究所附属企業資料総合センターなどとの実証実験を実施し、2023年4月からの正式サービス開始を予定している。

近代の手書き文字は書き手によるくずし方のバラつきが大きく、筆記用具の多様化、カタカナ語の混在、旧字・旧仮名遣い表記なども相まって解読が非常に困難とされている。今回開発されたAI-OCRでは、さまざまなパターンの文字をAIに学習させることで、それらの“難読文字”の解読が実現された。

この技術は、「地方自治体、教育研究機関、企業などが所蔵する難読資料の解読補助」「難読資料の利活用を目的とした検索機能付きデータベースの構築補助」「謄本類など日常的に難読資料の解読が必要な企業・機関の作業補助」といったシーンでの活用を想定。凸版印刷株式会社の複数のサービスと連携し、既にサービス提供中の「ふみのは ゼミシステム」や、開発中の古文書解読スマホアプリでの提供が予定されている。

凸版印刷、明治期から昭和初期の手書き文字を解読する「くずし字AI-OCR」を開発
近代手書き資料における“難読文字”の例
凸版印刷、明治期から昭和初期の手書き文字を解読する「くずし字AI-OCR」を開発
「近代手書き文字AI-OCR」サービスの全体像凸版印刷株式会社
URL:https://www.toppan.co.jp/

2022/11/15
編集部おすすめ