7月の終わりに、熊本大学と印刷で有名なTOPPANが協力して、江戸時代の古文書のくずし字をAIに学習させて解読する独自の手法を開発した、という発表がありました。

90年分を一か月で解読!驚異的なスピード!

今回、熊本大学の永青文庫が所蔵する、熊本藩主細川家の「細川家文書」のうち、今までに解読できていなかった古文書、およそ5万枚、950万字の解読に成功したのですが、古文書の専門家、熊本大学永青文庫研究センター、センター長の稲葉継陽教授に、この新しい手法での解読について、まずは率直な感想を伺ってみました。

熊本大学永青文庫研究センター長 稲葉継陽教授

「90年間、毎日の奉行所の記録ということになります。

これは一か月くらいなんですよね。いったい人力でやったらどのくらいかかるかっていうのは想像もつかないですよね。

特別な技術を持った研究者でないと、江戸時代の古文書っていうのは読めないので、文字データ化していくっていうのは、一文字一文字読んでパソコンに入力していくっていう作業を経ないと、できないことだったんですね、今までは。膨大な労力がかかるわけですよね。

歴史学者は歴史の論文を書くわけだけど、基本的には個人個人が読めた範囲の古文書を使って、あるテーマの論文を書く、そういう個人作業に留まっていたわけですよね。なので、大量の古文書の中からデータを引き出すっていう作業は、研究の大きな壁になっていたわけです。

あ~そうですね、スピード自体は驚異的だと思いますよ。ただし、解読の精度ということになると、まだ70%程度の正答率しかないんですよね。そうだな~、うちの大学の2年生くらいじゃない?(笑)。」

90年分を一か月で解読!これはすごいですよね!この量の古文書を人力で解読するとなったら、2~3年どころじゃ全然足りないほど。非常に驚異的なスピード、ということでした。

しかも、江戸時代の古文書のくずし字を読む専門家を養成しているところは、ごくごく限られた大学の講座しかないため、専門家も多くないため、大勢で人海戦術で読む、というのもなかなか難しかったんです。

というわけで、驚異のスピードで解読できるようになったわけですが、正答率は70%ほど。

まだ10文字中3文字は読み間違えているのですが、専門家が正解をAIに学習させて、精度を上げる作業を積み重ねて精度を上げていく作業をしていくそうです。

江戸時代の古文書の解読力アップが、現代の防災にも役立つ?!の画像はこちら >>

(このように、AIが解読していきます! 写真提供はすべて稲葉先生)

とはいえ、実は今回の文書は、細川のお殿様が口頭で出した命令や、それに対する家臣の動きなどを逐一書き留めた執務記録や、会議の議事録の走り書きのような文書も含まれているので、稲葉先生曰く「超難しいもの」だそうで、このレベルの古文書がこれだけ解読できるのは、やはり大きな進歩だ、と。

江戸時代の古文書の解読力アップが、現代の防災にも役立つ?!

(こちらが、今回解読された「細川家文書」の一部。これを解読するのは大変!)

大雨、洪水、地震、飢饉。調べたいものをキーワード検索!!

そして、もう一つの大きな進歩が、古文書をデータ化することで可能になったキーワード検索。これが非常に大きい、と稲葉先生はおっしゃいます。

熊本大学永青文庫研究センター長 稲葉継陽教授

「70%程度の解読率であったとしても、キーワード検索はかなり正確にできるわけですよね。

例えば、洪水・大雨っていうキーワードをかけてみると、江戸時代のそうした災害に社会や熊本藩の統治機構がどんな風に対応したかっていうことが克明に記録されている、そういう記事に行き当たることになるんですよ。

例えばね、江戸時代の半ばくらいの洪水では、熊本藩の担当者たちが、白川の河口に舟を浮かべて待ち受けていて、人や物をそこでキャッチしてるんですよ。相当、僕、驚きました。つまり、災害の対応の記録を見ていると、身分制度の社会であっても身分を超えてしまって、命や財産は平等だという観点からギリギリの対応をしてるっていう、そういう歴史資料がこのシステムを使うことによって抽出されてきて、びっくりするような、今まで知られてないような江戸時代の社会の在り方っていうのが復元できるんじゃないかな、と思います。」

江戸時代の古文書の解読力アップが、現代の防災にも役立つ?!

(キーワード検索の様子。今までは一冊読んでも空振りということもあったそう。

研究が大きく進みそうですね。)

身分制度が厳しい江戸時代に、こんな災害対応があった、というのはちょっと意外ですよね。でも、身分制度がある中でも災害時はみんなで助け合っていくんだ、という社会的な考え方が、江戸の昔から根っこには私たちにはあるんだ、ということが再認識されるのでは?と、それは史実としての発見とはまた違う価値があると思う、と稲葉先生はおっしゃっていました。

(他にも、飢饉の飢、飢えるという字で検索すると、江戸時代の有名な三大飢饉以外の時にも、集中して出る時期があり、知られざる飢饉の実態を読み取ることもできました。こちらは歴史学的にも大きな発見です。)

古文書を読み解いて、現代の防災に活かせ!

そして、さらに、現在の私たちに、もっと役に立つこともあると稲葉先生は言います。

熊本大学永青文庫研究センター長 稲葉継陽教授


「自治体からハザードマップっていうのが公表されていますが、大きな洪水の記録に伴って、様々な被害を受けた地域の地図が江戸時代にも作られてるんですよ。『この年の台風や洪水の時には、熊本の海辺のこの地域まで高潮の被害を受けた』というようなことを、克明な記録と地図に残しているんですね。

そうしますと、どこまでが江戸時代の干拓地で、どこまでがもとからの大地の上に乗ってる地域なのか、一目瞭然に、江戸時代の災害記録を見ることで認識することができるんですね。

そうすると現在のハザードマップよりも古い時代の、その土地の根本的な性質っていうものをですね、そこに住んでる人々が認識することができるわけですよね。そのことで早めの災害への対応などの非常に大きな役に立つっていうことも言えると思います。で、そういう情報を社会で共有するっていうことが最大の防災の、一つの方法なんじゃないかと思いますけどね。」

史実に基づいた、より精密なハザードマップができる、ということにつながるのではないか、ということなんです。

災害の記録やその土地の特徴は、より多くのデータをもって災害の備えとする方が、当然、心強いですからね。

江戸時代というのは17世紀~19世紀。この同じ時期に、世界で日本ほど多くの書類が作られた地域はないと言われています。一般市民の経済活動などちょっとした契約にも必ず文書を作って約束していました。つまり日本中にこうした資料が読まれずに眠っているのです。

世界最大の歴史遺産である日本の古文書が、読まれないままでは宝の持ち腐れ。しかし、この技術で、活かせるようになりそうです。

語り継ぐ難しさというのもありますから、文字で残された、先人の知恵や経験の積み重ねを、今の技術でしっかり受け取っていきたいですね。


(TBSラジオ『森本毅郎スタンバイ』取材・レポート 近堂かおり)

編集部おすすめ