大分・中津・別府の個別指導

慶林館ブログ

AIで「くずし字」解読

前回で終了予定だった「古典シリーズ」ですが、

タイムリーなニュースが飛び込んできたので、またまた続けます。

 

前回、「変体仮名」の「翻刻」作業について触れていましたが、

なんとその作業をAI=人工知能を使って行うというのです。

NHKのニュースによると、人間だと最低10分ほどかかる1ページのくずし字を、

AIならほんの数秒で解読できるのだそうです。

 

もちろん、100%ではありませんから、人間が見直しをしなければなりませんが、

ゼロから翻刻することを考えれば、どれほど楽になることでしょう。

くずし字解読の精度を上げるために行われた国際コンペで優勝した中国のチームは、

95%の割合でくずし字を正確に解読できたということですから、

人間の手で残りの5%を確認するだけで良いということになります。

 

人文学オープンデータ共同利用センターが開発した解読システムは、

古文書のどこにどのような文字があるのかを、AIが画像として認識し、

文字の形の特徴を、あらかじめ学習したおよそ100万字分のくずし字のデータと照らし合わせて、

今の文字に置き換えていくのだそうです。

 

文字を順番に解読するのではなく、ことばの意味や前後のつながりを考慮せずに、

形の特徴だけで判別するので、文字を読む順番についても判断できません。

文章の意味を正確に理解するには、専門家の確認作業が必要となります。

 

国内には、くずし字で書かれた過去の資料が、数億点規模で残されているそうで、

内容が読めないので価値が分からず、廃棄されてしまったりするといいます。

このシステムが普及することで、いろんな研究が進むことが期待されます。

 

AIが肩代わりしてくれる仕事が増える分、

人にしかできないことの価値を高める楽しみも増える気がします。

生徒の皆さんは、将来どんな仕事をするのでしょうか。

自分にしかできない何かに出会えると良いなと思います。

 

AIで古文書を読む 難読“くずし字”も「パズル感覚」