石川温のPCスマホニュース解説

AIは地球を救う (3/4)

文●石川温

2019年07月22日 09時00分

●AIでくずし字を翻刻

 個人的にも「面白い」と思ったのが、「くずし字」を自動的に読みって現代語に翻刻(翻訳ではないらしい)するAIだ。その昔、古文の授業でくずし字を読み解くのが難しくて本当に嫌いだったが、AIを使うことで、くずし字を現代語にすぐに変換してくれるという。

 情報・システム研究機構データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員であり国立情報学研究所のタリン・カラーヌワット氏は「日本では1000年以上、くずし字が使われてきたが、1900年に教科書からくずし字が消えた。いまでは人口の0.01%以下の人しか読むことができない。しかも、今では図書館などで古い書物がデジタルデータ化されているが、画像が多くてアクセスできない。すべても書物を書き起こすと研究者一人当たり500年かかってしまう」と語る。

 そこで、国文学研究資料館が持つくずし字のデータを学習させるとともに、1文字ずつくずし字を認識。これにより、1ページあたり2秒でくずし字を現代語として置き換えることに成功。書物にもよるが、1時間あれば1冊の翻刻が可能になったという。

 精度としては85%ほどなのだが「16冊の書物で試したデータに過ぎない。将来的に、学習が増えれば正確性も上がってくるはずだ」(タリン氏)とのことだ。

mobileASCII.jp TOPページへ

mobile ASCII

Access Rankingアクセスランキング