リカレントニューラルネットワークで点訳

点訳とは書籍を点字図書に変換する仕事だ.日本ではボランティアによって行われている.私もその一人だ.日本は世界でいちばん点訳ボランティアが多いそうだ.すばらしいことだ.点訳は文字を6個の点で表した点字に変換する作業だと思われがちだが,実はそこは本質ではない.いちばん時間がかかるのは点訳専用の「分かち書き」をするところだ.点訳の作業時間の80%は分かち書きの下調べに費やされる.分かち書きは目の見えない人が点字を読んだときに同じ音の別の単語と意味を取り違えないために必要だ.分かち書きには細かいルールがあり,例外もたくさんあり,身に付けるのに数年を要する.なので点訳ボランティアになるのはけっこうな努力が要る.

点訳ボランティアが1冊の単行本を点訳するのにはだいたい半年かかる.それから別の人が校正をして,特殊なプリンタで紙に点字を打って,点字図書館に納められる.今点字図書館にある点字図書は2万タイトルくらいだ.すごく少ない.そしてそれらの本は全て単行本だ.目の見えない人も週刊誌とかを読みたいだろうけれど,点訳に時間がかかるため,週刊誌のようにタイムリーに読まなければ意味のない書籍は点訳の対象となっていない.

点字図書をもっと増やしたい.1000万タイトルくらい欲しい.人手でやると1000万×半年=500万人・年かかる.不可能だ.週刊誌も発行日の次の日くらいには点字図書にしたい.そこでディープラーニングだ.リカレントニューラルネットワークで分かち書きを実行するのだ.今点字図書館にある2万タイトルは電子データがある.それを教師データとしてニューラルネットワークを学習させれば分かち書きを機械でできるようになる.分かち書きさえ自動化できれば点訳は一瞬で終わる.律速段階は点字プリンタの印字速度になる.これをやってみたい.

私がこのまま人手で点訳を続けても,残りの人生で点訳できる本の数はせいぜい60冊だ.それならば点訳用リカレントニューラルネットワークを1年かかって作った方がよほど効率が良い.やってみよう.