古文変換サービス「古文にする」がSNS上で大きな話題になっている。
「古文にする」は英語の翻訳サイトのようなイメージでお手軽に現代語を古文に変換できる斬新なサービスなのだが、SNSユーザーたちはこれで楽曲の歌詞や思い思いの言葉を古文変換。出てきた奇抜でシュールな変換結果を披露しあって盛り上がっているというわけだ。
たとえば「ハム太郎とっとこうた(合いの手入り)」歌詞は「古文にする」で変換すると以下のようになる。
「とっとこ走るよ薫製肉太郎
すみっこ走るよ薫製肉太郎
いと恋しきはー(えいせーの) ひまわりの種(我もー)
なほ走るよ薫製肉太郎(虎! 炎!電脳! 繊維!潜水夫! 両棒!幻術瓶幻術瓶!)」
「ハム太郎」が「薫製肉太郎」となるのはショッキングだが、思わず吹き出してしまいそうなインパクト…。この反響に対しはサービスの開発者はどのように感じておられるのだろうか?すとうけんたろうさんにお話をうかがってみた。
中将タカノリ(以下「中将」):「古文にする」を開設された時期と、きっかけをお聞かせください。
すとう:「古文にする」は私が運営している「ねこいりねこ」というサイトの1コンテンツとなっております。サイトの開設は2000年で「古文にする」を公開したのが2006年4月8日です。
サイト開設のきっかけは、Appleの現在のiCloudの前身となるサービスに無料でWebページを公開できるというものがあり、それなら試しにやってみようと思ったからでした。しかし当時の定番だったテキストを読ませるタイプのコンテンツは得意ではありません。そこで用意したのが、イラスト主体のゲームブック的なものと、テーマに沿って情報を簡潔にまとめたものと、JavaScriptプログラムです。
当時のJavaScriptは機能が少なく、またブラウザ間で互換性があまりなかったので、できることは限られました。そんな中で、比較的複雑なことができてオリジナリティが出せたのが、テキスト系の処理です。ランダムに言葉を組み合わせたり、検索置換の要領で文章を改変したりするものを作っていました。そういうものに割と慣れてから作ったのが「古文にする」です。
翻訳系の処理には興味があったのですが、英和、和英のような骨組みから変わるようなものはどう考えても大変そうでした。その点、古文なら現代語と共通する語彙も多く、最悪処理できないところはそのままでもごまかしが効きます。
助詞と助動詞と、主だった動詞と形容詞、あと一部の名詞をうまく処理すればそれなりのものができると思いました。古文から現代文じゃなくて現代文から古文にしたのは、現代文のほうがサンプルが手に入りやすく遊びやすいこと、役に立たないものの方が面白そうだという考えによります。
最初のバージョンでは、"文章"を変換した時の面白さに注目して、主に助詞と助動詞の変換に重点を置いていました。タイトルが「"古文"にする」なのはそのためです。
しかし実際は、単語だけを入力して、あまり変化がないことにがっかりする人が多いようでした。そこでバージョン2では名詞の変換ルールもたくさん設定しました。現行のバージョン3ではアルゴリズムと辞書を見直して、カタカナや英語を少しだけ変換する機能を入れました。もう14年前のことなので細かい当時の趣味趣向などは忘れてしまいましたが、以上が「古文にする」ページを開発した経緯です。
中将:開発にあたり苦労された点をお聞かせください。
すとう:開発にあたって苦労したのは、何と言っても辞書データの作成です。当プログラムでは、いったん現代文を(単語レベルでの翻訳を適用しながら)品詞分解したあと、いくつかの文法的な翻訳ルールを適用し、最後に古文として再構築するという流れをとっています。品詞分解には語彙の知識、すなわち辞書データが欠かせません。
さらに現代語から古語に変換するための辞書データも必要です。今のバージョンでは、現代語約35000語、現代語から古語約3500語が使われています。現代語についてはフリーの日本語コーパスを変換して叩き台にしましたが、間違いが多くて取り除くのが大変でした。そのほか、英語(英文中)約3000語、英語(日本語文中)約2000語、カタカナ語約5000語が使われています。
現代語以外は対応する訳語を考えるのも大変です。翻訳は何でもそうですが、原語と訳語は1対1では対応しません。なるべく多くのケースで違和感が出ないように工夫して考えています。
また、文法的解釈が機械的に決まらない場合も困ります。ページの"詳細"にも書いてありますが、助詞の「と」とか、助動詞の「た」とか、「ねえ」とかは、何通りかに解釈できる場合があり、いずれになるかで翻訳結果が変わります。場合によっては人間でも判断つきません。というわけでそこは諦めてどちらかで解釈するようにしています。
中将:何人ものSNSユーザーが翻訳結果をツイートして話題になっていますが、すとう様がお気に入りのものがあればお聞かせください。
すとう:基本的に、目論見通りに変換できているものがお気に入りです。歌なら「お願いマッスル」、「アンパンマンのマーチ」、「おジャ魔女カーニバル!!」、「Cynical」、「Get Wild」、「ハム太郎とっとこうた(合いの手入り)」あたりですね。
逆に、解釈間違いが起きていたりすると、それが気になって楽しめなかったりします。作った人ゆえの見方ですね。ただし「ハム太郎とっとこうた(合いの手入り)」の「幻術瓶幻術瓶!」と「おジャ魔女カーニバル!!」の「除名除名!」は別格です。頑張って訳した結果としておかしなことになっているのは微笑ましい感じがします。「燻製肉太郎」も同様にしばらく笑っていました。しかしだれかのツイートで「ハム=燻製肉」じゃないことに気付いて、しまったと思っているところです。今更直しませんけどね。「めざせポケモンマスター」は自分としては仕組んだ通りに動いているだけなので普通です。
あと「ぴかちゅう」が「ぴかてふ」になっているのにツッコミが入っていますが、言い訳させてください。ぴかてふは歴史的仮名遣いを間違えているわけじゃなくて「ちゅう」を「…という」の転と解釈して、「…といふ」の転である「てふ」に置き換えたものです。ぴかって何だってのは置いといて。
他に作者目線で言うと、係り結びがうまくいったり、現代語で長い言い回しが古文でびしっとまとまっているのを見ると「よっしゃ」と思います。皆さんの古文ツイートももちろん楽しんでいるのですが、たまにサイトの他のページに言及があったりするとなおのこと嬉しいです。また、何人かの方がソースコードを覗いて、その力業加減にあきれてられているもをかし。
中将:大反響が起こったことへのご感想をお聞かせください。
すとう:大反響は素直に嬉しいです。貴重なサンプルを大量にもらえたので、おかしなところを少しずつ直して行っているところです。といっても、ガバ変換はどうせなくならないので安心してください。
◇ ◇
『ねこいりねこ』
URL:https://catincat.jp
『古文にする』
URL:https://catincat.jp/javascript/kogo3.html
◇ ◇
「ねこいりねこ」には「古文にする」をはじめ、すとうさんが開発した膨大なコンテンツがある。一生遊んでいられそうなバラエティの豊富さで、僕もとりあえずお話に出てきた「津軽弁にする」で「アンパンマンのマーチ」を変換してみたところ、古文とは違う趣きがあって面白かった。
読者のみなさんもすとうさんのコンテンツを活用されて、思い思いの楽しさを発見していただければと思う。