同音異義語

日本語は「<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-221.html" target="_blank" title="同音異義語">同音異義語</a>」が多いという特徴があります。

文字を見ればすぐ区別がつきますが、話し言葉では文脈によって判断しなければなりません。

パソコンなどの日本語変換システムも、人間と同じように、文脈で判断しているようです。

入力のしかたによっては、かなり正確に、同音異義語を変換してくれます。

たとえばこんな感じ。

「きしゃのきしゃがきしゃできしゃした」→「貴社の記者が汽車で帰社した」

どのような日本語変換システムを使っても、このフレーズの漢字変換はほぼ完璧でしょう。

変換の正確さを調べるときによく使う「定型文」なので、こっそり辞書登録させてある、というウワサです。

「かしつしたのはかしつでした」→「加湿したのは過失でした」

こんなにムシムシするのに、なんで加湿したんだ、除湿だろう、と怒られたときのセリフ(のつもり)。

「おしょくじけんをくばったおしょくじけんがおきた」→「お食事券を配った汚職事件が起きた」

「起きた」を加えなければ誤変換してしまいます。やはり文脈が大事です。

ここに挙げたような、長ったらしいフレーズを一発で変換するようなことは、普通しませんけどね。

笑える誤変換に「不意打ち」されると、ちょっと楽しくなりますね。同音異義語の多い日本語の面白さです。

そんな時、私はわざと何度も誤変換を再現してみたりするので、辞書が誤った学習をしてしまうのが問題。