日本語は「<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-221.html" target="_blank" title="同音異義語">同音異義語</a>」が多いという特徴があります。
文字を見ればすぐ区別がつきますが、話し言葉では文脈によって判断しなければなりません。
パソコンなどの日本語変換システムも、人間と同じように、文脈で判断しているようです。
入力のしかたによっては、かなり正確に、同音異義語を変換してくれます。
たとえばこんな感じ。
「きしゃのきしゃがきしゃできしゃした」→「貴社の記者が汽車で帰社した」
どのような日本語変換システムを使っても、このフレーズの漢字変換はほぼ完璧でしょう。
変換の正確さを調べるときによく使う「定型文」なので、こっそり辞書登録させてある、というウワサです。
「かしつしたのはかしつでした」→「加湿したのは過失でした」
こんなにムシムシするのに、なんで加湿したんだ、除湿だろう、と怒られたときのセリフ(のつもり)。
「おしょくじけんをくばったおしょくじけんがおきた」→「お食事券を配った汚職事件が起きた」
「起きた」を加えなければ誤変換してしまいます。やはり文脈が大事です。
ここに挙げたような、長ったらしいフレーズを一発で変換するようなことは、普通しませんけどね。
笑える誤変換に「不意打ち」されると、ちょっと楽しくなりますね。同音異義語の多い日本語の面白さです。
そんな時、私はわざと何度も誤変換を再現してみたりするので、辞書が誤った学習をしてしまうのが問題。