メモ

日本語翻訳の「漢字表記の間違い」を海外の開発者にも端的に説明してくれる「Your Code Displays Japanese Wrong」


近年は翻訳アプリの精度が少しずつ向上してきたことで、海外で作られたゲームやアプリが最初から日本語に対応しているケースも増えてきました。しかし、日本語をよく知らない人が翻訳すると、「日本語表記なのに漢字が中国語のもの」という状況もよく発生します。「Your Code Displays Japanese Wrong」はそんな日本語の漢字表記について端的に説明したページで、開発者にこのページへのリンクを共有することで修正依頼をかけやすくなります。

Your code displays Japanese wrong | Your Code Displays Japanese Wrong
https://heistak.github.io/your-code-displays-japanese-wrong/


漢字はそもそも中国で生まれた文字ですが、日本で使われている漢字と中国で使われている漢字は微妙に表記が異なります。さらに中国語圏の中でも、簡体字繁体字で漢字表記に違いがあります。しかし、この差を非日本語母語話者に伝えるのはかなり難しいものがあります。

例えば「刃」という漢字を日本語・簡体字・繁体字で表記した場合が以下の通り。Your Code Displays Japanese Wrongでは、日本語の漢字・簡体字・繁体字はそもそも別であり、日本語表記に簡体字や繁体字が混ざってしまうと、日本語母語話者はかなり違和感を覚えてしまうことが説明されています。


そもそも日本語の漢字と簡体字と繁体字が混同されてしまいがちなのは、Unicodeが設計された時に、文字セットのサイズを小さくするために中国語・日本語・韓国語で使われる同等の漢字には同等のコードポイントが与えるUnihanが定められたためです。「刃」は日本語の漢字と簡体字と繁体字と韓国語の漢字でそれぞれ見た目が異なりますが、Unicode上では同じコードポイントを与えられており、レンダリングの時に選択した文字セットに応じてふさわしい漢字を表示する仕組みです。

つまり、日本語に翻訳しているのに簡体字や繁体字が表示されてしまう現象の多くは、文字セットを日本語に設定していないことが原因。デフォルトだと簡体字が文字セットに設定されてしまうことが多いので、文字セットを日本語に設定していないと「日本語表記なのに漢字が簡体字表記になる」ということが起こるわけです。

by O tamon

Your Code Displays Japanese Wrongは「漢字表記が間違っていても完全に読めなくなるわけではないので、この問題は軽微なものと見なされ、優先度が低くなりがちです。しかし、この問題はaとαの違いよりもはるかに大きいものです」と解説し、簡体字混じりの日本語表記は、日本語母語話者に「この開発者は言語について気にかけていない」という印象を与えてしまうと警告しています。

Your Code Displays Japanese Wrongでは、ウェブ開発とゲーム開発で、文字セットの変更方法も記載されています。そのため、もし「日本語なのに漢字が簡体字で表記される」という件で開発者に修正を依頼したい時は、このYour Code Displays Japanese Wrongのリンクを共有することで、説明と修正方法を提示することが可能です。

なお、Your Code Displays Japanese Wrongの制作者は日本人エンジニアの井口健治さんです。

この記事のタイトルとURLをコピーする

・関連記事
AIくずし字認識アプリ「みを(miwo)」を使ってみた - GIGAZINE

絵文字の偉大な功績の1つは「文字コードを統一したこと」 - GIGAZINE

漢文風プログラミング言語「文言」を読み解いてみた - GIGAZINE

テレビで何度も見たあの「平成」と「令和」の書を拝んで平成に別れを告げてきました - GIGAZINE

in メモ, Posted by log1i_yk

You can read the machine translated English article here.