メモ

JIS漢字に紛れ込んだ「幽霊文字」


日本語の一般的な表記や地名、人名などで用いられる漢字をコンピューターなどで扱うため、1978年に最初の規格「JIS C 6226」が制定されました。この時点で、世界最大の漢和辞典「大漢和辭典」、および収録字数が多い「新字源」のいずれにも見当たらない幽霊文字が混入していました。その後、第4次規格の作成時に徹底した調査が行われて、いくつかの文字については由来が判明しましたが、なおも12文字が幽霊文字として残っています。

幽霊文字 - Wikipedia
https://ja.wikipedia.org/wiki/%E5%B9%BD%E9%9C%8A%E6%96%87%E5%AD%97


A Spectre is Haunting Unicode
https://www.dampfkraft.com/ghost-characters.html

幽霊文字として残っている12文字をJIS規格の区点順に並べると以下の通り。一部の文字については、他の漢字の誤写・誤認である可能性が指摘されています。


「土+著」(著に点が加わったもの)。宋の時代の韻書「集韻」に「躇」の異体字として収録されているとのことですが、これは手書きで写された本で、他の本では「止+著」であることから、誤写によって生まれた字だとみられています。


「廛」の異体字である「㕓」に土偏を加えたもの。土偏部分が誤記であるとみられています。


1972年版「国土行政区画総覧」に掲載されていた地名、滋賀県犬上郡多賀町𡚴原(あけんばら)の「𡚴」を誤認したものとみられています。元資料の中で「𡚴」の部分は「山」と「女」という漢字を貼り合わせて表記していたため、紙のつなぎ目部分が「一」に見えて「山+一+女」になってしまったようです。


第4次規格作成委員会の調査でも典拠が全く分からなかった唯一の文字。ただ、典拠は不明ながらも「彊」の誤記であると考えられています。


偏の部分が間違いで、木偏の「栩」(とち・くぬぎ)を誤写したものとみられています。


「国土行政区画総覧」に掲載されていた、群馬県東村杲(ひので)小学校の「杲」を誤写した可能性があります。


「国土行政区画総覧」に掲載されていた群馬県前橋市橳島(ぬでしま)の「橳」、あるいは「」を誤写した可能性があります。「橳」がJIS漢字に入ったのは2000年に制定されたJIS X 0213でのことなので、「椦」で代用されることもあったそうです。


「木+竜」で、普通にありそうな漢字ですが、「橦」(木+童)の誤写である可能性が指摘されています。1716年(康熙55年)に作られた「康熙字典」には「櫳」(木+龍)という文字が収録されており、この「龍」を「竜」に置き換えたものという見方もあります。


「虫+常」と、これも組み合わせられた文字はわりとありふれたもの。行政情報処理用基本漢字として明治生命保険相互会社漢字コード表から拾われたものとして収録されましたが、調査では用例が確認できなかったとのこと。現存する日本最古の漢和辞典「新撰字鏡」に収録されているそうです。


「国土行政区画総覧」にある、鳥取県鳥取市祢宜谷(ねぎだに)の「祢」を、示偏ではなく衣偏と誤写した可能性が指摘されています。


「閏(うるう)年」などで使う「閏」(門+王)を「門+玉」と誤記したことが考えられます。


「日本生命人名表」を典拠として採用された文字ですが、用例が確認できない幽霊文字。11世紀~12世紀成立の「類聚名義抄」に用例が見られるとのこと。「馴」(馬+川)の異体字である可能性などが指摘されています。

・関連記事
異なる方向からも読み取れるようにデザインされた文字「アンビグラム」とは? - GIGAZINE

知られざる「&」の歴史、幻の27番目のアルファベットだった - GIGAZINE

古式ゆかしい「変体仮名」が商用・エンベッド含め自由に使えるフォント「Unicode変体仮名フォント」 - GIGAZINE

初心者でもデザイナーのように文字の見た目を劇的によくする「カーニング」をマスターするための9つのポイント - GIGAZINE

in メモ, Posted by logc_nt