メモ

目に見えないUnicode文字をコピペして使えたり元のUnicode文字を検索したりできる「Invisible Characters」


世界中の文字を収集して文字コードを付与する規格「Unicode」では、バージョンアップごとに次々と絵文字が追加されたり、画像じゃなく文字で出力するためコピー&ペーストが可能なカレンダーを作成できたりと、文字を使ったさまざまな表現を使うことができます。そのようなUnicodeの「目に見えない文字」はどういった種類があってどのように利用できるのかをまとめた「Invisible Characters」では、目に見えないUnicode文字をコピペして使えたり、テキスト内に含まれる目に見えないUnicode文字を検出したりすることができます。

Unicode characters you can not see
https://invisible-characters.com/

人気のオンラインマルチプレイヤーゲーム「Among Us」では、プレイヤー名を設定する際に空白のままにしたり、空白スペースだけを入れたりといった設定は不可能になっています。しかし、Unicode文字で空白スペースを意味する文字を入力すると、空白の名前を設定することができるそうです。


また、YouTubeで動画を投稿する際には、動画タイトルが空白やスペースのみだと、以下の画像のように「動画にタイトルを付けてください」と表示される他、右下の「次へ」がグレーで表示されクリックできず、投稿を完了することができません。


一方で以下の画像では、スペースの代わりに「U+200C ZERO WIDTH NON-JOINER」というUnicode文字を入力したところ、見かけ上はタイトルに何も入力されていない状態で設定が可能になっています。


すると、以下の画像のように、通常は動画のタイトルが入るエリアに何も表示されない動画にすることができます。


Invisible Charactersで紹介している「目に見えないUnicode文字のリスト」は以下の通り。なお、「U+」から始まる文字列がUnicode文字で、その右に記されているのがUnicode文字の効果となっており、Invisible Charactersのページからはそのまま利用できるUnicode文字を直接コピーすることも可能です。


・U+0009 水平タブ(長い空白)
・U+0020 スペース
・U+00A0 自動改行を防ぐ固定スペース
・u+00ad ソフトハイフン
・u+034f 結合文字の作成
・u+061c アラビア文字のテキスト方向
・u+115f ハングル朝鮮語フィラー
・u+1160 ハングル中文フィラー
・u+17b4 クメール語の母音固有のaq
・u+17b5 クメール語の母音固有のaa
・U+180E モンゴル語の母音セパレータ
・U+2000 enクワッド(2分の1em)
・U+2001 emクワッド(emは現在のフォントの高さ)
・U+2002 enスペース
・u+2003 emスペース
・U+2004 3分の1em幅のスペース
・u+2005 4分の1em幅のスペース
・u+2006 6分の1em幅のスペース
・u+2007 固定幅の数字と同じ幅のスペース
・u+2008 ピリオドと同じ幅のスペース
・u+2009 6分の1em~4分の1emのシンスペース
・u+200a シンスペースよりさらに狭いヘアスペース
・u+200b ゼロ幅スペース
・u+200c ゼロ幅ノンジョイナー
・u+200d ゼロ幅ジョイナー
・u+200e 左から右へのマーク
・u+200f 右から左へのマーク
・u+202f 狭い改行無しスペース
・u+205f 中程度の数学的(18分の4em)スペース
・u+2060 ワードジョイナー(ゼロ幅の改行無しスペース)
・u+2061 関数の適用
・u+2062 2項の乗算を示す
・u+2063 2項のセパレータ
・u+2064 2項の加算を示す
・u+206a 対称的なスワッピングを禁止する
・u+206b 対称的なスワッピングを有効にする
・u+206c アラビア語のフォームシェーピング(オフ)
・u+206d アラビア語のフォームシェーピング(オン)
・u+206e ナショナル数字シェーピング
・u+206f 名目上の数字のシェーピング
・u+3000 表意文字スペース
・u+2800 点字パターンの空白
・u+3164 ハングルフィラー
・u+feff ゼロ幅改行なしスペース
・u+ffa0 半角ハングルフィラー
・u+1d159 音楽記号の「符頭(なし)」
・u+1d173 音楽記号「ビーム(開始)」
・u+1d174 音楽記号「ビーム(終わり)」
・u+1d175 音楽記号「タイ(開始)」
・u+1d176 音楽記号「タイ(終わり)」
・u+1d177 音楽記号「スラー(開始)」
・u+1d178 音楽記号「スラー(終わり)」
・u+1d179 音楽記号「開始フレーズ」
・u+1d17a 音楽記号「終了フレーズ」

また、Invisible Characters内にある「View invisible characters」では、見えないUnicode文字を検索することができます。まずは、「目には見えないけれど文字があるはず」という部分を選択してコピー。


コピーしたものをView invisible charactersにペースト。ここでは、改行と「限定公開」というテキストのみをコピー&ペーストしたことがわかります。ペーストできたら「View」をクリック。


すると、「限定公開」という通常のテキストとは別に、「U+3164」「U+000A」という二つの「目に見えないUnicode文字」が含まれていたことが分かります。「U+3164」は空白のタイトルを成立させるためのコードで、「U+000A」は改行を示しています。


検出したUnicode文字がInvisible Charactersの一覧に含まれている場合は、文字をクリックすることでUnicode文字の詳細を読むこともできます。

この記事のタイトルとURLをコピーする

・関連記事
コピペできるテキスト用カレンダーを一瞬で作成可能な「Unicode Calendar Generator」レビュー - GIGAZINE

「ハイタッチ」「ピンクのハート」「(((( ;゚Д゚)))」などUnicode 15.0に含まれる絵文字まとめ - GIGAZINE

Unicodeに含まれる謎の記号「⍼」の起源を追ったレポートが公開中 - GIGAZINE

絵文字の偉大な功績の1つは「文字コードを統一したこと」 - GIGAZINE

一風変わった見た目の文字を簡単にTwitterに投稿できる「PlainStyle」を使ってみた - GIGAZINE

in Posted by log1e_dh

You can read the machine translated English article here.