AIにテキストが読み取られるのを防ぐために目に見えないUnicode文字を挿入する「Gibberifier」

近年はChatGPTやGeminiなどの生成AIツールが普及していますが、学校の課題レポートをAIに丸投げして生成したり、企業の機密事項や個人情報を生成AIに入力してしまったりと、問題があるAIの使い方をする人も大勢います。そこで開発者のwdpatti氏が、テキストに目に見えないUnicode文字を挿入し、AIに読み取られるのを妨害するツール「Gibberifier」を開発しました。
Gibberifier
https://gibberifier.com/
GitHub - GeneploreAI/gibberifier: Stun LLMs with random Unicode characters
https://github.com/GeneploreAI/gibberifier
文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。
Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です。
Gibberifierのトップページが以下。

上部の入力フォームに難読化したいテキストを入力し、「Gibberify Text」をクリック。なお、Gibberifierで難読化できるテキストは約500文字までとのこと。

すると、下部の出力フォームに難読化済みのテキストが表示されました。このテキストはそのままコピー可能です。

出力フォームの下にはゼロ幅文字を含む出力テキストのUnicodeや、元テキストの文字数と難読化後のテキストの文字数などが表示されています。

Gibberifierのページ下部にはさまざまなチャットAIへのリンクが貼られており、ここから難読化後のテキストをテストしてみることができます。今回は「See ChatGPT」をクリックして、ChatGPTでテストしてみます。

ChatGPTにコピーしたテキストを貼り付けて送信ボタンをクリック。

すると、通常であればすぐに回答されそうな単純な内容であるにもかかわらず、返信までにかなり時間がかかります。

数十秒が経過して返ってきた答えは、「It seems like you sent a very long string of characters, some of which appear to be Japanese. Are you trying to share something specific or is there something I can help with? Let me know how you'd like to continue!(非常に長い文字列を送ってましたが、その一部は日本語のようです。何か特定の内容を共有したいのでしょうか。それとも、何かお手伝いできることはありますか?今後の進め方について、希望を聞かせてください!)」というもの。「シャーロック・ホームズの相棒について教えて」という質問の答えになっていない上に、日本語ですらありませんでした。

試しに難読化したテキストをメモ帳に貼り付けてみると、さまざまな目には見えない文字が含まれていることが確認できました。

元のテキストをGibberifierを通さずにChatGPTへ入力してみると、問題なく答えが返ってきました。

開発者のwdpatti氏は、ソーシャルニュースサイトのHacker Newsに自らスレッドを立てています。
Show HN: Stun LLMs with thousands of invisible Unicode characters | Hacker News
https://news.ycombinator.com/item?id=46029889
スレッドには、Gemini 2.5 flashがテキストの難読化を見抜いてきたというコメントや、難読化したテキストを用いると音声読み上げ機能を使う視覚障害者に問題が生じるという指摘などが寄せられています。また、AI開発企業がゼロ幅文字を検出してフィルタリングするのは簡単だという指摘に対しては、「AI開発企業がコンテンツを盗もうとする試みを回避するソフトウェアの構築/コーディングを行う立場に立たされ、法廷で不利になる可能性がある」という反論もありました。
・関連記事
存在しない「タツノオトシゴの絵文字」をなぜ大規模言語モデルは「ある」と言い張るのか? - GIGAZINE
Unicodeでは一見すると普通の文字の中に「秘密のメッセージ」を埋め込むことが可能だという指摘 - GIGAZINE
全ての開発者が知っておくべきUnicodeについての最低限の知識 - GIGAZINE
Unicodeには大文字でも小文字でもないアルファベットがある - GIGAZINE
Unicodeに含まれる謎の記号「⍼」の起源を追ったレポートが公開中 - GIGAZINE
目に見えないUnicode文字をコピペして使えたり元のUnicode文字を検索したりできる「Invisible Characters」 - GIGAZINE
一見無害な画像の中に文字列を埋め込んでAIを攻撃する恐るべき手法が発見される - GIGAZINE
AIへの「ビジュアルプロンプトインジェクション」攻撃とは何か? - GIGAZINE
イラスト作品や写真作品を毒化して画像生成AIの学習を阻害できる学習防止ツール「Nightshade」 - GIGAZINE
・関連コンテンツ
in AI, ネットサービス, レビュー, Posted by log1h_ik
You can read the machine translated English article Gibberifier inserts invisible Unicode ch….







