2025年11月26日 08時00分 レビュー

AIにテキストが読み取られるのを防ぐために目に見えないUnicode文字を挿入する「Gibberifier」



近年はChatGPTやGeminiなどの生成AIツールが普及していますが、学校の課題レポートをAIに丸投げして生成したり、企業の機密事項や個人情報を生成AIに入力してしまったりと、問題があるAIの使い方をする人も大勢います。そこで開発者のwdpatti氏が、テキストに目に見えないUnicode文字を挿入し、AIに読み取られるのを妨害するツール「Gibberifier」を開発しました。



Gibberifier

https://gibberifier.com/



GitHub - GeneploreAI/gibberifier: Stun LLMs with random Unicode characters

https://github.com/GeneploreAI/gibberifier



文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。



Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です。



Gibberifierのトップページが以下。





上部の入力フォームに難読化したいテキストを入力し、「Gibberify Text」をクリック。なお、Gibberifierで難読化できるテキストは約500文字までとのこと。





すると、下部の出力フォームに難読化済みのテキストが表示されました。このテキストはそのままコピー可能です。





出力フォームの下にはゼロ幅文字を含む出力テキストのUnicodeや、元テキストの文字数と難読化後のテキストの文字数などが表示されています。





Gibberifierのページ下部にはさまざまなチャットAIへのリンクが貼られており、ここから難読化後のテキストをテストしてみることができます。今回は「See ChatGPT」をクリックして、ChatGPTでテストしてみます。





ChatGPTにコピーしたテキストを貼り付けて送信ボタンをクリック。





すると、通常であればすぐに回答されそうな単純な内容であるにもかかわらず、返信までにかなり時間がかかります。





数十秒が経過して返ってきた答えは、「It seems like you sent a very long string of characters, some of which appear to be Japanese. Are you trying to share something specific or is there something I can help with? Let me know how you'd like to continue!(非常に長い文字列を送ってましたが、その一部は日本語のようです。何か特定の内容を共有したいのでしょうか。それとも、何かお手伝いできることはありますか？今後の進め方について、希望を聞かせてください！)」というもの。「シャーロック・ホームズの相棒について教えて」という質問の答えになっていない上に、日本語ですらありませんでした。





試しに難読化したテキストをメモ帳に貼り付けてみると、さまざまな目には見えない文字が含まれていることが確認できました。





元のテキストをGibberifierを通さずにChatGPTへ入力してみると、問題なく答えが返ってきました。





開発者のwdpatti氏は、ソーシャルニュースサイトのHacker Newsに自らスレッドを立てています。



Show HN: Stun LLMs with thousands of invisible Unicode characters | Hacker News

https://news.ycombinator.com/item?id=46029889



スレッドには、Gemini 2.5 flashがテキストの難読化を見抜いてきたというコメントや、難読化したテキストを用いると音声読み上げ機能を使う視覚障害者に問題が生じるという指摘などが寄せられています。また、AI開発企業がゼロ幅文字を検出してフィルタリングするのは簡単だという指摘に対しては、「AI開発企業がコンテンツを盗もうとする試みを回避するソフトウェアの構築／コーディングを行う立場に立たされ、法廷で不利になる可能性がある」という反論もありました。

