AI

AIでさえ「AIが書いた文章」を検出するのが難しいのはなぜ?


生成AIの発達によって誰もが高品質な文章を生成できるようになりましたが、教師が学生のレポートを採点する時や、製品購入時に誰かのレビューを参考にする時など、文章がAI製かどうかを見分けたい場面も存在します。ミシガン大学のAI研究者であるアンブジ・テワリ教授が、AI生成のテキストを検出するシステムの仕組みや課題についてまとめました。

Why it’s so hard to tell if a piece of text was written by AI – even for AI
https://theconversation.com/why-its-so-hard-to-tell-if-a-piece-of-text-was-written-by-ai-even-for-ai-265181


近年では教育現場などで「AIにレポートを書かせることを禁止するルール」が設けられる場合がありますが、これを施行するには「特定のテキストがAIによって生成されたかどうか」を検出することが必要となります。これまでの研究では、AIライティングツールを頻繁に使用する人はAI生成テキストをより正確に判別できることが示されており、人間は制御された環境下において自動化ツールより優れた結果を出すこともあります。

しかし、こうした感覚は一部の限られた人しか持っていないため、個々の判断には一貫性がありません。そのため、大規模な一貫性が必要な機関では、自動化されたAI生成テキスト検出器に頼っているとのこと。

AI生成テキスト検出器は、AI生成かどうかを特定したいテキストを分析し、そのテキストがAIによって生成された可能性を示すスコアを算出します。通常は確率的に表示されるこのスコアに応じて、人間の意思決定者が判定を下すというワークフローが一般的です。


テワリ氏は、AI生成テキスト検出器には大まかに分類して以下の3種類があると説明しています。

◆1:トレーニング済みAIを用いた方法
1つ目のアプローチは、「人間が書いたテキスト」と「AIが生成したテキスト」のラベル付きデータセットを用意し、これでAIモデルをトレーニングして両者を区別できるようにするものです。ここでは実質的に、AI生成テキストの検出はスパムフィルタリングと似たような分類問題として扱われます。幅広いAIツールからの出力をデータセットに含めれば、テキストを生成したAIツールがわからなくても機能します。

◆2:AI生成テキストの統計的シグナルを用いた方法
2つ目のアプローチは、特定のAIモデルがテキストを生成する方法に関連する統計的シグナルを探し、テキストがAI生成かどうかを評価するという手法です。たとえば、AIモデルが特定の単語のシーケンスを異常に高い確率で生成する場合、この単語のシーケンスを含むテキストはそのAIモデルによって生成されたものである可能性が高いというわけです。このアプローチを実装するには、問題となるAIツールにアクセスして分析可能であることが必要です。

◆3:テキストに埋め込まれた「AI透かし」を検証する方法
生成コンテンツに「AI透かし」を埋め込むAIツールがテキスト生成に使われていた場合、AIベンダーが提供する秘密鍵を使用することで、テキストにAI透かしが入っているかどうかを評価できます。このアプローチはテキストそれ自体ではない情報に依存していますが、AIベンダーの協力が必要不可欠です。


既存のAI生成テキスト検出器にはそれぞれ限界があり、どの手法が優れているのかを断言するのは難しいとのこと。たとえばトレーニングベースの検出器は、新しいAIモデルのトレーニングに使用されたコーパスが大きく異なる場合、検出精度が大幅に低下する可能性があります。

また、統計的シグナルを利用した検出器は、特定のAIモデルがどのようにテキストを生成するかという仮定、あるいはそれらのモデルの確率分布へのアクセスに依存しています。AIモデルが独自に構築されたものであったり、頻繁にアップデートされたり、あるいは未知のものであったりする場合はうまく検出できません。


AI透かしを利用した手法は問題を「検出」から「検証」へと変えますが、AIベンダーの協力がなければ実装できないという課題があります。また、ユーザーが何らかの手段でAI透かしを無効化できてしまう場合も役に立たないとのこと。

テワリ氏は、「広い視点で見れば、AI生成テキスト検出器は激化する軍拡競争の一環です。検出器が有効であるためには公開されている必要がありますが、その透明性によってAI側が回避することが可能になります」「結局のところ、検出器のようなツールが決して完璧ではないという事実と共存する方法を学ばなければならないのです」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
「GPT-5が生成した超短編小説」と「経験豊富なプロ作家が書いた超短編小説」はほとんど区別できないというテスト結果 - GIGAZINE

AI検出器は人間の学生が書いた文章の1~2%をAI製と誤認、ぬれぎぬで試験を落とされる学生にとってはたまったものではない精度 - GIGAZINE

ケニア人が「ChatGPTっぽい書き方をしている」と言われてしまう理由 - GIGAZINE

新聞がうっかりAIの出力結果をそのまま紙面に掲載してしまう事態が発生 - GIGAZINE

AIはあくまで「言葉の計算機」に過ぎずユーザーが想像するような思考や推論はしていないと専門家が指摘 - GIGAZINE

大規模言語モデルがどのように言葉をトークンに分解して処理するのかを視覚化する「Meaning Machine」 - GIGAZINE

ライティングの授業で「AIを使うな」と禁止するのではなくAI利用についてより深く問いかけた結果とは? - GIGAZINE

大学生の「ほぼ全員」が生成AIを使っているとの調査結果で教育界に激震が走る - GIGAZINE

in AI, Posted by log1h_ik

You can read the machine translated English article Why is it difficult even for AI to detec….