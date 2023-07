2023年07月11日 12時17分 サイエンス

英語を母語としない人が書いた文章が「AIにより作成されたもの」と誤検知されている



ChatGPTやBardのような高度な文章作成能力を有するチャットAIの登場により、「AIが作成した文章」を判別するためのツールが求められるようになっており、日本の企業もChatGPTの文章を判別するためのソフトウェアを開発したことが報じられています。しかし、この種のツールは英語を母語としない人が書いた文章を「AIにより作成されたもの」と判別してしまうことが最新の研究により明らかになりました。



GPT detectors are biased against non-native English writers: Patterns

https://www.cell.com/patterns/fulltext/S2666-3899(23)00130-7





Programs to detect AI discriminate against non-native English speakers, shows study | Artificial intelligence (AI) | The Guardian

https://www.theguardian.com/technology/2023/jul/10/programs-to-detect-ai-discriminate-against-non-native-english-speakers-shows-study





GPT detectors can be biased against non-native English writers

https://techxplore.com/news/2023-07-gpt-detectors-biased-non-native-english.html



ChatGPTのような高精度な文章を生成できるAIの登場により、AIを用いた最新の不正行為を防止するため、「AI生成文章を検出するためのツール」が求められるようになりました。実際、テキスト生成AIとして有名なChatGPTを開発するOpenAIは、「AIで書かれた文章」を見抜くためのツール「AI Text Classifier」をリリースしています。



OpenAIが「AIで書かれた文章」を見抜くツールをリリース - GIGAZINE





この種のAI生成文章検出ツールは「検出精度99%」などと、検出精度の高さをアピールするケースがあります。しかし、実際にはかなり多くの誤検出を行うことが明らかになっています。



スタンフォード大学の生物医学データサイエンス学部で准教授を務めるジェームス・ゾウ氏が率いる研究チームは、英語を母語としない人に対して英語能力を判定するテストとして知られるTOEFL向けのエッセイを書いてもらうよう依頼しました。そして、作成された91編のエッセイを7つのAIテキスト検出ツールにかけ、「AIが生成した文章かどうか」を判別させるというテストを実施しました。



その結果、エッセイの半数以上がAIにより生成されたものと判別されてしまったそうです。使用されたツールの中には、98%の精度でエッセイを「AIが作成したもの」と判別してしまうものも存在したそうです。一方で、英語を母語とするアメリカの中学2年生が書いた作文を同様のツールにかけたところ、ツールは「90%以上の確率で人間が作成した文章」と判別しました。





これらのAIテキスト検出ツールは、いわゆる「テキスト困惑度」を調べます。これは文章内の次の単語を予測しようとする時に、生成言語モデルがどの程度「驚いた」あるいは「混乱した」かを示す尺度です。モデルが次の単語を簡単に予測できる場合、テキストの複雑さは低くランク付けされますが、次の単語の予測が難しいことが判断された場合、テキストの複雑さは高く評価されることとなります。



ChatGPTなどの大規模言語モデル(LLM)は、このテキスト困惑度が低い文章を量産するようトレーニングされています。つまり、人間が文章を作成する場合であっても、テキスト困惑度が低くなるような単語を選ぶと、文章が「AIにより作成されたもの」と判別されてしまうわけです。そのため、研究チームは「英語を母語としない人はより単純な単語を選ぶ傾向があるため、ツールに『AIが作成した文章』と判別されるリスクが高くなります」と指摘しています。



AIテキスト検出ツールに潜むバイアスを特定したのち、研究チームは被験者が作成したエッセイをChatGPTに「より洗練された単語を使用して書き直すように」と依頼。その後、ChatGPTに書き直させたエッセイを再びAIテキスト検出ツールにかけたところ、AIテキスト検出ツールはすべて「人間が書いたエッセイ」と判別したそうです。





これらの調査結果を踏まえ、研究チームは「ChatGPTによる文章を検出するツールが英語を母語としない人々に与える影響は深刻であるため、これらのツールの使い方についてはよく考える必要があります」と警告しています。さらに、Googleなどの検索エンジンが、英語を母語としない人が書いた文章を「AIが作成した文章」と判断し、該当コンテンツのランク付けを下げる可能性などについても言及。



加えて、「AIテキスト検出ツールにとって最も重要な市場である教育分野では、非ネイティブの学生が不正行為の冤罪をかけられるリスクが高くなり、学生の学業およびメンタルヘルスに悪影響をおよぼす可能性がある」とも指摘しています。