ネットサービス

Twitterに潜む荒らしをたった50ツイートで見極める技術が開発中


インターネット上で他人に嫌がらせをする「荒らし」の「単語と単語の組み合わせを繰り返して使う」といった特徴をアルゴリズムで捉えることで、わずか50ツイートで荒らしを見分けることができるという研究結果が発表されています。

A novel strategy for quickly identifying twitter trolls
https://techxplore.com/news/2020-08-strategy-quickly-twitter-trolls.html


Twitterの荒らし行為は嫌がらせがほとんどですが、別の目的をもって行われているものもあります。たとえば2019年4月には、5000人分以上のbotアカウントが、トランプ大統領のロシアゲート疑惑を否定するためのデマを拡散したとして凍結されていたことが報じられました。

Twitterが5000以上ものボットアカウントを「デマを拡散した」として凍結、謎の「親トランプ」ネットワークの存在が浮き彫りに - GIGAZINE

by Gage Skidmore

フリードリッヒ・シラー大学イェナ校英米研究科のセルゲイ・モナホフ氏は「これまでの研究では、荒らしが行ったツイートのタイミングやハッシュタグ、地理情報などを調査していますが、ツイートの言語的特徴を調べた研究はほとんどありません」と指摘しています。

モナホフ氏は、荒らしが伝えるべきメッセージの数は限られている一方で、「ツイートを見た人を騙すためには、十分な多様性のある言葉やトピックを用いながら、複数回にわたってメッセージを伝えなければならない」という荒らしのたくらみに焦点を当て、社会言語学的なアプローチで調査を行いました。


そこで、ロシアの荒らしが行ったツイートとアメリカの議会議員のツイートで構成されたライブラリを用いてモナホフ氏が調査を行ったところ、荒らしが行うツイートには繰り返し使う単語やその組み合わせに特定のパターンがあることがわかりました。

さらにモナホフ氏は、発見したパターンを応用し、普通のツイートと荒らしのツイートを区別する2つのアルゴリズムを開発。実際にこのアルゴリズムを使うと、荒らしと議会議員のツイートを識別するために必要なツイート数はわずか50ツイートだったとのこと。「トランプ大統領のツイートと荒らしのツイートも正しく区別できていました」と、モナホフ氏は報告しています。

以下のグラフは荒らしのツイートと判断された割合(縦軸)と、アルゴリズムが判断に使ったツイート数(横軸)を示すもので、オレンジ色が荒らしのアカウント、緑色がトランプ大統領のアカウント、青色が議会議員のアカウントをチェックした結果です。50ツイートを精査したところ、荒らしのアカウントは大統領や議会議員のアカウントと比べて3~7倍ものツイートが「荒らしのツイート」として検出されています。


モナホフ氏は「通常、荒らしの書き込みは同じメッセージを繰り返すため、ツイートに特定の単語と単語の組み合わせが際立って含まれるのが特徴です。荒らしかどうかを見極めるには、わずか50ツイートの精査が必要でした」と述べ、ソーシャルメディア上で言論の自由を維持しながら荒らし対策を行うために今回開発されたアルゴリズムを応用可能だとしています。

なお、大統領や議会議員だけでなく、一般市民のツイートと荒らしのツイートを区別するにはさらに研究を重ねる必要があるとモナホフ氏は述べました。

この記事のタイトルとURLをコピーする

・関連記事
「トランプ大統領がTwitterでブロックするのは違憲」という判決を覆すようホワイトハウスが裁判所に要請 - GIGAZINE

Twitter大規模ハッキング事件のオンライン公聴会でポルノ動画が爆音で流れる「Zoom爆撃」がさく裂 - GIGAZINE

ネット上で他者を攻撃しやすいのは一体どういうタイプの人なのか? - GIGAZINE

ネット上の「問題のある人」に適切に対応する方法とは? - GIGAZINE

インターネット上の「荒らし」にはどのように対処するべきか? - GIGAZINE

in ネットサービス, Posted by log1i_yk

You can read the machine translated English article here.