Facebookがトレンドのためにチェックしているサイトのリストを公開
by Andy Wright
「Facebookの元契約社員」を名乗る人物が、Facebook(英語版)で提供されている「トレンド」機能の話題のピックアップから、保守寄りのニュースが排除されていることを暴露しましたが、これに対してFacebookが「人力ではなくアルゴリズムで生成している」と、実際に「トレンド」のチェックに用いているサイトのリストを公開しました。
Information About Trending Topics | Facebook Newsroom
http://newsroom.fb.com/news/2016/05/information-about-trending-topics/
Facebookのヴァイスプレジデントであるジャスティン・オソフスキー氏によると、トレンド機能は、人々が興味を持っている話題を通じて交流できるようにと、個人のニュースフィードとは別に2014年に追加されたもの。トレンドに何が入ってくるのかは人力ではなく、Facebook独自のアルゴリズムに従っています。先の暴露では「保守寄りのニュースが排除されている」とのことでしたが、オソフスキー氏は、サービス利用者に対して価値のある経験を提供することが目的であり、任意の政治的要素が含まれることを理由に排除することは認めていない、と説明しています。
この「トレンドに入ってくる話題」については、できるだけ素早く最新の話題に触れられるように、外部サイトのRSSを利用しているとのこと。そのリストが下記PDFファイルです。
rss-urls.pdf
(PDFファイル)https://fbnewsroomus.files.wordpress.com/2016/05/rss-urls.pdf
リストは「国名」「カテゴリ」「RSSのURL」がセットになっています。上の方はアメリカのサイトが並び、続いてカナダ、インド、イギリス、オーストラリアの順で並んでいます。カテゴリは「一般」「政治」「経済」「健康」「科学」「スポーツ」「技術(IT)」「エンターテインメント」「ゲーム」の9つ。
The Guardianが提供を受けたという資料では、英語版以外での展開も見据えてか、英語圏以外のサイトのデータとしてブラジル、スペイン、ポルトガル、メキシコ、その他ラテンアメリカのものが含まれています。
話題自体はこのRSSリストに含まれているサイトから取り上げられるわけですが、「どれを取り上げるのか」という判断が必要になります。オソフスキー氏は「人力ではなくアルゴリズムを使っている」と説明しましたが、どういうアルゴリズムなのかというと「複数のサイトで取り上げられる話題は、きっと重要な話題なのだろう」というもの。そこで、下記リストに含まれる1000以上のサイトのうち、少なくとも3つ以上のサイトで取り上げられていることを確認するとのこと。
media1k-domains.pdf
(PDFファイル)https://fbnewsroomus.files.wordpress.com/2016/05/media1k-domains.pdf
リストはドメインが数字・アルファベットの昇順で並んでいます。上の方は、あまり日本では有名ではないサイトが並びますが……
IT系ニュースサイトのArs Technicaや朝日新聞デジタル(asahi.com)、ASCII.jpなどが入っています。これより後方にはGIGAZINEも含まれていました。
ニュースサイトではありませんが、画像共有サイトのImgurなども。
こうして話題がピックアップされるわけですが、個人によって好みの話題には差があるので、ここからさらに各個人向けに最適化が行われます。
ちなみに、Facebook側で特定の話題を除去するようなことはしていないものの、アルゴリズムで処理している都合上、玩具の「LEGO」と、映画「LEGOムービー」が同じ話題としてまとめられてしまうようなことがあるため、新たなトピックIDを作ったり、IDを入れ替えたりすることはあるとのこと。
なお、Facebookは今回の「特定の話題が除去されている」という訴えを深刻に受け止めており、現時点ではトレンドが操作された証拠は見つかっていないものの、さらに社内調査を継続することを表明しています。
・関連記事
Facebook上で「トレンド」はどうやって生まれるのか? - GIGAZINE
Facebookが人気のトピックを集めた「トレンド」から保守系の内容を意図的に排除か、元スタッフを名乗る匿名の人物が証言 - GIGAZINE
Facebookのニュースフィードを生成するアルゴリズムはどのようにして決められているのか? - GIGAZINE
すさまじいまでのFacebookの成長と稼ぎっぷりを示す決算報告&各種データが公開される - GIGAZINE
・関連コンテンツ