大統領選挙でトランプ大統領を勝利に導いたビッグデータを活用したデータ革命とは?

By Michael Vadon

心理学者のミカル・コジンスキー氏は、「Facebookユーザーが何に『いいね』したのか?」から、ユーザーの性格や何を好むのかまで事細かに分析する方法を編み出しました。そんなコジンスキー氏の研究成果は、ドナルド・トランプ氏の大統領選挙勝利に一役買ったそうです。

The Data That Turned the World Upside Down - Motherboard
https://motherboard.vice.com/en_us/article/how-our-likes-helped-trump-win


2017年11月9日の8時30分、スイス・チューリッヒのスンネフスホテルでコジンスキー氏は目を覚ましました。コジンスキー氏は34歳の心理学者であり、スイス工科大学でビッグデータとデジタル革命が内包する危険性について講義するためにスイスへやってきたところでした。コジンスキー氏は世界中で同様の講義を行っており、精神測定やデータを用いた心理学分野の第一人者として知られる人物です。ベッドから起き上がってTVを点けると、大方の予想に反してトランプ氏が大統領選挙に勝利していたそうで、その後の勝利祝賀会や各州の投票状況などの報道を眺めていたとのこと。そして、この選挙の結果が自身の研究と何かしらのつながりがあるとコジンスキー氏は感じたそうです。

これと時を同じくして、イギリスのロンドンを拠点とするマイナーなデータ分析企業のCambridge Analyticaがひとつのプレスリリースを公開していました。その中には「我々のデータを用いた革新的なアプローチが、トランプ次期大統領の勝利において重要な役割を担ったことにゾクゾクしています」という、アレグサンダー・ヤコブ・アシュバーナー・ニクスCEOのコメントが引用されていました。

ニクスCEO率いるCambridge Analyticaは、トランプ氏の大統領選挙におけるオンラインキャンペーンで重要な役割を果たしただけでなく、欧州連合からのイギリス脱退問題(ブレグジット)においても大きな役目を果たしたという実績があります。コジンスキー氏は自身の研究からデジタル革命を可能にし、ニクス氏はそのノウハウを実世界で実行し、トランプ大統領はそこから大きな利益を手にしたというわけです。

By Michael Vadon

大統領選挙で大きな役割を担ったというビッグデータは、我々がオンライン上もしくはオフライン上で行うあらゆる行動をデジタルで追跡した情報のことを指します。インターネットユーザーが「カードで何を購入したか」「Googleで何と入力し、何を検索したか」「スマートフォンで何をチェックしたか」など、あらゆる情報の集積物がビッグデータというわけ。特に、何を好むのかは重要な要素で、例えばGoogleで「血圧 下げる」と検索したあとに、「高血圧治療」の広告が表示されたりするのは、そういった「ユーザーが何を好むのか」を研究してきた結果が反映されているといえます。

そして、トランプ大統領のオンラインキャンペーンを支えたCambridge Analyticaにより、ビッグデータの活用範囲がより広大であることが明らかになりました。これは、2014年のケンブリッジ大学にあるコジンスキー氏の精神測定センターから始まっているそうです。「精神測定」というのは、「サイコグラフィックス」とも呼ばれるもので、個人の心理的な特徴を測定することに注目した研究分野です。1980年代、心理学者による研究チームが人間の5つの性格特性を基に心理状態を評価しようとした「Big Five」が「精神測定」の走り。その5つの性格特性というのは「開放性(新しい経験にたいしてどれくらいオープンか?)」「真面目さ(どのくらい完璧主義者であるか?)」「外向性(どれくらい社交的か?)」「快適さ(どれくらい思慮深く、協力的か?)」「神経症(簡単に取り乱すか?)」でした。「Big Five」は「OCEAN」という呼び名でも知られており、比較的正確に人間を評価することができるとのこと。

この評価を用いることで、人が「何を求めているか?」や「何を恐れているか?」や、それらの感情がどのように各人に作用するのかなどまでわかるそうです。その有用性から、「Big Five」は精神測定における標準技術になりました。しかし、このアプローチではデータ収集に問題があると考えられていました。なぜなら、「Big Five」を用いて正確に精神測定を行うには複雑かつ非常に個人的なアンケートに答える必要があったからです。

By LaTransfo

しかし、その後、インターネットとFacebookが誕生しました。コジンスキー氏はFacebook上の情報を用いて「MyPersonality」というアプリを開発。このアプリは「Big Five」と比べてごくわずかのアンケートに答えるだけで簡単に精神測定が可能になるというもの。アプリの質問に回答するとユーザーは「パーソナリティ・プロフィール」と呼ばれるものを受け取ることが可能となっており、選択肢の中には「Facebookのプロフィールを利用する」というものも含まれていたそうです。コジンスキー氏は「Facebookのプロフィールを利用する」という選択肢を加えることで、Facebookプロフィールという巨大なデータセットを入手することに成功したというわけ。

同様に数年にわたってオンライン上でクイズ形式のアンケートをとり、その回答から回答者の「Big Five」を算出。そして、Facebookへの投稿などから「ユーザーが何を好きなのか?」から、性別・年齢・住所など、あらゆる情報を推定してその精度を上げていきます。その結果、例えば「化粧品の『MAC』が好きな男性には同性愛者が多い」や「異性愛者はウータン・クランが好き」「レディー・ガガが好きな人は外交的」「哲学が好きな人は内向的」といったことが見えるようになってきたそうです。

コジンスキー氏の研究から、個々の情報はとても小さなものでも、何十、何百、何千という異なるデータポイントを集めて組み合わせることができれば、信頼できる予測を生み出すことが可能になりました。そして2012年には、コジンスキー氏率いる研究が「Facebookの『いいね』の数を平均68個分析することで、ユーザーの肌の色(正解率95%)、性的嗜好(正解率88%)、民主党と共和党のどちらを応援しているか(正解率85%)を当てることが可能」であることを証明しました。この手法を用いれば、アルコール・タバコ・ドラッグを愛用しているかや、どういった宗教に加入しているか、誰の親が離婚しているかまで推定することが可能とのこと。

その後もコジンスキー氏は自身のアプリケーションを洗練させていき、最終的には10個の「いいね」から平均的な同僚、70個の「いいね」で友人、150個の「いいね」で両親、300個の「いいね」でパートナーよりもユーザーの趣味嗜好を正確に推定可能となりました。この研究結果を公表した際、コジンスキー氏は「訴訟の脅し」と「仕事のオファー」を電話で受けたそうで、その両方がFacebookからのものだったそうです。

By Thomas Angermann

Facebook上の「いいね」からでもかなり詳細な個人情報を推定できるわけですが、例えば家電話にモーションセンサーが内蔵されていれば、「どのくらいの期間旅行に出かけているか」を推定するのにぴったりな情報を得られるかもしれません。コジンスキー氏は「スマートフォンを利用することは巨大な心理学アンケートを埋めていくようなもの」と述べており、それくらいスマートフォンの中には個人情報がぎっしり詰まっているとのこと。

本質的にいえば、「コジンスキー氏が発明したのは『人間の検索エンジン』だった」と海外ニュースメディアのMotherboard。これを用いれば「心配性な(誰かの)父親」や「怒りっぽい内向的な人」、さらには「優柔不断な民主党支持者」まではじき出すことが可能であり、そのことに気づいていなかったのがコジンスキー氏、それに気づいて選挙戦に応用したのがCambridge Analyticaというわけ。

By oatsy40

「トランプ大統領によるメッセージのほとんどはデータに基づくものです」と語るのは、Cambridge AnalyticaのニクスCEO。トランプ大統領とヒラリー・クリントン氏が舌戦を繰り広げた2016年アメリカ大統領選 第3回討論会では、トランプ陣営はどういった議論を繰り広げるべきかの答えを見つけるために、Facebook上に17万5000個もの異なるバリエーションの広告を出しました。広告は見出し・色・キャプション・写真・動画などそれぞれが少しずつ異なっていたそうです。

また、例えばマイアミ市内のハイチ地区に対してトランプ陣営は、「クリントン財団がハイチ地震の復興支援義援金を着服していた」というニュースを配信し、ハイチにゆかりのある人々がヒラリー陣営に投票したくなくなるような流れを作り出しました。ニクスCEOは「我々は村もしくは団地単位でターゲットとなる人々に話しかけることができます」と述べており、より細かく地域や特定の層をターゲットに広告やニュースを配信して選挙戦を操っていったことがうかがい知れます。

また、潜在的にクリントン陣営に投票する層と見られた左翼よりの人・アフリカ系アメリカ人・若い女性などを選挙戦から遠ざけることが目標であったことをトランプ陣営が海外メディアのBloombergに語っています。トランプ陣営がクリントン氏の評判を下げるために投稿した「ダークポスト」は、ニュースフィードスタイルの広告であるFacebook広告を使ってアメリカ国民の手元に配信されており、例えばその内容は「ヒラリー・クリントンは黒人男性をプレデターと呼んでいる」といったようなものです。


トランプ陣営のデジタル部隊により見事選挙戦に勝利したわけですが、その正体を選挙戦中に目にすることはありませんでした。なぜなら、トランプ陣営のデジタル部隊はメディアの主流であるテレビはターゲットとしておらず、その代わりにソーシャルメディアやデジタルTVなどを用いたからです。

トランプ陣営でデジタル戦略に奔走したCambridge Analyticaはわずか12名ほどのチームですが、2016年7月に10万ドル(約1100万円)、8月に25万ドル(約2800万円)、9月には50万ドル(約5600万円)を受け取っており、ニクスCEOによると大統領選挙を通してCambridge Analyticaは1500万ドル(約17億円)以上を稼いだそうです。

また、2016年の7月からトランプ陣営の戸別訪問員にはそれぞれ専用のアプリが配られました。そのアプリというのはそれぞれが訪問する先の住民がそのような性格タイプで、どのような政見を持つのかを示したものだったそうです。なお、同様のアプリがブレグジットの運動時にも使用されていたとのこと。アプリではトランプ陣営の意見を受け入れる可能性のある住民を判別し、訪問員は住民の性格タイプ別に用意されたガイドラインの通りに会話を進めることで、効果的に戸別訪問が行えるようになっていたそうです。


アメリカ大統領選挙の際、Cambridge Analyticaはアメリカ国民を32の性格タイプに分類し、特に17の州に着目。コジンスキー氏がビッグデータから「化粧品の『MAC』が好きな男性には同性愛者が多い」を発見したように、Cambridge Analyticaは「アメリカ製の自動車の好みから、潜在的なトランプ陣営の味方か否か」を発見しました。トランプ陣営がミシガン州とウィスコンシン州に注力することとなったのも、これらのデータが基になっているそうです。

なお、ヒラリー陣営でも同様のアプローチが取られていましたが、精神測定を軸にしたプロファイリングが行われたかどうかは不明です。

・関連記事
再生可能エネルギーをより効率的に活用するための鍵は「ビッグデータ」と「機械学習」 - GIGAZINE

ビッグデータで健康状態を分析し、妊娠の可能性や病気のかかりやすさなどがわかるように - GIGAZINE

Googleがビッグデータを解析してW杯を予測すると全試合的中、準々決勝も当ててしまうのか? - GIGAZINE

66

in メモ, Posted by logu_ii