2020年12月23日 09時00分 メモ

サードパーティーCookieなしで高効率のターゲティング広告が配信できたとニューヨーク・タイムズが報告



サードパーティーCookieの廃止がいよいよ現実的になってきたことで、既存のターゲティング広告に置き換わる、新しい広告の仕組みが各所でテストされだしています。サードパーティーCookieに頼らず自社プラットフォームによる広告システムを構築中のニューヨーク・タイムズが、サードパーティーCookieに匹敵するパフォーマンスを発揮できたとして、その詳細を明かしています。



To Serve Better Ads, We Built Our Own Data Program | by The NYT Open Team | Dec, 2020 | NYT Open

https://open.nytimes.com/to-serve-better-ads-we-built-our-own-data-program-c5e039bf247b





インターネット上の広告の多くはサードパーティーCookieを利用した行動ターゲティング広告ですが、近年はターゲティング広告の利用が見直されつつあります。これは、ユーザーの行動を広範に追跡するサードパーティーCookieを使ったターゲティング広告に「ユーザーの興味・関心にあった効率よい広告表示が可能になる」という利点がある一方で、ユーザーの個人情報を過剰に収集しておりプライバシーの観点から問題点が指摘されているためです。



サードパーティーCookieの見直しを加速させたのは、2016年に制定されたEUの新データ保護規則「GDPR」です。GDPRでは、「ウェブサイト側による個人データの収集・保持はユーザーの同意に基づく必要がある」と定められ、ユーザーの許可なくサードパーティーCookieを利用することが厳しくチェックされるようになりました。



2017年にはAppleがIntelligent Tracking Prevention(ITP)というプライバシー保護機能を公開し、SafariでサードパーティーCookieをブロックしました。またGoogleはこれに続き2019年にChromeでサードパーティーCookieを廃止予定であると発表しており、既存の広告システムを見直す方向となっています。



ターゲティング広告はパフォーマンスが非常に高いことから、ターゲティング広告が利用できなくなると、ウェブサイトやお店の収益が減少する可能性があると指摘されています。一方で、逆に収益が上がる可能性も示唆されており、多くのウェブサイトが新しい広告システムの構築に目を向けています。



アメリカの大手新聞社であるニューヨーク・タイムズも、2020年5月にサードパーティーCookieによるデータの利用をやめ、自社製のデータプラットフォームを使って広告を表示させる計画であると発表しました。



2020年12月18日に、ニューヨーク・タイムズは構築中のデータプラットフォームの仕組みについて、さらに言及しています。



過去数年にわたってニューヨーク・タイムズはGoogle Cloud Platformを利用しており、Google Cloud Dataflowでリアルタイムのイベントをデータ分析ツールのGoogle BigQueryにストリーミングしてきました。その後、BigQueryに送られたイベントのデータはバッチ処理され、広告運用のためにニューヨーク・タイムズのデータサイエンティストが構築した複数の機械学習モデルの訓練に利用されました。



この機械学習モデルは基本的に、有志のニューヨーク・タイムズ読者数万人によって回答されたアンケートに基づいています。このアンケートデータとイベントのデータでモデルを訓練し、それぞれの広告を表示させるべきユーザーの予測を行うという仕組みです。統計的に予測可能・解釈可能な結果が得られるまでに、回帰・ランク付け・分類・マルチタスク分類などにおいて教師あり学習が必要だったとのこと。なお、機械学習モデルの出力にはAirflowが利用されました。



ニューヨーク・タイムズによると、実際の仕組みとしては、ユーザーがニューヨーク・タイムズのウェブサイトを訪れたりアプリを開いたときにGoogle Cloud Memorystoreを使ったGo言語のマイクロサービスに対して呼び出しが行われ、平均遅延100ミリ毎秒以下でユーザーデータがページに送られます。ページに埋め込まれたJavaScriptがこのデータを広告サーバーに送信し、広告サーバーはユーザーデータと最も関連性の高いキャンペーンを見つけ出し、キャンペーンのターゲティング基準がページから送られてきたデータと一致したときにそれを配信するとのこと。





処理とデータのアクティベーションはサーバー側で行われるため、この仕組みは複数のブラウザに簡単に拡張できたそうです。



2020年6月にプログラムを開始して以来、ニューヨーク・タイムズの自社データを元にした広告は、サードパーティーCookieを利用した広告と同程度のパフォーマンスを発揮しています。インターネットの広告システムはDemand Side PlatformやSupply-Side Platformに依存するプログラマティック広告と、直接広告枠を売買する直接販売広告の2つに分かれますが、ニューヨーク・タイムズの新しい仕組みは後者にあたります。この仕組みを使えばニューヨーク・タイムズは自社の読者データを外部と共有する必要がなくなるので、読者のプライバシーがより適切に保護できるとニューヨーク・タイムズは述べています。