新型コロナウイルスの第2波をGoogleやTwitterのリアルタイムデータから予測するアルゴリズムを研究者が開発
世界中で猛威を振るう新型コロナウイスル感染症(COVID-19)は、記事作成時点で総感染者数が1150万人、死亡者数も53万人を超えています。東京でも緊急事態宣言が解除されてから5日連続で1日の新規感染者数が100人を超えており第2波の到来が懸念される中、ハーバード大学やノースイースタン大学などの研究チームが、「GoogleやTwitterのリアルタイムデータから新型コロナウイルスの第2波を予測するアルゴリズム」を開発しました。
An Early Warning Approach to Monitor COVID-19 Activity with Multiple Digital Traces in Near Real-Time
https://arxiv.org/abs/2007.00756
Can an Algorithm Predict the Pandemic’s Next Moves? - The New York Times
https://www.nytimes.com/2020/07/02/health/santillana-coronavirus-model-forecast.html
COVID-19の流行を抑えるには人々の社会的距離を保つ政策が有効であるとされていますが、地域経済や社会の運営といった点を考慮すると、行政側はどこかのタイミングで規制を緩める判断を下さなくてはなりません。各国の政策立案者は新たな症例数や死亡者数、病床の埋まり具合といった数値を元にして、可能な限りCOVID-19の第2波が来ないように慎重な判断を行っています。
しかし、新型コロナウイルスに感染してから発症するまでの潜伏期間や、発症してから病院に行って検査を受けるまでのタイムラグなどにより、発表される感染者数などの情報は2週間前の行動の結果ともいわれています。つまり、症例数や死亡者数といった数値を基にした警報システムをベースに対策を始めても、COVID-19の流行を食い止めるには遅すぎる可能性があります。
そんな中、ハーバード大学やノースイースタン大学の研究者らが、「COVID-19の流行が発生することを2週間以上前に予測するアルゴリズム」を発表しました。査読前の論文を投稿するarXivに投稿された論文によると、研究チームが開発したアルゴリズムは、Google検索やスマートフォンの位置情報、SNSへの投稿といった複数のリアルタイムデータを分析してCOVID-19の流行を予測するものです。2008年にはGoogleのエンジニアが、「疲労感」「関節の痛み」「タミフルの投与量」といった単語の検索トレンドを追跡することで、インフルエンザの流行を予測するモデルを開発しました。このモデル自体はそれほど精度が高くありませんでしたが、多くの研究者らがリアルタイムデータに着目した感染症の流行予測を行ってきたとのこと。
今回、COVID-19の流行を予測するために開発された新たなアルゴリズムでは、Google検索に加えて「位置情報が付いたCOVID-19関連のTwitter投稿」「医師の臨床診断支援ツール『UpToDate』のデータ」「スマートフォンから収集した匿名の位置情報データ」「スマート体温計『Kinsa Smart Thermometer』からアップロードされた体温のデータ」を分析。これらのデータをノースイースタン大学の研究者らが開発した予測モデルと組み合わせ、COVID-19の流行を予測する仕組みとなっています。
実際に研究チームが開発したアルゴリズムを用いて2020年3月~4月におけるアメリカのデータを分析し、データソースの重み付けなどを最適化したところ、平均して21日前にCOVID-19の流行が発生することを予測できたそうです。
ハーバード大学の小児科および疫学の准教授であるMauricio Santillana氏は、「ほとんどの感染症モデリングでは、事前に想定された仮定に基づいてさまざまなシナリオを予測しますが、私たちのアルゴリズムは仮定を立てずに観察しています。私たちの方法は即時の行動の変化に反応し、それを予測に組み込むことができます」とコメントしています。
バージニア大学のコンピューターサイエンティストであるMadhav Marathe教授は、「単一のデータストリームがそれだけで役立たないことを私たちは知っています。この新しい論文の貢献は、彼らが優れた幅広いデータストリームを持っている点です」と述べました。
Santillana氏は新たに開発されたアルゴリズムが従来の流行監視システムに取って代わるものではなく、監視システムの結果に対する確信を深めるものだと指摘。政策決定者はこのアルゴリズムを使用して、「1週間様子を見るのではなく、今すぐ決断を下そう」と考えることができるとのことです。
なお、アルゴリズムはジョージ・フロイド氏の死亡に関連してアメリカ全土で発生した抗議行動のように、「これから起きる感染拡大につながりかねないイベント」について予測することはできません。また、ソーシャルメディアや検索エンジンのワードから得られる予測精度も、人々が病気に慣れるほど低下する可能性があると研究チームは認めています。アメリカ疾病予防管理センター(CDC)といった公衆衛生機関もソーシャルメディアなどのデータを参照しているそうですが、これらのデータを流行予測の中心にはしていません。
ジョージタウン大学の生物学者であるShweta Bansal氏は、リアルタイムデータを用いた新たなCOVID-19の流行予測アルゴリズムが重要なものだと認めつつも、アルゴリズムが間違っていた際に引き起こされる害が非常に大きいと指摘。そのため、時間をかけてアルゴリズムを検証する必要があると主張しました。
・関連記事
「新型コロナウイルスの第2波は第1波よりも深刻なものになる」とアメリカ疾病予防管理センターが警告 - GIGAZINE
突然変異で生まれた「感染力が強い新型コロナウイルス」が世界で大流行しているという研究結果 - GIGAZINE
一定割合の人がマスクをすれば新型コロナウイルス感染症の流行は抑えられるという研究結果 - GIGAZINE
「味覚・嗅覚の消失」は新型コロナウイルスの感染を高確率で予測すると1万8000人のデータから示される - GIGAZINE
新型コロナウイルス終息後に起こる「希望」をビル・ゲイツが語る - GIGAZINE
新型コロナウイルス収束後、私たちの生活はどのように変化するのか? - GIGAZINE
新型コロナウイルス感染症の流行で「労働力の自動化」が一気に進むのか? - GIGAZINE
・関連コンテンツ