新型コロナの症例記録1万6000件がExcelのインポートに失敗して一時消失
2020年10月4日、イングランド公衆衛生庁(PHE)が「新型コロナウイルス感染症(COVID-19)の陽性診断データ1万5841件を一時的に消失していた」と発表しました。この不可解なデータ消失について、その原因は「Excel」にあるとイギリスの大手報道各社がそれぞれ指摘しています。
PHE statement on delayed reporting of COVID-19 cases - GOV.UK
https://www.gov.uk/government/news/phe-statement-on-delayed-reporting-of-covid-19-cases
How Excel may have caused loss of 16,000 Covid tests in England | Health policy | The Guardian
https://www.theguardian.com/politics/2020/oct/05/how-excel-may-have-caused-loss-of-16000-covid-tests-in-england
How does the PHE statistics error change the UK Covid picture? | Society | The Guardian
https://www.theguardian.com/society/2020/oct/05/how-does-the-phe-statistics-error-change-the-uk-covid-picture
Botched Excel import may have caused loss of 15,841 UK COVID-19 cases | Ars Technica
https://arstechnica.com/tech-policy/2020/10/excel-glitch-may-have-caused-uk-to-underreport-covid-19-cases-by-15841/
PHEは2020年10月4日に、「約1万6000人分のCOVID-19陽性診断データを一時的に消失した」と明かしました。失われたデータの4分の3は、2020年9月25日から10月2日までに取得されたデータで、失われたデータ(画像赤色部分)と正常に保存されたデータ(灰色部分)の量をグラフで視覚化すると以下のようになります。
このデータ消失の原因について、PHEは「報告用ダッシュボードにデータを自動転送するプロセスに問題があった」とだけ説明していました。しかし、イギリスの報道各社によると、この自動転送プロセスの問題とは、実際には「Excelの問題」とのこと。
イギリスの報道各社によると、各地の医療機関から集められた検査データは、CSV形式で保存されてPHEに送信されます。PHE側は受け取ったCSVファイルをExcelで管理しているのですが、使用しているExcelのバージョンが古いため、保存形式に「XLS」を選択しているとのこと。
XLSはExcel 2003以前のExcelで標準だったファイルの保存形式で、「6万5536行を超えるデータは保存できない」という仕様が存在しました。PHEが各地の医療機関から集められたCSVファイルのデータを統合した結果、スプレッドシートが6万5536行を超えてしまったことがデータの消失につながったとみられています。
イギリスは2020年10月3日にCOVID-19の新規感染者が1万人を初めて超え、「感染第2波」が広がっているといわれています。今回のデータ消失によって、イギリス国内で運用されている新型コロナウイルス接触確認アプリに、一時消失期間中にデータが適切に転送されなかったという問題が発生しました。そのため、報道各社は「感染に気づかずに外出する人を増やした」とPHEを非難しています。
PHEは一時消失したデータは2020年10月3日午前1時までに全て復旧したと述べて、「今後、このようなエラーが発生しないように予防策を講じる」とコメントしました。
・関連記事
「Excelのおせっかい」のせいで人間の遺伝子の名前が変更を余儀なくされる - GIGAZINE
Excelが遺伝子研究の誤りのもとになっていると研究者が指摘 - GIGAZINE
初代Excelの開発秘話を当時の開発チームメンバーが公開 - GIGAZINE
・関連コンテンツ