サイエンス

Excelが遺伝子研究の誤りのもとになっていると研究者が指摘

by John Gardner

Excelには、数値が入力されたときに日付や通貨に自動変換する機能があります。使いようによっては便利な機能なのですが、遺伝子研究においては、この機能によって文献内にミスが大量に発生していることを、研究者が指摘しています。

Gene name errors are widespread in the scientific literature | Genome Biology | Full Text
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1044-7


Genome Spot: My personal thoughts on gene name errors
http://genomespot.blogspot.jp/2016/08/my-personal-thoughts-on-gene-name-errors.html

Microsoft Excel blamed for gene study errors - BBC News
http://www.bbc.com/news/technology-37176926

この指摘は、メルボルンにあるベイカーIDI心臓・糖尿病研究所のマーク・ジーマン氏らが発表した論文で行われたもの。すでに大きな反響を呼んでおり、ジーマン氏は自らのブログでその補足や、反応に対する返答を行っています。

ジーマン氏らは発表済みの学術論文3597件を調査。その結果、704件でExcelによる「遺伝子名エラー」が発生していることを発見しました。具体的な例としては、「SEPT2(Septin 2)」という遺伝子があるのですが、Excelはこの「SEPT」を「September(9月)」だと解釈し、「9月2日」と日付に自動変換してしまいます。家計簿をつけるときのように、日付や通貨をいくつも入力するときには非常に助かる機能ですが、それがあだになってしまっているというわけです。

この問題が最初に提起されたのは2004年で、そこから5年にわたり、年15%という勢いで増加したとのこと。


論文の著者の1人であるアッサム・エル=オスタ氏によれば、この種の「エラー」は研究の補足データの中で特に多く見つかっているそうです。エル=オスタ氏は、このエラーの解決を「時間の浪費だ」と語っています。

一方で、欧州生物情報研究所のユアン・バーニー所長はBBCに対して「研究者が臨床試験において、Excelのスプレッドシートに頼っているという点に失望しています」と語りました。前述の通り、Excelで「遺伝子名エラー」が発生するということは10年以上前から共有されている情報であり、「Excelのせい」ではないというわけです。

この問題についてMicrosoftの広報担当者は、Excelのデフォルト設定は日々の利用を想定したもので、特定ニーズに応じた設定も可能なので、設定を変更することで「遺伝子名エラー」は克服可能だと語っています。

ちなみに、この「遺伝子名エラー」はExcelのほか、Apache OpenOffice Calcでも発生する一方、Googleスプレッドシートなら発生しないことがわかっています。

この記事のタイトルとURLをコピーする

・関連記事
Excelで絵画を描く恐るべき76歳の日本人アーティストが海外でも話題に - GIGAZINE

Excelで仕事をすばやく効率的にこなすノウハウがてんこ盛りの「『結果を出す人』は、エクセルをどう乗りこなしているのか?」 - GIGAZINE

初代Excelの開発秘話を当時の開発チームメンバーが公開 - GIGAZINE

in サイエンス, Posted by logc_nt

You can read the machine translated English article here.