機械学習を用いて「遺伝子編集されたDNAがどの研究室で生み出されたか」を特定できるかもしれない
![](https://i.gzn.jp/img/2018/08/14/deep-learning-predict-dna-origin-lab/00_m.jpg)
by Caroline Davis2010
機械学習は非常にさまざまな分野に応用できることがわかっており、「ジャニーズ系の顔かどうかを判別する」ことや「匿名のソースコードから個人を識別する」といったことまで可能になっています。そんな機械学習を用いることで、「遺伝子編集されたDNAがどこの研究室で遺伝子編集されたのかを、突き止めることができるかもしれない」という研究結果が発表されています。
Deep learning to predict the lab-of-origin of engineered DNA | Nature Communications
https://www.nature.com/articles/s41467-018-05378-z
CRISPRを始めとする遺伝子編集技術は、近年になって急速に発展が進んだ新技術であり、加速的に研究の規模が増大しています。一方で、分野の劇的な発展に伴って新たに発表された新技術に悪意のある人物がアクセスし、違法な薬物の製造や悪意のある遺伝子編集を実行したり、知的財産権が侵害されたりする懸念がされているとのこと。
「遺伝子の配列が事件解決の鍵になった」というパターンには、アメリカで発生した新興宗教団体ラジニーシによるサルモネラ菌テロや、陸軍感染症医学研究所の研究員が犯人と特定されたアメリカ炭疽菌事件などがあります。これらの事件では使用されたサルモネラ菌の遺伝子の特性が、宗教団体から押収された試験管内で培養されたサルモネラ菌と一致したり、炭疽菌が仕込まれた手紙から検出された炭疽菌の遺伝子変異が、犯人が勤務する研究所で発見されたフラスコ内の炭疽菌に見られた遺伝子変異と一致したりといった証拠が犯人の特定につながりました。
これと同様の遺伝子的特徴は、研究者によって編集された遺伝子にも表れるそうです。遺伝子編集の分野では、新たな遺伝子をもともとのDNAに追加したり遺伝子の配列を変化させたりして、望んだ通りの働きをするように遺伝子を編集します。その中で、以前にうまくいった時の経験を頼りにその時と同じ遺伝子の場所を編集したり、研究室や研究所に特有の意図しない遺伝子変異が発生したりすることで、個人・研究室・研究所とつながる「署名」が形成されるとのこと。ところが熟練の研究者であっても、長大な遺伝子配列から署名となるような固有のパターンを見つけ出すのは困難です。
![](https://i.gzn.jp/img/2018/08/14/deep-learning-predict-dna-origin-lab/01_m.jpg)
by Eelke
そこで、研究者らは遺伝子組み換えによく用いられるプラミスドの遺伝子配列を大規模なリポジトリであるAddgeneから入手し、画像認識処理などに多く用いられる機械学習モデルの畳み込みニューラルネットワークを利用して、編集済みの遺伝子の特徴から研究室や研究所を特定しようと試みました。
まず、研究者らは全世界2230の研究室で編集された、研究室のデータと紐付いた4万2364個ものDNAからなるデータセットを入手しました。次に、研究者らは機械学習の精度を向上させるために1つの研究室あたりで一定の遺伝子配列データを確保するため、9つ以下のDNAデータしか入手できなかった研究室およびDNAデータを破棄。残った3万6764個のDNAを機械学習の教材として利用し、DNAから研究室や研究所を特定できるかどうかを調査したとのこと。
その結果、実に48%の精度で訓練された機械学習モデルは遺伝子配列から研究室や研究所を正確に特定し、「ある遺伝子を編集した可能性の高い上位10の研究室」内に正解の研究室が含まれている可能性は、70%を記録しました。中には研究室に特有の遺伝子変異が確認された例もあり、その場合には「研究室に固有の署名」として遺伝子変異が機能するとのこと。特異な遺伝子変異は遺伝子配列から研究室を特定する強固な証拠となりますが、必ずしも全ての遺伝子から研究室に特異な遺伝子変異が確認されたわけではありませんでした。
![](https://i.gzn.jp/img/2018/08/14/deep-learning-predict-dna-origin-lab/02_m.jpg)
by TED Conference
機械学習を用いて遺伝子配列から研究室や研究所を特定するモデルは、記事作成時点では必ずしも高い精度を誇っているとはいえません。また、ある事件に利用された細菌のDNAが特定の研究所に由来していると判明したからといって、「その研究所の研究員が事件を引き起こしたのか、研究所に保管されたDNAを利用した第三者が事件を引き起こしたのか」を特定できるということでもありません。とはいえ、今後の研究によってさらに遺伝子配列から研究所を特定する精度が向上し、犯罪捜査に用いられるようになる日も遠くないかもしれません。
・関連記事
機械学習を用いると匿名のソースコードから個人を識別可能であることが判明 - GIGAZINE
「機械学習はハードルが高い」という主張は誇大広告である - GIGAZINE
目の動きから「性格を読み取る」AIが開発される - GIGAZINE
遺伝子編集によってしわや抜け毛を解消し老化を止めることができるかもしれない - GIGAZINE
遺伝子を編集してウイルス耐性を持つ遺伝子を作り出すプロジェクトが始動 - GIGAZINE
遺伝子編集技術「CRISPR」でガンを治療する研究が中国では進んでいる - GIGAZINE
「CRISPR」をもとに遺伝子編集を進歩させる2件の研究成果がほぼ同時に発表される - GIGAZINE
ヒト受精卵へのゲノム編集による遺伝子改変にアメリカの研究チームが成功、一体何を実現できるのか? - GIGAZINE
・関連コンテンツ
in ソフトウェア, サイエンス, Posted by log1h_ik
You can read the machine translated English article Using machine learning may be able to id….