ハードディスクを上回る超大容量・低維持コストで全世界データの保存も可能な「DNAストレージ」とは?

By Andy Leppard

デジタルデータの急激な増加を受けて近年注目されているのがDNAをストレージ(外部記憶装置)として使用しデータを保存するという取り組みです。しかし、DNAにデータを保存するというのはなかなか理解しがたいがもので、その詳細を長年バイオインフォマティクスを研究している欧州バイオインフォマティクス研究所が公開しています。

How DNA could store all the world’s data : Nature News & Comment
http://www.nature.com/news/how-dna-could-store-all-the-world-s-data-1.20496

インターネット上に存在するデジタルデータは急激に増加しており、2020年までには44兆GBという想像もできない量に達するとみられています。44兆GBというのは2013年までに保存されている全デジタルデータの約10倍に当たり、これほどまでに多いデータをデータセンターなどに保存し続けるにはコストがかかりすぎるという問題が発生。増加し続けるデジタルデータを保存するストレージとして、ハードディスクに取って変わる存在として近年注目を集めているのがDNAです。

Natureが公開している以下の表は、ハードディスク・フラッシュメモリ・DNAの読み込み/書き込み速度、保存期間、電力使用量、記録密度を比較した表になります。例えば、表の2列目を見ると、ハードディスクとフラッシュメモリの保存期間は10年以上となっていますが、DNAは100年以上あります。また電力使用量や記録密度においてもDNAはハードディスクとフラッシュメモリよりも優秀な数値を記録しています。


DNAはヌクオレチドという物質が結合してできていて、ヌクレオチドは塩基と糖が結合した化合物のヌクレオチドとリン酸が結合したもの。このヌクレオチドに含まれる3つの塩基の配列が遺伝的な特徴を生じさせるため、DNAは生命の設計図とも言われることがあります。人間のDNAには生きるのに必要な遺伝子データが人類誕生からずっと保存し続けられており、巨大なストレージと言えるわけです。

このDNAを科学的に合成することで大量のデータを保存する研究が近年盛んに行われています。2013年には欧州バイオインフォマティクス研究所がPDF・MP3・JPEG・TEXTといった4つのファイル形式で保存されたデータをエンコードしてDNA配列にすることで保存に成功。また、2016年4月にはMicrosoftがDNAのストレージを研究するTwist Bioscienceという企業への出資を表明し、20塩基対以下の長さの短いヌクレオチドの「オリゴヌクレオチド」1000万個体をエンコード技術開発のために購入しとたいう話もありました。

ここで気になるのが一体どうやってデータをDNAに保存するのかということ。データをDNAに保存するにはエンコードをする必要があるのですが、このエンコード方法は各研究所によって異なります。欧州バイオインフォマティクス研究所は、保存時にエラーが発生しやすかった従来の方法に代わって採用した新しいエンコード方法を公開中。資料によれば、例えばテキストデータは「0」と「1」で構成されるバイナリコードに変換し……


変換されたバイナリコードを「0」「1」「2」の3つで構成されるトリプレットコードに変換。このトリプレットコードというのはアミノ酸に対応する3つの塩基の配列のことを指します。


今度は「0」「1」「2」で構成されるトリプレットコードを設計書として使ってDNAのらせん構造を構築。


最後に100塩基を1つとしたDNAのらせん構造を何個も作り上げ、これを25・50・75塩基に区切って比較。100塩基のDNAの一部分を重複させて保存することで、エラーを発見・修復しやすいようになっているそうです。


欧州バイオインフォマティクス研究所が生み出した方法を使えば保存時に発生するエラーの特定・修復を迅速に行えますが、問題はエンコードの速度。特殊なアルゴリズムを使用するため、ハードディスクに数秒で保存できるデータでさえも、DNAに保存するには数時間かかり、デコーディングに関しても常識では考えられないくらい時間がかかるそうです。

DNAをストレージとして使うことができるようになるにはまだまだ多くの課題がありますが、欧州バイオインフォマティクス研究所のニック・ゴールドマン所長は「データ保存に関する新技術は毎年1つか2つ登場しており、もう少し待てば速度の問題は解決するでしょう」と自信を見せています。

・関連記事
Microsoftが1グラムのDNAに10億テラバイト=1ゼタバイトものデータを保存する「DNAメモリ」技術に出資 - GIGAZINE

ハードディスクはどのメーカー製が一番壊れにくいのかがわかる約6万8000台ものHDD故障率データ - GIGAZINE

遺伝子編集技術「CRISPR」とは何かがわかるムービー、そして人類の未来はどうなるのか? - GIGAZINE

人間の遺伝子操作を行うゲノム編集技術「CRISPR/Cas9」を用いた臨床試験申請が承認される - GIGAZINE

ファイル共有サイト「Megaupload」がパワーアップして復活へ - GIGAZINE

325

in サイエンス, Posted by darkhorse_log