タンパク質の立体構造を予測するシステムが機械学習によって大きく進歩している
by Determined
タンパク質は22種類のアミノ酸が鎖状に多数連結してできた巨大な分子で、細胞内の化学的・機械的プロセスに深く関与しています。そんなタンパク質の立体構造を把握するシステムの開発が、機械学習によって大きく進歩しているとのことです。
Improved protein structure prediction using potentials from deep learning | Nature
https://www.nature.com/articles/s41586-019-1923-7
A watershed moment for protein structure prediction
https://www.nature.com/articles/d41586-019-03951-0
タンパク質が特定の立体構造に折り畳まれる現象をフォールディングといい、それぞれのタンパク質の挙動を理解するためにはタンパク質の立体構造を把握することが重要です。ところが、ほとんどのタンパク質は構成するアミノ酸の配列情報しか判明しておらず、実際にどのような立体構造になっているのかわからないタンパク質がほとんどだとのこと。
実験でタンパク質の立体構造を決定するには膨大な時間とコストがかかるため、タンパク質の立体構造を予測する技術の開発は重要な研究課題となっています。しかし、タンパク質の立体構造は非常に多様なパターンを持っており、タンパク質の構造が大きくなるほどアミノ酸の相互作用が増加して構造のモデル化が困難になるという問題があります。量子論を用いてタンパク質分子の正確なエネルギーを計算できれば、最もエネルギー的に有利な構造を予測することが可能ですが、既存のコンピューターでタンパク質に関する量子的な計算を実行することはできません。
また、タンパク質が取りうる立体構造のパターンは天文学的な数字であり、総当たり的にタンパク質の正しい立体構造を突き止めようとしても、全てのパターンを計算する前に宇宙の寿命が尽きてしまうとのこと。この問題は、提唱者である分子生物学者のサイラス・レヴィンソールの名前から「レヴィンソールのパラドックス」と呼ばれています。
by Monoar
研究者らはこうした問題を解決するため、アミノ酸配列からタンパク質の立体構造を予測するアルゴリズムの開発を進めてきました。これまでにタンパク質の立体構造を地形に対応させる手法や、アミノ酸残基の突然変異が対応するアミノ酸残基の突然変異を引き起こすといった共進化情報に基づいた予測手法など、多くの手法が開発されてきました。特にアミノ酸残基を利用した共進化情報に基づく予測は、利用可能なアミノ酸配列のデータが2010年代に入って急速に増加したことから大きく進歩したとのこと。
そんな中、Google傘下の人工知能開発企業であるDeepMindが開発したのが、「AlphaFold」というタンパク質の立体構造を予測するアルゴリズムです。AlphaFoldは機械学習を用いてタンパク質の立体構造を予測するアルゴリズムであり、まずはアミノ酸残基のペアが取る距離と角度を予測します。数学的には各アミノ酸残基間の位置によって相対的な位置が決定できるため、アミノ酸残基の距離を予測することで、タンパク質の立体構造を特定可能だと研究チームは述べています。
さらにAlphaFoldは勾配降下法(最急降下法)を用いて、タンパク質の立体構造予測の精度を継続的に向上させていきました。これにより、207チームが参加した2018年開催の「タンパク質の立体構造予測の国際コンテスト(CASP13)」において、AlphaFoldが最も高い精度を示して1位を獲得しました。
by Zak Sakata
CASP13において、AlphaFoldの予測は正しい構造から中央値で0.66ナノメートル(6.6オングストローム)しかズレていませんでした。しかし、依然として薬物がタンパク質に結合する方法の解明や、酵素の触媒メカニズムの解明など、2~3オングストロームの分解能を必要とするアプリケーションにはAlphaFoldが適用できないとのこと。また、1つのタンパク質の立体構造を特定するのに数十~数百時間かかってしまう点も課題だそうです。
それでも、2025年までには4オングストロームの分解能でタンパク質の立体構造が予測可能になるともいわれており、低温電子顕微鏡法などでタンパク質の立体構造が特定可能になった時代から考えると非常に大きな進歩といえます。タンパク質の立体構造予測に機械学習を用いる手法の登場は、生命科学を変える大きな転換点になり得ると研究チームは述べました。
・関連記事
人工知能企業のDeepMindがタンパク質の立体構造を予測する「AlphaFold」を開発 - GIGAZINE
牛乳のタンパク質構造を再現した植物由来の人工アイスクリームが登場、「本物そっくりの味わい」と話題に - GIGAZINE
GoogleがAIでタンパク質の結晶を発見するシステムを開発、新薬開発のブレイクスルーに期待 - GIGAZINE
「タンパク質から音楽を創り出す」という研究が進行中 - GIGAZINE
3Dプリンタで出力したタンパク質分子模型キット「SilMol-mini」 - GIGAZINE
・関連コンテンツ