サイエンス

タンパク質の「フォールディング問題」とは何なのか?

by Enzymlogic

全ての生物学的プロセスの中心となるタンパク質について、各タンパク質は固有の立体構造を持つことまでは判明していますが、「各タンパク質が実際にどのような立体構造を持っているのか」に関する研究はこの50年間で大きな進展がありません。各タンパク質が持つ立体構造に至るまでの「フォールディング」という過程を調べる研究がいかに困難なのかを、実際にフォールディングの研究を行っていたジェイソン・クロフォード氏が解説しています。

What is “protein folding”? A brief explanation
https://rootsofprogress.org/alphafold-protein-folding-explainer

タンパク質は21種類のアミノ酸が多数結合した巨大な分子の総称で、それぞれのタンパク質を構成するアミノ酸の数や種類、結合の順序はDNAの塩基配列によって決定されます。全てのタンパク質は鎖状という直線的な形状をしていますが、実際には各タンパク質は直線的な形状ではなく、立体的な形状で寄り集まって安定化します。

それぞれのタンパク質を鎖状として考える場合は「一次構造」と呼び、立体的な形状として考える場合は「二次構造」と呼びます。タンパク質の二次構造の代表例が以下のβシート(左図)とαヘリックス(右図)と呼ばれる構造で、βシートは1つのタンパク質が平面的に折りたたまれて安定した状態で、αヘリックスはらせん状で安定した状態を指します。

By Thomas Shafee

二次構造のタンパク質が集まって安定した状態が「三次構造」と呼ばれます。三次構造の例が以下、Colwellia psychrerythraeaと呼ばれるバクテリアの酵素の三次構造です。

by Argonne National Laboratory

三次構造は複数のタンパク質が絡まっただけのランダムな構造に見えますが、実際には各タンパク質の三次構造は1通りしかありません。各タンパク質は三次構造に応じた性質を持つため、三次構造を調べることが重要になりますが、現行の三次構造の調査手法は高額かつ時間がかかる上に一部のタンパク質には適用できず、すでに1億8000万個も発見されているというタンパク質全てを調査することは不可能です。そのため、各タンパク質がどのようにフォールディングを行うかという「フォールディング問題」を解き明かし、一次構造から三次構造を推定する手法が求められています。

フォールディング問題を解くために用いられているのが、コンピューターのシミュレーターです。シミュレーターに各タンパク質に含まれる原子の位置・電荷・化学結合などを考慮したモデルを入力し、それぞれの加速度と速度を算定させることで三次構造が推定可能で、この種の学問分野は「分子動力学法」として近年盛んになっているそうです。

ただし、シミュレーターで三次構造を推定する方法は「計算機のパワーが要る」という問題があります。大多数のタンパク質は数千個の原子で構成されている上、周囲の水分子とも相互作用します。それゆえ、一般的な三次構造1つに関わる原子はおよそ3万個、その相互関係は4億5000万にも達するとのこと。全ての原子をシミュレートする代わりに考えられる構造候補の中から最も安定している構造をエネルギー地形から算定するという代替手法も考案されているそうですが、構造候補は10300個にも達するとみられており、全てのパターンを計算する前に宇宙の寿命が尽きてしまうといわれています。

こうした計算に役立ってきたのが、スーパーコンピューターや分散コンピューティングです。世界中の家庭にあるPCの演算能力を合算してフォールディング問題を解き明かすプロジェクト「[email protected]」は世界TOP500のスーパーコンピューターを合算した性能に達しており、2020年以降の新型コロナウイルスのパンデミック以降は、新型コロナウイルスの内部にあるタンパク質の解析も行っています。

世界中のPCを使って新型コロナウイルスの解析を進める「[email protected]」の演算速度が世界TOP500のスーパーコンピューターを全部合計した性能に到達 - GIGAZINE


こうして進められていたフォールディング問題でしたが、2020年12月1日、Google傘下の人工知能企業DeepMindが機械学習を用いてタンパク質の三次構造を飛躍的な速度かつ高精度で予測できる「AlphaFold」というシステムを発表しました。

50年前からの生物学の超難問にDeepMindの開発した「AlphaFold」がAIのパワーで道筋を示し研究が加速 - GIGAZINE


AlphaFoldは複数のニューラルネットワークによって各タンパク質に関連するさまざまな機能を学習し、三次構造におけるタンパク質に含まれるアミノ酸の最終的な距離を予測できる関数を導き出すとのこと。AlphaFoldによる構造予測は他のコンピュータープログラムを上回っているだけでなく、旧来の手法を超える精度も達成していると確認されています。

DeepMindはその発表の中で「フォールディング問題を解決した」と主張しており、クロフォード氏は「DeepMindの主張は単純すぎると思いますが、いずれにせよ画期的な進歩です」とコメントしています。

この記事のタイトルとURLをコピーする

・関連記事
人工知能企業のDeepMindがタンパク質の立体構造を予測する「AlphaFold」を開発 - GIGAZINE

タンパク質の立体構造を予測するシステムが機械学習によって大きく進歩している - GIGAZINE

低温電子顕微鏡法の性能を大幅に向上させる画期的な技術が登場、タンパク質の立体構造解明に光 - GIGAZINE

in サイエンス, Posted by log1k_iy

You can read the machine translated English article here.