OpenAIがタンパク質設計モデル「GPT-4b micro」を開発、iPS細胞に関与するタンパク質の再設計を目指す

OpenAIがバイオ系スタートアップのRetro Biosciencesと協力して、タンパク質設計に使用できるAIモデル「GPT-4b micro」を開発したと発表しました。このGPT-4b microはGPT-4oをベースにしたモデルで、Google DeepMindのAlphaFoldのようなタンパク質構造予測ではなく、タンパク質の相互作用を予測するモデルになっているとのことです。
Our Applied AI team at @RetroBio_ + some @OpenAI homies working together for a few month have created GPT4b-micro, a sequence-based model for, among other things, protein design!
— José Luis Ricón Fernández de la Puente (@ArtirKel) January 17, 2025
OpenAI is trying to extend human life, with help from a longevity startup | TechCrunch
https://techcrunch.com/2025/01/17/openai-is-trying-to-extend-human-life-with-help-from-a-longevity-startup/
OpenAI Partners with Retro Biosciences to Engineer Stem Cell Proteins with AI
https://www.maginative.com/article/openai-partners-with-retro-biosciences-to-engineer-stem-cell-proteins-with-ai/
Retro Biosciencesは「健康な人間の寿命を10年延ばす」という目標を掲げ、加齢に伴う疾患を効果的に改善するための治療法を開発する企業で、OpenAIのサム・アルトマンCEOから1億8000万ドル(約280億円)の投資を受けて設立されました。
このRetro Biosciencesが研究しているテーマの1つが、山中因子です。山中因子は、iPS細胞の研究でノーベル医学・生理学賞を受賞した京都大学の山中伸弥教授らが発見した遺伝子グループで、細胞の初期化を誘導するOct3/4、Sox2、Klf4、c-Mycという4つで構成されています。この遺伝子を体細胞に導入することで、未分化の状態までリセットされたiPS細胞が誘導されます。

by NIH Image Gallery
しかし、山中因子の1つであるc-Mycという遺伝子は、iPS細胞を効率よく作成する役割を果たす一方で、作成されたiPS細胞をがん化してしまうリスクが高いという問題がありました。しかし、このc-Mycを除くとiPS細胞の作製効率が悪くなってしまうため、新たな山中因子を求めて世界中の科学者が研究しています。
GPT-4b microは、山中因子から発現するタンパク質の機能を高めるようなタンパク質を設計するため、タンパク質配列と相互作用のデータでトレーニングされたモデルです。実際にGPT-4b microが予備試験で提案したタンパク質は、iPS細胞の作製効率をおよそ50倍に引き上げたとのこと。
Retro Biosciencesの共同設立者であるジョー・ベッツ・ラクロワ氏は「GPT-4b microは人間主導の研究よりも迅速かつ優れた結果をもたらした」と語っています。GPT-4b microはタンパク質のアミノ酸配列について大胆な変更も提案しており、時には配列全体の3分の1を変更することもあったそうで、これは従来の研究方法では不可能な規模の提案だそうです。

なお、OpanAIとRetro Biosciencesは、GPT-4b microを含めた研究結果の公開を約束していますが、公開時期は記事作成時点では不明です。モデルも広く利用できるようになるわけではなく、現段階ではあくまでも機能のデモンストレーションにとどまる模様です。
・関連記事
AIを使ってヘビ毒をブロックするタンパク質を設計する試み - GIGAZINE
Google DeepMind共同創設者のデミス・ハサビス氏らがノーベル化学賞を受賞、「AlphaFold」などタンパク質構造予測AIの研究が高く評価される - GIGAZINE
GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - GIGAZINE
2億件超えのタンパク質立体構造をGoogle検索なみに簡単検索可能なデータベースがDeepMindによって公開される - GIGAZINE
タンパク質の「フォールディング問題」とは何なのか? - GIGAZINE
・関連コンテンツ
in サイエンス, Posted by log1i_yk
You can read the machine translated English article OpenAI develops protein design model 'GP….