AI

未知のヒト遺伝子変異が病気を引き起こす可能性を予測するAIモデル「popEVE」が登場、Google DeepMindのAlphaMissenseよりも優秀


ハーバード大学医学部の研究者が、計算生物学におけるGoogle DeepMindの優位性に挑戦するべく、希少遺伝病をより正確に診断するために設計された新しいAIモデルの「popEVE」を発表しました。

Proteome-wide model for human disease genetics | Nature Genetics
https://www.nature.com/articles/s41588-025-02400-1


Harvard's popEVE AI Model Identifies 123 Novel Disease Genes - WinBuzzer
https://winbuzzer.com/2025/11/24/harvards-popeve-ai-model-identifies-123-novel-disease-genes-xcxwbn/

New AI model enhances diagnosis of rare diseases
https://www.ft.com/content/bc49e334-776b-41d0-a9be-fb0c29c54853

現地時間の2025年11月24日、ハーバード大学医学部の研究チームが希少遺伝病を診断するAIモデル「popEVE」に関する論文を学術誌のNature Geneticsで発表しました。popEVEはプロテオーム全体にわたって変異の重症度を較正することで、発達障害の新たな候補遺伝子123個を特定することに成功しました。

popEVEは、Google DeepMindが開発した遺伝子変異の有害性を予測するAI「AlphaMissense」などの、既存のAIに根強く残る欠陥である「誤検知」を大幅に減らすことに成功しているという点でも優秀です。

Google DeepMindがAI「AlphaMissense」を発表、どの遺伝子変異が有害かを予測して遺伝性疾患の原因を特定するのに役立つ可能性 - GIGAZINE


臨床現場ではゲノム配列解析が急速に普及していますが、希少な遺伝性疾患の診断率は依然として低く、一部のコホートでは患者のうちわずか25%しか確定的な遺伝子診断を受けることができていません。

臨床医は人間の健康への影響が不明な遺伝子変異であるVUS(臨床的意義不明のバリアント)の多様な配列に頻繁に直面します。VUSは診断におけるボトルネックとなり、病状を引き起こす変異体を特定する妨げになるそうです。また、これまでは小児期に発症する重篤な疾患を引き起こす変異体と、後年になって初めて症状が現れる軽微な疾患を引き起こす変異体を区別できないことが多く、これは小児医療にとって極めて重要な問題となっていました。

popEVEは病原性に関する閾値をより厳しく設定することで、2つの違いを特定するギャップを解消することに成功しています。テストでは、popEVEが一般集団における偽陽性予測を劇的に削減することに成功。また、重症変異のキャリアとしてフラグ付けする個人も、わずか11%にとどまっています。これに対して、例えばGoogle DeepMindのAlphaMissenseの場合、一般人口の約44%を「重篤な変異を有する」と分類します。popEVEはノイズを除去することで、臨床医が遺伝性疾患の原因となる可能性が最も高い変異に集中することを可能にするわけです。

popEVEの有効性は発達障害の解明研究やGeneDxのデータ、ラドバウド大学医療センターから提供された重度発達障害患者3万1058人のメタコホートで厳密に検証されました。


この膨大なデータセットにおいて、popEVEが設定した高信頼度の重症度閾値は、病原性変異の15倍の濃縮を明らかにしました。これはPrimateAI-3Dなどの他の主要なAIモデルの5倍に相当します。この統計的な優位性により、popEVEはこれまでの標準的な検査プロトコルでは説明がつかなかった症例の約3分の1に対して、診断を成功させました。

遺伝学の分野においておそらく最も重要なのは、popEVEが全く新しい疾患の関連性を発見する能力です。popEVEの解析により、発達障害に関連する123個の新規候補遺伝子が特定され、そのうち119個は単一変異レベルで同定可能であることが明らかになっています。


注目すべきは、123個の新規候補遺伝子のうち、31個はミスセンス変異のみを用いて検出されたという点です。この機能は、popEVEが従来のエンリッチメント解析では検出できない病原性シグナルを検出できることを示唆しています。

また、popEVEによる発見の検証は既に臨床結果をもたらしており、123個の新規候補遺伝子のうち25個が他の研究室によって独立して確認され、発達障害遺伝子表現型データベース(DDG2P)に正式に登録されています。

さらに、popEVEを新生変異(DNM)に適用した症例では、変異体の7%が重篤であると判定されたのに対し、健康な対照群ではわずか0.5%であり、病原性の変異と良性の変異が高度に分離されていることが実証されました。


ハーバード大学医学部でシステム生物学の教授を務めるデボラ・マークス氏は、「我々の目標は、疾患の重症度に応じて変異をランク付けし、優先順位付けされた臨床的に意義のある個人のゲノム情報を提供するAIモデルを開発することでした」と述べ、popEVEが統計的知見を具体的な臨床結果に結びつけることを目的として設計されたAIモデルであることを強調しています。

EVEやAlphaMissenseといった従来のAIモデルは、単一遺伝子内の変異のランク付けには優れているものの、異なる遺伝子間の重症度の比較には課題があります。その結果、タンパク質の機能を阻害するものの、ヒトにおいては必ずしも重篤な疾患を引き起こすわけではない変異に対して、高いスコアが付けられることがあります。

これに対して、popEVEはEVEとESM-1vを用いた深層進化データおよびヒト集団の制約を組み合わせることで、この問題を解決することに成功しました。また、研究チームは自然耐性変異を特定するためにイギリスのバイオバンクgnomAD v2のデータを利用しています。

潜在ガウス過程を用いることで、観察されたヒト変異に対する進化スコアを較正し、統一された有害性スコアを作成。この調整により、臨床における大きな進歩であるシングルトン解析が可能になります。これは、子どものエクソームのみを用いて原因となる変異を優先順位付けできる解析です。

通常、de novo変異を識別するにはトリオシーケンス(患者である子と、その両親)が必要ですが、法外な費用がかかるケースや、ロジスティックス的に不可能なケースがしばしばあります。


マークス氏の研究室で研究員として働くローズ・オーレンブック氏は、popEVEが臨床ワークフローに統合されることに楽観的な見方を示しており、「遺伝子疾患の診断をより迅速に行うための日々のパイプラインにおいて、popEVEが役立つようになることに一歩近づいたと感じています」と語りました。

この記事のタイトルとURLをコピーする

・関連記事
Googleが高精度でがんの遺伝子変異を検出するAI「DeepSomatic」を発表、オープンソース化で全世界のがん研究を加速へ - GIGAZINE

Googleが遺伝子変異の影響を分析できるAI「AlphaGenome」を発表、100万塩基対を一度に入力可能で遺伝子疾患の治療法確立などに役立つ可能性 - GIGAZINE

タンパク質の立体構造を正確に予測するAI「AlphaFold」の最新版がリリース、従来よりも高精度な分子の予測が可能に - GIGAZINE

Google DeepMindがAI「AlphaMissense」を発表、どの遺伝子変異が有害かを予測して遺伝性疾患の原因を特定するのに役立つ可能性 - GIGAZINE

2億件超えのタンパク質立体構造をGoogle検索なみに簡単検索可能なデータベースがDeepMindによって公開される - GIGAZINE

人工知能企業DeepMindがタンパク質構造解析アルゴリズム「AlphaFold」をオープンソースで公開、誰でも利用可能に - GIGAZINE

in AI,   ソフトウェア,   サイエンス, Posted by logu_ii

You can read the machine translated English article AI model 'popEVE' predicts the likelihoo….