AI

OpenAIが「GPT-5.6」シリーズを発表、Claude Mythos 5超えだがアメリカ政府の指示で限定プレビュー公開


OpenAIがGPT-5.6シリーズを2026年6月26日に発表しました。最上位モデルのGPT-5.6 SolはAnthropicの最高峰モデルであるClaude Mythos 5を超える性能を記録していますが、記事作成時点では一般公開されておらず、一部の組織を対象に限定公開されています。

Previewing GPT-5.6 Sol: a next-generation model | OpenAI
https://openai.com/index/previewing-gpt-5-6-sol/

GPT-5.6 Preview System Card - OpenAI Deployment Safety Hub
https://deploymentsafety.openai.com/gpt-5-6-preview

GPT-5.6はフラッグシップモデルの「GPT-5.6 Sol」、日常業務向けのバランスモデル「GPT-5.6 Terra」、低価格な「GPT-5.6 Luna」の3種類に分かれています。3モデルとも「参加についてアメリカ政府と共有済みの少数の信頼できるパートナーグループ」を対象に限定プレビュー公開されており、数週間以内に一般公開される予定です。


「GPT-5.6 Sol」「Claude Mythos 5」「GPT-5.6 Terra」「Claude Fable 5」「GPT-5.5」「GPT-5.6 Luna」「Claude Opus 4.8」「Gemini 3.1 Pro Preview」のベンチマーク結果を並べたグラフが以下。ターミナル上での実務作業の能力を測定するTerminal-Bench 2.1において、GPT-5.6 SolはClaude Mythos 5を上回るスコアを記録しました。また、GPT-5.6 TerraもClaude Fable 5と同等のスコアを示し、低コストモデルのGPT-5.6 LunaもClaude Opus 4.8やGemini 3.1 Pro Previewを上回っています。


サイバー攻撃能力を測定するExploitBenchではGPT-5.6 SolがClaude Mythos Previewと同等のスコアを3分の1の出力トークン数で達成しました。


GPT-5.6シリーズはコストの低さも特徴です。100万トークン当たりの料金は以下の通り。

 入力出力
GPT-5.6 Sol5ドル(約809円)30ドル(約4853円)
GPT-5.6 Terra2.50ドル(約404円)15ドル(約2426円)
GPT-5.6 Luna1ドル(約162円)6ドル(約971円)


「GPT-5.6 Sol」「GPT-5.6 Terra」「GPT-5.6 Luna」「GPT-5.5」を対象に生物学的定量分析能力を測定するベンチマークテストGeneBench v1を実行した結果が以下。横軸がAPI料金、縦軸がスコアを示しており、GPT-5.6 SolやGPT-5.6 TerraがGPT-5.5より安い料金で高いスコアを示してることが分かります。


OpenAIはGPT-5.6シリーズの発表に先立ってアメリカ政府にモデルの機能説明を実施したとのこと。また、一般公開に先立って一部の組織を対象に限定公開する理由について「アメリカ政府の要請による」と説明しています。OpenAIは「このような政府アクセスプログラムが長期的な標準となるべきではありません。政府アクセスプログラムはユーザー・開発者・企業・サイバー防御担当者・グローバルパートナーから最良のツールを奪うことになります」とコメントしています。

また、OpenAIは「(GPT-5.6シリーズを)今後数週間でより広く提供するためにこの短期的な措置を講じています。私たちは政権と協力して大統領令に関する枠組みや将来のモデルリリースに向けた再現可能なプロセスを開発していきます」とも述べ、限定プレビュー公開を必要としないAIモデルのリリース手法の構築を目指すことを明言しています。

この記事のタイトルとURLをコピーする

・関連記事
トランプ政権がOpenAIに「GPT-5.6」のリリースを遅らせるよう要請 - GIGAZINE

OpenAIがClaude Mythos 5超えのセキュリティー特化AI「GPT-5.5-Cyber」のアップデートを発表&セキュリティー特化Codexプラグイン「Codex Security」もアップデート - GIGAZINE

Anthropicがアメリカ政府の指示で「Claude Fable 5」と「Claude Mythos 5」の提供を停止 - GIGAZINE

Claude Opus 4.7超えの中華モデル「GLM-5.2」が正式発表される、一部テストではClaude Fable 5を上回りオープンモデルとして誰でもダウンロード可能に - GIGAZINE

「安い中華AI+人間」と「OpenAIやAnthropicの高性能AI」はどっちが低コストなのか? - GIGAZINE

中国製高性能AI「DeepSeek-V4-Pro」の75%割引が永続化される、DeepSeek専用設計のコーディングエージェント「Reasonix」にも注目が集まる - GIGAZINE

複数のAIを組み合わせてClaude Fable超えの性能を実現するシステム「Fusion」をOpenRouterがリリース - GIGAZINE

Sakana AIがClaude Fable超えをアピールするマルチエージェントシステム「Sakana Fugu」を発表 - GIGAZINE

in AI, Posted by log1o_hf

You can read the machine translated English article OpenAI announces the 'GPT-5.6' series, s….