GoogleがGemini 3 Flashをリリース、Gemini 3 Pro級の高度な推論能力を維持しながらより高速で価格は約4分の1

Googleが、Gemini 3モデルファミリーの最新モデルとして、スピードと効率性を重視した「Gemini 3 Flash」を2025年12月18日にリリースしました。このモデルは、Gemini 3 Pro級の高度な推論能力を維持しながら、Flashシリーズ特有の低遅延と低コストを両立させているのが最大の特徴です。
Introducing Gemini 3 Flash: Benchmarks, global availability
https://blog.google/products/gemini/gemini-3-flash/
AI Mode update: Gemini 3 Flash, Nano Banana Pro
https://blog.google/products/search/google-ai-mode-update-gemini-3-flash/
Build with Gemini 3 Flash: frontier intelligence that scales with you
https://blog.google/technology/developers/build-with-gemini-3-flash/
Gemini 3 Flash(左)と前世代モデルであるGemini 2.5 Flash(右)でSVG画像生成やウェブアプリのコーディングを行わせて比較するムービーを、Google DeepMindが公開しています。これを見ると、Gemini 3 Flashは前世代から明らかに速度や精度が向上していることがわかります。
Watch how Gemini 3 Flash compares to 2.5 Pro when generating SVG code and simple web apps. ↓ pic.twitter.com/4C2Nino7Eg
— Google DeepMind (@GoogleDeepMind) December 17, 2025
Gemini 3 Flash(左)とGemini 3 Pro(右)で同じプロンプトを与えて、アニメーションや3Dモデル、天気アプリをコーディングさせたところが以下。いずれのケースにおいても、Gemini 3 Flashの方がタスクを完了するまでのスピードが速いことがわかります。
Only 29 days after Pro: Gemini 3 Flash is just as smart (1477 LMSYS Elo), 4x cheaper, and sooo much faster! ⚡ pic.twitter.com/lOTpMGIomn
— Ali Eslami (@arkitus) December 17, 2025
Gemini 3 Flashは、処理の複雑さに応じて思考時間を調整するダイナミックシンキング(動的思考)機能を備えており、思考レベル(thinking_level)というパラメータを通じて、品質・コスト・遅延のバランスを4段階で制御できます。また、マルチモーダル処理においても、画像や動画の解析解像度(media resolution)を選択でき、細かいテキストの読み取りや詳細な識別が必要なタスクにも対応しています。なお、Gemini 3 Flash単体には画像生成機能はありませんが、Gemini 3 Pro Images(Nano Banana Pro)を使うことで、画像生成は可能になります。

ベンチマーク結果においても、Gemini 3 Flashは優れた性能を示しています。大学院博士課程レベルの推論能力を測定するGPQA Diamondでは90.4%を記録し、マルチモーダル理解を測るMMMU Proでは81.2%に達してGemini 3 Proと同等、かつGPT-5.2の79.5%を上回るスコアを達成しました。
Gemini 3 Flash is rolling out to developers now ⚡
— Google (@Google) December 17, 2025
3 Flash is our latest model with frontier intelligence built for speed. With strong multimodal, coding and agentic features, it not only enables everyday tasks with improved reasoning, but also is our most impressive model for… pic.twitter.com/woWX0ZFFys
特に高度な専門知識を問うHumanity's Last Exam(HLE)では、ツールを使用しない状態で33.7%のスコアを獲得し、これは旧モデルの約3倍であるとともに、GPT-5.2の34.5%に迫る水準です。コーディング能力を評価するSWE-bench Verifiedでは78.0%を達成し、Gemini 2.5シリーズやClaude 4.5の77.2%、さらにはGemini 3 Proの76.2%をも超える性能を記録しました。また、一般知識の正確性を測るSimpleQA Verifiedでは68.7%を記録し、GPT-5.2の38.0%やClaude 4.5の29.3%を大幅に凌駕しており、回答の正確性が飛躍的に向上しています。

安全性と効率性の面では、Google独自のTPU上でJAXとML Pathwaysを用いてトレーニングされており、持続可能な運用が図られています。Gemini 2.5 Flashと比較して、安全性評価やトーンの客観性が向上しており、プロンプトの不当な拒否は10.4%減少したとのこと。
Gemini 3 Flashは100万トークンの入力コンテキストウィンドウと最大6万4000トークンの出力をサポートしており、APIの価格は100万入力トークンあたり0.50ドル(約77.7円)、100万出力トークンあたり3.00ドル(約466円)に設定されています。これはGemini 2.5 Flashの入力0.30ドル(約46.6円)/出力2.50ドル(約389円)と比較すると上昇していますが、Gemini 3 Proの入力2.00ドル(約311円)/出力12.00ドル(約1870円)に比べるとかなり安価といえます。
以下のグラフは性能(横軸)とコスト(縦軸)のバランスを可視化したもので、Gemini 3 FlashがGemini 2.5 Proを超える性能を維持しながら、その3倍の応答速度と圧倒的な低コストを同時に達成していることを示しています。Googleは、従来のFlashシリーズが備えていた低遅延という強みにGemini 3 Pro級の思考能力を加えることで、品質と効率のトレードオフを劇的に改善し、新たな業界標準を確立したとアピールしています。

記事作成時点で、Gemini 3 FlashはGoogle AI StudioやGoogle検索のAIモード、Geminiアプリを通じてプレビュー版が提供されており、一般ユーザーは無料プランを含めて使用可能。なお、有料サブスクリプションプランであるProやUltraの登録ユーザーは、無料ユーザーよりも大幅に高い利用制限枠が適用されます。
また、開発者向けには、Google AI StudioのGemini API、Gemini CLI、Android Studio、さらに新しいエージェント開発プラットフォームであるGoogle Antigravityを通じてプレビュー版が提供されています。
・関連記事
Gemini 3 Proは文書・空間・画面・動画理解で最先端パフォーマンスを実現 - GIGAZINE
Googleが「Gemini Deep Research エージェント」をリリース&ベンチマーク「DeepSearchQA」オープンソース化 - GIGAZINE
Googleが「Gemini 2.5 Flash」を発表、OpenAIの「o4-mini」よりコスパに優れているとアピール - GIGAZINE
OpenAIが「GPT-5.2」を緊急事態「コードレッド」発令からわずか1カ月足らずでリリース、猛追するGoogleへ反撃となるか - GIGAZINE
OpenAIが画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を公開、画像生成が最大4倍高速化でGoogleのNano Banana Proに対抗 - GIGAZINE
NVIDIAが小型かつ高性能なオープンAIモデル「Nemotron 3」シリーズを発表 - GIGAZINE
・関連コンテンツ







