Googleが「Gemini 2.5 Flash」を発表、OpenAIの「o4-mini」よりコスパに優れているとアピール

Googleが2025年4月17日、推論AIモデル「Gemini 2.5」シリーズに、「Gemini 2.5」シリーズに、コストパフォーマンスに優れた「Gemini 2.5 Flash」を追加したことを発表しました。
Start building with Gemini 2.5 Flash - Google Developers Blog
https://developers.googleblog.com/en/start-building-with-gemini-25-flash/
Gemini 2.5 Flash is now in preview
https://blog.google/products/gemini/gemini-2-5-flash-preview/
Gemini 2.5 Flash is now in preview!
— Google Cloud Tech (@GoogleCloudTech) April 17, 2025
⚡ Our lowest latency, most cost-efficient thinking model
???? Control reasoning to balance performance and budget
✅ Ideal for summarization, chat, data extraction, and more
Try on #VertexAI → https://t.co/8qZcCQzPXI pic.twitter.com/V31L4rr9Ow
Start building with Gemini 2.5 Flash
https://simonwillison.net/2025/Apr/17/start-building-with-gemini-25-flash/
今回発表されたGemini 2.5 Flashは、2025年3月にリリースされた推論AIモデル「Gemini 2.5」シリーズの1つです。推論モデルとは、答えを出す前に追加の計算能力と時間をかけて事実確認と問題の推論を行うことで、数学的な問題やコーディングなどでも高い精度の出力を可能とするもので、従来の大規模言語モデルが苦手としていた数学的な問題やコーディングなど、論理力を問われる複雑なタスクでも高い精度での出力が可能とされています。
Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上 - GIGAZINE

Gemini 2.5 Flashでの各種ベンチマーク結果をまとめた表が以下。Gemini 2.5 Flashは2025年2月リリースのGemini 2.0 Flashに対し多くのベンチマークで高い結果を残しています。また、Gemini 2.5 Flashの100万トークンあたりの料金は入力が0.15ドル(約21円)、出力が最大3.5ドル(約500円)で、入力に1.1ドル(約156円)、出力に4.4ドル(約626円)を要するOpenAIの推論モデル「o4-mini」よりも安価ながら、ベンチマークではo4-miniに近い結果を示しています。

GoogleはGemini 2.5 Flashについて「コストパフォーマンスが最高のモデル」とアピールしており、以下のグラフではGemini 2.5 Flashが他のAIモデルに比べて安価でありながら、大規模言語モデルのパフォーマンスを比較するためのオープンソースAIベンチマークであるChatbot Arenaではスコアが上位に位置していることが示されています。

Gemini 2.5 FlashはGoogle AI StudioやVertex AIで利用できます。ソフトウェアエンジニアのサイモン・ウィルソン氏は実際にGemini 2.5 Flashを用いて画像生成を行っています。ウィルソン氏は「自転車に乗ったペリカン」を大規模言語モデルに描かせるという独自のベンチマークを考案しており、今回もGemini 2.5 Flashに対して「Generate an SVG of a pelican riding a bicycle(自転車に乗っているペリカンをSVG形式で生成してください)」というプロンプトを入力しました。
「Reasoning(推論)」機能をオンにして生成された画像が以下。ウィルソン氏によると、この画像の生成には1.4933セント(約2.1円)を要したとのこと。

続いて「Reasoning」機能をオフにして生成された画像がこんな感じ。生成に要したコストは0.1025セント(約0.15円)です。

思考に費やすリソースを最大化した状態で生成した画像が以下。5174個の出力トークンのうち3023個が推論に用いられ、コストは1.8111セント(約2.58円)でした。

ウィルソン氏は「Gemini 2.5 FlashのSVGへのアプローチについて私が本当に評価していることの1つは、Gemini 2.5 FlashがCSSやコメント、および一般的なSVGクラス構造に非常に優れたセンスを示していることです」と評価しています。また、掲示板サイト・Hacker Newsでは「Gemini 2.5 Flashはコストパフォーマンスが最高なマルチモーダルツールです。GoogleはAI開発競争に勝利しました」とのコメントや、「GeminiのFlashシリーズは、高速かつコストパフォーマンスに優れており、エンドユーザーにピッタリです」との評価も寄せられています。
・関連記事
GPT-4oやGoogle Geminiに「自転車に乗ったペリカン」をSVG形式で描かせるベンチマークを試すとこんな感じ - GIGAZINE
Googleが次世代推論AIモデル「Gemini 2.5」発表、推論とコーディング性能が大きく向上 - GIGAZINE
Googleが公開わずか数日でGemini 2.5 Proを無料ユーザーにも開放 - GIGAZINE
Googleが「Gemini Live」とリアルタイム動画分析が可能な「Project Astra」を統合した機能の提供を一部ユーザー対象に開始か - GIGAZINE
GoogleのAIアシスタント「Gemini」で動画生成が可能に - GIGAZINE
「逆転裁判」でOpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverickの推論能力を検証する - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by log1r_ut
You can read the machine translated English article Google announces 'Gemini 2.5 Flash,' cla….