ソフトウェア

「Gemini 1.5 Flash」「Gemini 1.5 Pro」の更新版リリース、数学性能や視覚理解性能が向上してProの価格は大幅値下げ


GoogleがGemini 1.5シリーズの性能強化版モデル「Gemini-1.5-Pro-002」と「Gemini-1.5-Flash-002」を発表しました。両モデルは強化前と比べて数学性能や視覚理解性能などが向上しているとのこと。また、Gemini 1.5 Proの値下げも発表されています。

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more - Google Developers Blog
https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

Gemini 1.5 FlashおよびGemini 1.5 Proの2024年5月版と今回発表された2024年9月版のベンチマーク結果をまとめた表が以下。両モデルともに、ほとんどのベンチマークで2024年9月版の方が高いスコアを記録しています。特に、数学性能を測定するベンチマークでは約20%の性能向上を達成。さらに、視覚理解やコーディング性能も向上しています。


Gemini 1.5 Flashは処理速度の向上やレイテンシの低減にも力をいれているとのこと。以下の左側のグラフは2024年6月から9月までの期間の「1秒ごとに処理できるトークン数」の推移を示し、右側のグラフは「最初のトークンを受け取るまでの時間(レイテンシ)」の推移を示しています。グラフを見ると、秒間処理トークン数が増大し、レイテンシが短縮されていることが分かります。


GoogleはGemini 1.5 Proの値下げも発表しました。128Kトークン以下の場合、入力は100万トークン当たり1.25ドル(約179円)、出力は100万トークン当たり2.50ドル(約358円)。128Kトークンより大きい場合は、入力が100万トークン当たり5ドル(約716円)、出力は100万トークン当たり10ドル(約1431円)となります。新たな料金体系は2024年10月1日に適用開始予定です。


さらに、GoogleはGemini 1.5 Flashのレート制限を1000RPMから2000RPMへ、Gemini 1.5 Proのレート制限を360RPMから1000RPMへ引き上げることも発表しています。

なお、GoogleはGoogle WorkspaceにGeminiのスタンドアロンアプリを追加したことも発表しています。

We’re expanding Gemini access to more customers | Google Workspace | Google Workspace Blog
https://workspace.google.com/blog/product-announcements/google-workspace-extends-gemini-benefits-to-more-customers

この記事のタイトルとURLをコピーする

・関連記事
GoogleがAIの誤情報生成を防止するAIモデル「DataGemma」をリリース、「信頼できるデータ集」を参照して幻覚(ハルシネーション)を軽減 - GIGAZINE

GoogleのAI「Gemini」とリアルタイムで会話できるようになる機能「Gemini Live」が公開される - GIGAZINE

GoogleのマルチモーダルAI「Gemini 1.5 Flash」の使用料金が最大78%の大幅値下げ - GIGAZINE

Google Chrome 127のベータ版にAIモデル「Gemini Nano」が追加されたのでチャットしてみた - GIGAZINE

Metaの大規模言語モデル「Llama」の累計ダウンロード数が3億5000万回に迫る - GIGAZINE

全ベンチマークでGPT-4oを上回る世界トップのオープンソース大規模言語モデル「Reflection 70B」が登場、Llama 3.1 70B Instructをベースにリフレクションチューニングを施す - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.