ソフトウェア

Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス


Googleが軽量かつ高性能なAIモデル「Gemini Flash」を2024年5月15日(水)に開催された「Google I/O 2024」で発表しました。Gemini FlashはGemini Proの10分の1の価格で利用可能で、ベンチマークテストではGemini Proに匹敵する性能を示しています。

Gemini Flash - Google DeepMind
https://deepmind.google/technologies/gemini/flash/

Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra
https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/

Gemini FlashはAPI経由で動作するGeminiシリーズの中では最も軽量なモデルです。Gemini Flashは処理速度を重視して開発されており、開発者やエンタープライズの一般的な用途では平均レイテンシーが1秒未満とされています。また、Gemini Flashのコンテキストウィンドウは100万トークンで、「1時間の動画」「11時間の音声」「3万行以上のコード」といった膨大なデータを処理可能です。

Geminiシリーズのベンチマーク結果を並べた表が以下。Gemini FlashはGemini 1.0 Proのスコアを大きく上回っているほか、一部のテストではGemini 1.5 Proのスコアも上回っています。


Gemini FlashはGemini APIとVertex AIで利用可能。Gemini APIは無料でも利用可能なほか、レート制限が緩和される有料プランも用意されています。有料プランの料金は、12万8000トークン以内のプロンプトの場合は100万トークン当たり0.35ドル(約55円)で、12万8000トークンを超えるプロンプトの場合は100万トークン当たり0.70ドル(約110円)です。なお、いずれの価格もGemini Proの10分の1です。


Gemini Flashの有料プランは2024年5月30日(木)から利用可能となります。

なお、Gemini Flashの発表と同時に、Gemini Proのアップデートも発表されました。Gemini Proのアップデート内容は以下の記事で確認できます。

GoogleがGemini 1.5 Proのアップデートを実施、コンテキストウィンドウを従来の100万トークンから200万トークンに拡張 - GIGAZINE

この記事のタイトルとURLをコピーする

・関連記事
GoogleのAI「Gemini」で作ったFitbitの健康アドバイス機能が2024年後半に登場、自然な会話で健康メニューを提案可能に - GIGAZINE

Googleのスンダー・ピチャイCEOがマルチモーダルAI・Geminiの過剰な多様性問題を「まったく容認できない」とコメント - GIGAZINE

GoogleがBardをGeminiに名称変更&高性能AIモデル「Ultra 1.0」を搭載した「Gemini Advanced」を発表&「Gemini」をスマホで使えるアプリも発表 - GIGAZINE

GoogleのマルチモーダルAI「Gemini」ベースのプログラミングに特化したAI「AlphaCode 2」登場、競技プログラミング上位15%に入る性能 - GIGAZINE

クラウド上ではなくスマホ上で動くローカルファーストLLM「Gemini Nano」がPixel 8 Proで動作可能に、GboardのSmart Replyとレコーダーの自動要約強化に先行投入 - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.