Googleが従来のモデルよりさらに小型で高速な「Gemini 1.5 Flash-8B」をリリース、価格は50%低くなり遅延も軽減
Googleは2024年5月に、高速かつ高性能な軽量AIモデル「Gemini 1.5 Flash」を発表しました。これをさらに軽量化し、価格を抑えたバージョン「Gemini 1.5 Flash-8B」の製品版が2024年10月3日にリリースされました。
Gemini 1.5 Flash-8B is now production ready - Google Developers Blog
https://developers.googleblog.com/en/gemini-15-flash-8b-is-now-generally-available-for-use/
Gemini 1.5 Flash-8B is now production ready
https://simonwillison.net/2024/Oct/3/gemini-15-flash-8b/
Googleが発表したAIモデルのGemini 1.5 Flashは、ベンチマークテストにおいてGemini 1.5 Proに匹敵する性能を誇りながら、Gemini 1.5 Proより大幅に安く使える点が特徴です。
Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス - GIGAZINE
Googleはリリース後の数カ月間でGemini 1.5 Flashに改良を加え、さらに小型で高速なバージョン「Gemini 1.5 Flash-8B」を開発しました。Gemini 1.5 Flash-8Bは9月に実験版としてリリースされており、10月には製品版がリリースされました。
Gemini 1.5 Flash-8Bは軽量化されたモデルでありながら、多くのベンチマークでGemini 1.5 Flashと同等のパフォーマンスを発揮しているとのこと。
Gemini 1.5 Flash-8BはGeminiシリーズの中で最も低価格で利用可能となっており、Googleは「Gemini 1.5 Flashと比較して50%安い」とうたっています。具体的なコストは「プロンプトの入力100万トークンあたり0.0375ドル(約5.5円)」「プロンプトの出力100万トークンあたり0.15ドル(約22円)」「プロンプトのキャッシュ100万トークンあたり0.01ドル(約1.5円)」で、プロンプトが1万2800トークンを超えた分はそれぞれ倍額となります。
有料プランの開発者の場合、請求は10月14日から開始されるとのこと。Googleは、「この新しい価格は、Gemini 1.5 FlashとGemini 1.5 Proで開発者のコスト削減のために行ってきた作業と共に、開発者が世界を前進させる製品やサービスを自由に構築できるようにするという私たちのコミットメントを強調しています」と述べています。
また、Gemini 1.5 Flash-8Bは小さなプロンプトに対する遅延がGemini 1.5 Flashよりも低減されているほか、レート制限は2倍に引き上げられているとのことです。
開発者はGoogle AI StudioとGemini APIを介して、Gemini 1.5 Flash-8Bにアクセスできます。
Untitled prompt | Google AI Studio
https://aistudio.google.com/app/prompts/new_chat?model=gemini-1.5-flash-8b-002
Gemini models | Gemini API | Google AI for Developers
https://ai.google.dev/gemini-api/docs/models/gemini
・関連記事
GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能 - GIGAZINE
GoogleのマルチモーダルAI「Gemini 1.5 Flash」の使用料金が最大78%の大幅値下げ - GIGAZINE
Googleが高速かつ高性能な軽量AIモデル「Gemini Flash」を発表、Gemini Proの10分の1の価格で性能は同等クラス - GIGAZINE
文字・音声・画像を同時に処理して人間以上に自然なやりとりができるGPT-4を超える性能のマルチモーダルAI「Gemini」がリリースされる - GIGAZINE
200万トークンを入力可能なGemini 1.5 Proが全開発者に開放&オープンモデルのGemma 2公開 - GIGAZINE
ローカルで動作するスマホ向けAI「Gemini Nano」を開発者が自分のアプリに組み込めるように - GIGAZINE
・関連コンテンツ