ソフトウェア

Googleが大規模言語モデル「Gemma 2」のコンパクトバージョン「Gemma 2 2B」の日本語版をリリース


Googleが開発したオープンかつ商用利用可能な大規模言語モデル「Gemma 2」のパラメーターをコンパクトにした「Gemma 2 2B」の日本語版が、2024年10月3日にリリースされました。

日本語版 Gemma 2 2B を公開
https://blog.google/intl/ja-jp/company-news/technology/gemma-2-2b/


Googleは2024年2月、マルチモーダルAIのGeminiよりも軽量であり、オープンソースで商用利用も可能な大規模言語モデル「Gemma」をリリースしました。そして5月にはGemmaの強化版である「Gemma 2」も発表しました。

Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表 - GIGAZINE


Gemma 2のパラメーター数は270億(27B)と90億(90B)でしたが、8月にはさらにコンパクトな軽量版「Gemma 2 2B」が登場しました。Gemma 2 2Bはパラメーターサイズがわずか20億(2B)で、既存のモデルの中で最もコンパクトで軽量ですが、よりパラメーターサイズの大きなモデルから学習することで、コンパクトながら高いパフォーマンスを発揮するとGoogleはアピールしています。

Googleが大規模言語モデル「Gemma 2」をベースとしたパラメーターサイズがコンパクトな「Gemma 2 2B」、AIモデルの入出力をフィルタリングする「ShieldGemma」、モデル解釈ツール「Gemma Scope」を発表 - GIGAZINE


そして10月3日、東京で開催されたGemma Developer Dayにおいて、Googleは日本語版「Gemma 2 2B」を公開しました。日本語版のGemma 2 2BはGemma 2と比較して優れた文章力や指示内容を的確に理解し反映する能力を持っており、全体的な品質が向上しているとのこと。

Googleは、「日本語版 Gemma 2 2Bは、自社評価において、 GPT-3.5を上回るパフォーマンスを発揮し、モバイル端末での高速でスムーズな処理能力や日英両言語における高い品質を維持しています。この結果は、モデルのサイズを考慮すると、Gemmaモデルが英語以外の言語でも高い性能を発揮できる可能性を示しています」とコメントしました。


なお、日本語版のGemma 2 2Bのモデルは機械学習プラットフォームのHugging Faceで公開されているほか、開発者向けのトレーニングガイドも公開されています。

Gemma 2 JPN Release - a google Collection
https://huggingface.co/collections/google/gemma-2-jpn-release-66f5d3337fdf061dff76a4f1

この記事のタイトルとURLをコピーする

・関連記事
Googleが大規模言語モデル「Gemma 2」をベースとしたパラメーターサイズがコンパクトな「Gemma 2 2B」、AIモデルの入出力をフィルタリングする「ShieldGemma」、モデル解釈ツール「Gemma Scope」を発表 - GIGAZINE

Googleがオープンかつ商用利用可能な大規模言語モデル「Gemma」ファミリーにコード補完・生成・命令フォローを強化した「CodeGemma」と効率を最適化した「RecurrentGemma」を追加すると発表 - GIGAZINE

200万トークンを入力可能なGemini 1.5 Proが全開発者に開放&オープンモデルのGemma 2公開 - GIGAZINE

Googleがオープンソースのビジュアル言語モデル「PaliGemma」を公開&Llama 3と同等性能の大規模言語モデル「Gemma 2」を発表 - GIGAZINE

Googleがオープンかつ商用利用可能で軽量な大規模言語モデル「Gemma」を公開 - GIGAZINE

in ソフトウェア, Posted by log1h_ik

You can read the machine translated English article here.