NVIDIAが日本語特化の小型AIモデル「Nemotron-Nano-9B-v2-Japanese」を公開、10B以下で最高性能を達成し商用利用可能

NVIDIAが日本語に特化した小規模言語モデル(SLM)として「Nemotron-Nano-9B-v2-Japanese」を公開しました。Nemotron-Nano-9B-v2-Japaneseはパラメーター数100億以下の日本語モデルとして最高性能を達成しており、商用利用可能なオープンモデルとして公開されています。
NVIDIA Nemotron 2 Nano 9B Japanese: 日本のソブリンAIを支える最先端小規模言語モデル
https://huggingface.co/blog/nvidia/nemotron-nano-9b-v2-japanese-ja
記事作成時点ではクラウド上でモデルを実行するAIサービスが主流ですが、機密データを扱う企業では社内サーバーでモデルを実行する必要があります。このため社内サーバーでも十分に動作する小型かつ高性能なモデルが求められていますが、日本語処理性能の高い小型モデルは選択肢が少ない状況が続いています。
Nemotron-Nano-9B-v2-JapaneseはNemotron-Nano-9B-v2をベースに日本語データセットのNemotron-Personas-Japanなどを用いてカスタマイズしたモデルで、高度な日本語処理能力を備えたSLMとして位置付けられています。

AIモデルの日本語性能測定結果を集積しているNejumi Leaderboard(ねじゅみリーダーボード)で100億パラメータ以下のモデルに絞ったランキングが以下。Nemotron-Nano-9B-v2-JapaneseはQwen3-8BやGemma-3-12b-itといったモデルを抑えてトップスコアを記録しています。

「Qwen3-8B」「Nemotron-Nano-9B-v2」「Nemotron-Nano-9B-v2-Japanese」のカテゴリごとの性能をまとめたグラフが以下。Nemotron-Nano-9B-v2-Japaneseは知識テストやコーディングテストでベースモデルや競合モデルを上回っています。

Nemotron-Nano-9B-v2-Japaneseは高速な処理が可能なことも特徴で、NVIDIAが実行したテストではQwen3-8Bと比べて最大6倍の速度を記録しています。

Nemotron-Nano-9B-v2-Japaneseのモデルデータは以下のリンク先で公開されています。ライセンスは商用利用可能な「NVIDIA Nemotron Open Model License」です。
nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese · Hugging Face
https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese

また、日本語データセットのNemotron-Personas-Japanも以下のリンク先で公開されています。ライセンスは「Creative Commons Attribution 4.0 International」です。
nvidia/Nemotron-Personas-Japan · Datasets at Hugging Face
https://huggingface.co/datasets/nvidia/Nemotron-Personas-Japan

・関連記事
日本語を高速生成できる拡散言語モデル「ELYZA-LLM-Diffusion」が登場 - GIGAZINE
日本語特化の小型AIモデル「LFM2.5-1.2B-JP」を含むオンデバイス重視のオープンモデル「LFM2.5」シリーズが登場 - GIGAZINE
日本語を含む11言語に対応する高精度な自動文字起こしAIモデル「Qwen3-ASR-Flash」をAlibabaの開発チームが発表 - GIGAZINE
翻訳特化のAIモデル「TranslateGemma」をGoogleが公開、日本語も対応 - GIGAZINE
Googleが音楽生成AI「Lyria 3」を公開したので日本語ボーカル付き楽曲を作ってみた - GIGAZINE
・関連コンテンツ
in AI, Posted by log1o_hf
You can read the machine translated English article NVIDIA releases 'Nemotron-Nano-9B-v2-Jap….







