2026年02月19日 13時02分 AI

NVIDIAが日本語特化の小型AIモデル「Nemotron-Nano-9B-v2-Japanese」を公開、10B以下で最高性能を達成し商用利用可能

NVIDIAが日本語に特化した小規模言語モデル(SLM)として「Nemotron-Nano-9B-v2-Japanese」を公開しました。Nemotron-Nano-9B-v2-Japaneseはパラメーター数100億以下の日本語モデルとして最高性能を達成しており、商用利用可能なオープンモデルとして公開されています。

NVIDIA Nemotron 2 Nano 9B Japanese: 日本のソブリンAIを支える最先端小規模言語モデル
https://huggingface.co/blog/nvidia/nemotron-nano-9b-v2-japanese-ja

記事作成時点ではクラウド上でモデルを実行するAIサービスが主流ですが、機密データを扱う企業では社内サーバーでモデルを実行する必要があります。このため社内サーバーでも十分に動作する小型かつ高性能なモデルが求められていますが、日本語処理性能の高い小型モデルは選択肢が少ない状況が続いています。

Nemotron-Nano-9B-v2-JapaneseはNemotron-Nano-9B-v2をベースに日本語データセットのNemotron-Personas-Japanなどを用いてカスタマイズしたモデルで、高度な日本語処理能力を備えたSLMとして位置付けられています。

AIモデルの日本語性能測定結果を集積しているNejumi Leaderboard(ねじゅみリーダーボード)で100億パラメータ以下のモデルに絞ったランキングが以下。Nemotron-Nano-9B-v2-JapaneseはQwen3-8BやGemma-3-12b-itといったモデルを抑えてトップスコアを記録しています。

「Qwen3-8B」「Nemotron-Nano-9B-v2」「Nemotron-Nano-9B-v2-Japanese」のカテゴリごとの性能をまとめたグラフが以下。Nemotron-Nano-9B-v2-Japaneseは知識テストやコーディングテストでベースモデルや競合モデルを上回っています。

Nemotron-Nano-9B-v2-Japaneseは高速な処理が可能なことも特徴で、NVIDIAが実行したテストではQwen3-8Bと比べて最大6倍の速度を記録しています。

Nemotron-Nano-9B-v2-Japaneseのモデルデータは以下のリンク先で公開されています。ライセンスは商用利用可能な「NVIDIA Nemotron Open Model License」です。

nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese · Hugging Face
https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese

また、日本語データセットのNemotron-Personas-Japanも以下のリンク先で公開されています。ライセンスは「Creative Commons Attribution 4.0 International」です。

nvidia/Nemotron-Personas-Japan · Datasets at Hugging Face
https://huggingface.co/datasets/nvidia/Nemotron-Personas-Japan