ソフトウェア

Metaが「Llama 3.2」を公開、画像認識性能が向上&スマホ特化の小型版もあり


MetaがAIモデル「Llama 3.2」を2024年9月26日に発表しました。Llama 3.2には画像認識性能が向上した中規模モデルの「Llama 3.2 90B」と「Llama 3.2 11B」のほかに、スマートフォン上でのローカル動作に最適化された小規模モデル「Llama 3.2 3B」および「Llama 3.2 1B」もラインナップされています。

Llama 3.2
https://www.llama.com/

Llama 3.2: Revolutionizing edge AI and vision with open, customizable models
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/

◆「Llama 3.2 90B」&「Llama 3.2 11B」
「Llama 3.2 90B」と「Llama 3.2 11B」は、Llama 3.1のテキスト関連の機能を維持しつつ画像認識性能を向上するようにトレーニングされています。これにより、画像とテキストを同時に入力して高精度の推論結果を得られるようになっています。


「Llama 3.2 90B」と「Llama 3.2 11B」のベンチマーク結果を「Claude 3 Haiku」や「GPT4o-mini」と比較した表が以下。「Llama 3.2 90B」は多くのテストでライバルモデルのスコアを上回り、「Llama 3.2 11B」も比較的小規模なモデルとしては高いスコアを記録しています。


◆「Llama 3.2 3B」&「Llama 3.2 1B」
「Llama 3.2 3B」と「Llama 3.2 1B」はスマートフォン上での動作を念頭に置いた軽量モデルで、非力なスマートフォン向けチップ上で「要約」「リライト」「文章生成」といった操作を実行できます。なお、「Llama 3.2 3B」と「Llama 3.2 1B」を開発する際にはArmやQualcomm、Mediatekと緊密に連携したとのこと。

スマートフォン上で文章をリライトするテストでは、「Llama 3.2 3B」と「Llama 3.2 1B」が「Phi 3.5 3.8B」や「Gemma 2 2.6B」といった軽量モデルよりも高い性能を示しました。


「Llama 3.2 3B」「Llama 3.2 1B」「Gemma 2 2B IT」「Phi-3.5-mini IT」のベンチマーク結果を並べた表が以下。「Llama 3.2 3B」は多くのテストでライバルを上回り、「Llama 3.2 1B」も一部のテストでライバルを上回っています。


Llama 3.2の各種モデルは以下のリンク先でダウンロード可能です。ただし、「Llama 3.2 3B」と「Llama 3.2 1B」は量子化済みモデルのみが公開されており、未量子化モデルの詳細は近日中に公開される予定です。

meta-llama (Meta Llama)
https://huggingface.co/meta-llama

この記事のタイトルとURLをコピーする

・関連記事
Metaが次世代のオープンLLM「Llama 3」を公開、無料で商用利用可能なモデルの中では過去最高の性能 - GIGAZINE

MetaがGPT-4超えのAIモデル「Llama 3.1」をリリース - GIGAZINE

Metaの大規模言語モデル「Llama」の累計ダウンロード数が3億5000万回に迫る - GIGAZINE

Metaのメタバース部門は6720億円の赤字だが全体の利益は前年同期比73%増の約2兆円&すでに「Llama 4」の開発を進めておりAIインフラを拡充予定 - GIGAZINE

Metaの大規模言語モデル「Llama 3.1」をファインチューニングしたAIモデル「Hermes 3」がリリースされる - GIGAZINE

全ベンチマークでGPT-4oを上回る世界トップのオープンソース大規模言語モデル「Reflection 70B」が登場、Llama 3.1 70B Instructをベースにリフレクションチューニングを施す - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.