ソフトウェア

MetaがGPT-4超えのAIモデル「Llama 3.1」をリリース


Metaが大規模言語モデル「Llama 3.1」を2024年7月23日にリリースしました。Llama 3.1はオープンソースで公開されており、GPT-4やGPT-4oといった最先端のクローズドソースAIモデルと同等以上の性能を備えているそうです。

Llama 3.1
https://llama.meta.com/

Introducing Llama 3.1: Our most capable models to date
https://ai.meta.com/blog/meta-llama-3-1/

Llama 3.1はパラメーター数「4050億」「700億」「80億」のモデルが用意されており、すべてのモデルが12万8000のコンテキストウィンドウを備えています。

パラメーター数4050億の「Llama 3.1 405B」のベンチマーク結果を「Nemotron 4 340B Instruct」「GPT-4」「GPT-4o」「Claude 3.5 Sonnet」と比較した表が以下。Llama 3.1 405Bは複数のテストでGPT-4やGPT-4oを上回るスコアを記録しています。


さらに、「Llama 3.1 405B」と「GPT-4」「GPT-4o」「Claude 3.5 Sonnet」の出力結果を人間に比較させた結果が以下。半分以上の被験者がLlama 3.1 405Bの出力結果を3種のモデルと同等以上と評価していることが分かります。


「Llama 3.1 8B」と「Llama 3.1 70B」のベンチマーク結果はこんな感じ。どちらのモデルも同規模のモデルと比較して高いスコアを記録しています。


すでにNVIDIAのAIプラットフォーム「NVIDIA NIM」で「llama-3.1-405b-instruct」を活用したチャットAIのデモを利用可能だったので、実際に使ってみました。まず、日本語で「有線イヤホンと完全ワイヤレスイヤホンのどちらを選ぶべきか教えて」と質問すると、両者のメリットとデメリットを列挙しつつ選び方を教えてくれました。


続いて、「Vimで行番号を表示する方法を教えて」と質問すると、行番号を表示するコマンドや設定ファイルへの記述方法を教えてくれました。


Llama 3.1はすでにMetaの公式サイトやHugging Faceで配布されており、無料でダウンロード可能です。また、Llama 3.1は「LLAMA 3.1 COMMUNITY LICENSE AGREEMENT」というライセンスのもとで公開されており、一定の条件下で再配布や商用利用が可能です。

Llama 3.1
https://llama.meta.com/


Llama 3.1 - a meta-llama Collection
https://huggingface.co/collections/meta-llama/llama-31-669fc079a0c406a149a5738f


なお、Metaのマーク・ザッカーバーグCEOはLlama 3.1の発表に際して「AIの明るい未来のためにはオープンソースが不可欠である」「Llamaプロジェクトは効率性の向上、処理チップの最適化、エコシステムの発展のためにオープンソース化しており、オープンソース化によって技術的有意性が損なわれることはないと考えている」「これまでのLlamaはMetaの社内向けのプロジェクトだった。Llama 3.1ではできるだけ多くの開発者やパートナーが利用できるように社内チームを編成している」という声明を発表しています。

この記事のタイトルとURLをコピーする

・関連記事
Metaが「マルチトークン予測」を実行する事前トレーニング済みのコード生成モデルをオープンソースでリリース - GIGAZINE

Metaがテキストから3Dモデルを1分で生成するツール「3D Gen」を発表 - GIGAZINE

OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応 - GIGAZINE

NVIDIAがオープンモデル「Nemotron-4 340B」を発表、LLMトレーニング用合成データの生成に革命を起こすか - GIGAZINE

NVIDIAとMistral AIがAIモデル「Mistral NeMo」を発表、新型トークナイザ「Tekken」を採用し日本語を含む多言語性能が強み - GIGAZINE

Microsoftがスプレッドシートを理解できる言語モデル「SpreadsheetLLM」を発表、Excelの仕事もAIがこなす時代に - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.