ソフトウェア

Abacus AIがリリースしたオープンソースLLM「Smaug-72B」がHugging FaceのOpen LLM LeaderboardでトップとなりいくつかのベンチマークでGPT-3.5を上回ったことが明らかに


アリババのオープンソース言語モデル「Qwen-72B」を微調整して作られた「Smaug-72B」が2024年2月6日に登場し、同時にSmaug-72Bが「世界最高のオープンソース言語モデル」の座を獲得したことが明らかになりました。

abacusai/Smaug-72B-v0.1 · Hugging Face
https://huggingface.co/abacusai/Smaug-72B-v0.1


Meet 'Smaug-72B': The new king of open-source AI | VentureBeat
https://venturebeat.com/ai/meet-smaug-72b-the-new-king-of-open-source-ai/

カリフォルニア州サンフランシスコに拠点を置くAI企業・Abacus AIが開発したSmaug-72Bは、ARC、HellaSwag、MMLU、TruthfulQA、Winogrande、GSM8Kなどの著名なベンチマークで高得点を獲得し、全オープンソース言語モデルの中で最も優れた平均点をたたき出しました。


オープンソースの大規模言語モデルのベンチマークスコアをまとめたページには以下からアクセス可能。

Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard


Smaug-72Bはいくつかのベンチマークで大規模言語モデル「GPT-3.5」や「Mistral Medium」を超える点数を出しており、とりわけ派生元の「Qwen-72B」とは平均点で7ポイント近くも差を付けています。

Smaug-72Bは人間レベルのパフォーマンスを示す平均90~100点にはまだ及ばないものの、オープンソースのモデルの中では初めて80点を超えたものであり、テクノロジー系メディアのVentureBeatは「長い間秘密のベールに包まれてきたビッグテックの能力に、オープンソース言語モデルが近いうちに追いつくかもしれないことを示唆している」と評価しました。

Abacus AIのビンドゥ・レディCEOは「Smaug-72Bは現在Hugging Faceで入手可能です。このモデルはLLMリーダーボードのトップにあり、平均スコア80に達した最初のモデルです。言い換えれば、世界最高のオープンソース基礎モデルということです」とコメント。さらに「私たちの次の目標は、これらのテクニックを研究論文として発表し、既存の最高のMistralモデルに適用することです」と付け加えました。


Smaug-72Bについての詳細は、今後発表される論文で詳しく説明される予定です。

この記事のタイトルとURLをコピーする

・関連記事
中国アリババがチャットAI「Qwen-72B」とローカルで音声入力に対応する「Qwen-Audio」をオープンソースで公開 - GIGAZINE

ネット上に流出した大規模言語モデルは自社製のものだとAI企業・MistralのCEOが確認 - GIGAZINE

GoogleとHugging Faceが戦略的提携、Hugging FaceユーザーがNVIDIAのH100やGoogleのTPUなどの強力な計算資源を利用可能に - GIGAZINE

「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場 - GIGAZINE

無料で商用利用可能な大規模言語モデル「Mixtral 8x7B」が登場、低い推論コストでGPT-3.5と同等以上の性能を発揮可能 - GIGAZINE

in ソフトウェア, Posted by log1p_kr

You can read the machine translated English article The open source LLM 'Smaug-72B' released….