ソフトウェア

Metaの大規模言語モデル「Llama 3.1」をファインチューニングしたAIモデル「Hermes 3」がリリースされる


Metaが2024年7月23日にリリースした大規模言語モデル「Llama 3.1」を微調整したAIモデル「Hermes 3」が、2024年8月15日にAI開発企業の「Nous Research」からリリースされました。Nous Researchによると、Hermes 3はLlama 3.1よりも高度な推論や戦略的計画、意志決定に優れたプロフェッショナルな用途に適しているとのことです。

Hermes 3 - NOUS RESEARCH
https://nousresearch.com/hermes3/


Unveiling Hermes 3: The First Full-Parameter Fine-Tuned Llama 3.1 405B Model is on Lambda’s Cloud
https://lambdalabs.com/blog/unveiling-hermes-3-the-first-fine-tuned-llama-3.1-405b-model-is-on-lambdas-cloud

NousResearch/Hermes-3-Llama-3.1-8B · Hugging Face
https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B

Metaが2024年7月にリリースした「Llama 3.1」のパラメータ数が4050億の「Llama 3.1 405B」は、複数のベンチマークでGPT-4やGPT-4oを上回る結果を残していることが報告されています。また、「Llama 3.1 405B」と「GPT-4」「GPT-4o」「Claude 3.5 Sonnet」の出力結果を人間に比較させると、半数以上の被験者がLlama 3.1 405Bの出力結果を3種のモデルと同等以上と評価しました。

MetaがGPT-4超えのAIモデル「Llama 3.1」をリリース - GIGAZINE


そんなLlama 3.1をNous Researchが微調整したAIモデルが「Hermes 3」です。Nous Researchによると、Hermes 3は複雑なロールプレイングと創造的なライティングに優れており、より没入感のあるキャラクター描写、より深いシミュレーション、予想外の架空の体験をユーザーに提供するとのこと。以下はHermes 3とLlama 3.1の各モデルのベンチマーク結果を比較した表です。Nous Researchはこの結果について「Hermes 3はLlama 3.1よりも優れているとは言わないまでも十分な競争力があり、両者の間にはさまざまな長所と短所があります」と述べています。


すでにHermes 3を用いたチャットアプリのデモが以下のリンク先で公開されているので、実際に使ってみました。

Lambda Chat
https://lambda.chat/chatui/


「日本語は使えますか?」と尋ねたところ、「はい、もちろん使えます」との返答がありました。Hermes 3では問題なく日本語が使用できるようです。


実際にHermes 3とチャットした結果が以下。


Linuxのコマンドに関する質問も正しく回答してくれました。どの質問もかなり高速かつ高精度に回答してくれます。


なお、Hermes 3の各モデルは以下のリンク先から無料でダウンロード可能です。

Hermes 3 - a NousResearch Collection
https://huggingface.co/collections/NousResearch/hermes-3-66bd6c01399b14b08fe335ea

この記事のタイトルとURLをコピーする

・関連記事
コード生成・数学・推論の能力が大幅に向上した「Mistral Large 2」をMistral AIがリリース - GIGAZINE

数学を解ける言語モデル「Qwen2-Math」が登場、GPT-4o超えの数学性能 - GIGAZINE

大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」 - GIGAZINE

日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能 - GIGAZINE

無料かつ匿名でブラウザからChatGPTやClaude 3などのAIが使える「AI Chat」をDuckDuckGoがリリースしたので使ってみた - GIGAZINE

in レビュー,   ソフトウェア, Posted by log1r_ut

You can read the machine translated English article here.