ソフトウェア

GPT-4よりも高い性能を発揮できる特定言語特化型の言語モデル「InternLM」


高性能チャットAI「ChatGPT」が大きな注目を集める中、ChatGPTに匹敵する性能をアピールする言語モデルが続々と発表されています。上海AI研究所が中心となって開発した言語モデル「InternLM」は英語と中国語に特化してトレーニングされており、複数の性能評価テストでChatGPTを超えるスコアを記録しています。

InternLM
https://internlm.org/


InternLMは上海AI研究所や複数の大学および企業が協力して開発した言語モデルで、1兆トークン以上の多言語データでトレーニングされています。InternLMの主な特徴は以下の通り。

・複数の言語を理解および表現する能力を備えており、特に英語と中国において顕著なパフォーマンスを発揮する。
・論理的推論、コード生成などの分野で優れた性能を発揮する。
・多様な中国語の性能評価テストでChatGPTを超え、GPT-4に近いに性能を発揮する。


Microsoft製の言語モデルの性能評価テスト「AGIEval」では、InternLM(青)がChatGPT(赤)をすべての要素で上回っています。さらに、「GK-En」「GK-history」「GK-Cn」ではGPT-4(水色)を上回るスコアを記録しています。


言語モデルの中国語処理性能を評価できる「C-Eval」の結果が以下。InternLM(青)は「Middle School Biology」を除くほとんどのテストでGPT-4(水色)のスコアを上回っています。


InternLMはChatGPTのようなチャット形式でのやり取りが可能な他、文章での指示に合わせてコードを生成することもできます。


InternLMのモデルデータは以下のGitHubリポジトリで公開されています。

GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system.
https://github.com/InternLM/InternLM

この記事のタイトルとURLをコピーする

・関連記事
ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説 - GIGAZINE

ChatGPTなどの大規模言語モデルはどんな理論で成立したのか?重要論文24個まとめ - GIGAZINE

Metaの大規模言語モデル「LLaMA」がChatGPTを再現できる可能性があるとさまざまなチャットAI用言語モデルのベンチマーク測定で判明 - GIGAZINE

GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.