2023年07月10日 06時00分ソフトウェア

GPT-4よりも高い性能を発揮できる特定言語特化型の言語モデル「InternLM」

高性能チャットAI「ChatGPT」が大きな注目を集める中、ChatGPTに匹敵する性能をアピールする言語モデルが続々と発表されています。上海AI研究所が中心となって開発した言語モデル「InternLM」は英語と中国語に特化してトレーニングされており、複数の性能評価テストでChatGPTを超えるスコアを記録しています。

InternLM
https://internlm.org/

InternLMは上海AI研究所や複数の大学および企業が協力して開発した言語モデルで、1兆トークン以上の多言語データでトレーニングされています。InternLMの主な特徴は以下の通り。

・複数の言語を理解および表現する能力を備えており、特に英語と中国において顕著なパフォーマンスを発揮する。
・論理的推論、コード生成などの分野で優れた性能を発揮する。
・多様な中国語の性能評価テストでChatGPTを超え、GPT-4に近いに性能を発揮する。

Microsoft製の言語モデルの性能評価テスト「AGIEval」では、InternLM(青)がChatGPT(赤)をすべての要素で上回っています。さらに、「GK-En」「GK-history」「GK-Cn」ではGPT-4(水色)を上回るスコアを記録しています。

言語モデルの中国語処理性能を評価できる「C-Eval」の結果が以下。InternLM(青)は「Middle School Biology」を除くほとんどのテストでGPT-4(水色)のスコアを上回っています。

InternLMはChatGPTのようなチャット形式でのやり取りが可能な他、文章での指示に合わせてコードを生成することもできます。

InternLMのモデルデータは以下のGitHubリポジトリで公開されています。

GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system.
https://github.com/InternLM/InternLM