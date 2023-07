2023年07月10日 06時00分 ソフトウェア

GPT-4よりも高い性能を発揮できる特定言語特化型の言語モデル「InternLM」



高性能チャットAI「ChatGPT」が大きな注目を集める中、ChatGPTに匹敵する性能をアピールする言語モデルが続々と発表されています。上海AI研究所が中心となって開発した言語モデル「InternLM」は英語と中国語に特化してトレーニングされており、複数の性能評価テストでChatGPTを超えるスコアを記録しています。



InternLM

https://internlm.org/





InternLMは上海AI研究所や複数の大学および企業が協力して開発した言語モデルで、1兆トークン以上の多言語データでトレーニングされています。InternLMの主な特徴は以下の通り。



・複数の言語を理解および表現する能力を備えており、特に英語と中国において顕著なパフォーマンスを発揮する。

・論理的推論、コード生成などの分野で優れた性能を発揮する。

・多様な中国語の性能評価テストでChatGPTを超え、GPT-4に近いに性能を発揮する。





Microsoft製の言語モデルの性能評価テスト「AGIEval」では、InternLM(青)がChatGPT(赤)をすべての要素で上回っています。さらに、「GK-En」「GK-history」「GK-Cn」ではGPT-4(水色)を上回るスコアを記録しています。





言語モデルの中国語処理性能を評価できる「C-Eval」の結果が以下。InternLM(青)は「Middle School Biology」を除くほとんどのテストでGPT-4(水色)のスコアを上回っています。





InternLMはChatGPTのようなチャット形式でのやり取りが可能な他、文章での指示に合わせてコードを生成することもできます。





InternLMのモデルデータは以下のGitHubリポジトリで公開されています。



GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system.

https://github.com/InternLM/InternLM