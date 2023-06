Baidu’s Ernie Beats OpenAI’s ChatGPT in Key Tests, Company Says - Bloomberg https://www.bloomberg.com/news/articles/2023-06-27/baidu-s-ernie-beats-openai-s-chatgpt-in-key-tests-company-says Ernie 3.5は、人間の認知や能力に関連するタスクにおける指標を測るMicrosoft Researchのベンチマーク「AGIEval」および上海交通大学、清華大学、エディンバラ大学が共同で作成した中国語の性能を測るベンチマーク「C-Eval」、バークレー大学、コロンビア大学、イリノイ大学アーバナ・シャンペーン校、シカゴ大学が共同でリリースしたマルチタスク性能を測るベンチマーク「MMLU」による 評価 を受けています。 こうしたベンチマークのテストにおいて、Ernie 3.5はAGIEvalおよびC-EvalにおいてGPT-3.5を上回る性能を発揮したことが報告されており、AGIEvalおよびC-Evalの中国語性能はGPT-3.5の後継モデルであるGPT-4をも上回ったことが確かめられたとのこと。

