GoogleのチャットボットAI「Bard」がついにベンチマークスコアでGPT-4を上回って第2位に浮上

カリフォルニア大学バークレー校・カリフォルニア大学サンディエゴ校・カーネギーメロン大学が協力して設立したオープンな研究組織・Large Model Systems Org(LMSYS Org)は、大規模な機械学習モデルのデータセットやオープンモデル、評価ツールを共同開発しています。LMSYS Orgが自身の開発した大規模言語モデルベンチマークプラットフォームで、GoogleのチャットボットAI「Bard with Gemini Pro」のベンチマークスコアがOpenAIのGPT-4の一部モデルを超えて2位にランクインしたと報告しました。
LMSys Chatbot Arena Leaderboard - a Hugging Face Space by lmsys
https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

LMSYS Orgは大規模言語モデルのベンチマークプラットフォーム「Chatbot Arena」を開発しています。このベンチマークは人間ユーザーをオープンなチャットに招待し、匿名のAIモデル2種類と会話を行わせた上で投票を行い、チェスで用いられるイロレーティングで順位付けをするというものです。
対話型チャットAIのベンチマーク番付で1位はGPT-4ベースのChatGPTで2位はClaude-v1、GoogleのPaLM 2もトップ10にランクイン - GIGAZINE

LMSYS Orgによると、Chatbot Arenaのイロレーティング番付は2024年1月26日時点で1位がOpenAIのGPT-4 Turbo、2位がGoogleのBard(Gemini Pro)、3位がOpenAIのGPT-4 バージョン0314、4位がOpenAIのGPT-4 バージョン0613とのこと。
????Breaking News from Arena
— lmsys.org (@lmsysorg) January 26, 2024
Google's Bard has just made a stunning leap, surpassing GPT-4 to the SECOND SPOT on the leaderboard! Big congrats to @Google for the remarkable achievement!
The race is heating up like never before! Super excited to see what's next for Bard + Gemini… pic.twitter.com/QPtsqZdJhC
GPT-4 バージョン0314はMicrosoft Azure上で動作するGPT-4モデル「Azure OpenAI Service」で最初にリリースされたバージョンで、GPT-4 バージョン0613は2番目にリリースされたバージョンです。そして、今回これらのGPT-4モデルにイロレーティングで上回ったBardは、Googleが開発したマルチモーダルAI・Gemini Proをベースとした「Bard with Gemini Pro」です。
各モデルの1000戦でのレーティングサンプリング表と対戦勝率をまとめた表が以下の通り。
Sorry the above screenshots are not up-to-date. Here are the correct plots for model ratings and win-rate.
— lmsys.org (@lmsysorg) January 26, 2024
Check out leaderboard link for full details: https://t.co/MsbfthaZlk
Also, we welcome the community to compare Bard and other models at https://t.co/4LVJjx4pZi! pic.twitter.com/G8Z99iqpvO
LMSYS Orgは「GoogleのBardが見事な躍進を遂げ、GPT-4を超えてランク2位となりました。Googleの素晴らしい功績に対して、大きな祝福を!」とコメント。さらに将来的にリリースが予定されているGemini UltraベースのBardの結果についても期待を寄せています。
・関連記事
GoogleがチャットボットAI・Bardのトレーニングに携わったデータ会社との契約を終了、データ会社は「事前に知らなかった」 - GIGAZINE
GoogleがチャットボットAI「Bard」の有料版「Bard Advanced」を開発中、Bard Advancedに搭載予定の各種機能が報じられる - GIGAZINE
GoogleのマルチモーダルAI「Gemini Pro」を開発者や企業がAPI経由で利用可能に、1分あたり60クエリまで無料 - GIGAZINE
マルチモーダルAI「Gemini」を軸に「デジタルエージェント」「検索エンジン」「Chromeとの統合」などをGoogleのサンダー・ピチャイCEOとDeepmind創設者のデミス・ハサビスが語る - GIGAZINE
文字・音声・画像を同時に処理して人間以上に自然なやりとりができるGPT-4を超える性能のマルチモーダルAI「Gemini」がリリースされる - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by log1i_yk
You can read the machine translated English article Google's chatbot AI 'Bard' finally s….