OpenAIのCEOが「o2が博士号レベルのベンチマークで105%のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6%しか記録できなかった高難度テストで約2倍のスコアを達成か
OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105%のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。
i heard o2 gets 105% on GPQA
— Sam Altman (@sama) November 2, 2024
GPQAはAIの性能を測定するベンチマークの1種で、生物学・物理学・化学の専門家が作成した448問の選択問題で構成されています。GPQAの問題はかなりの高難度で、「専門家でない人間」がGoogle検索を駆使して挑んだ場合は34%、「博士号保持者または博士号の取得を目指す学生」の場合も65%のスコアしか獲得できません。
GPQAはすでに各種高性能AIのベンチマークとして利用されており、GPT-4oは53.6%、Claude3 Opusは50.4%、Llama3 400bは48.0%のスコアを記録しています。アルトマンCEOが述べた「105%」という数字は既存のAIのスコアを大きく上回るものであり、「o2」と呼ばれるAIモデルが博士号保持者を超える回答能力を備えていることが示唆されています。
アルトマンCEOが言及した「o2」は「GPT-4o」や「OpenAI o1」の後継モデルと推測できます。「o2」の登場時期は不明ですが、アルトマンCEOは2024年11月1日(金)に「複数の製品を2025年中にリリース予定」と発言しています。ただし、アルトマンCEOは「GPT-5を2025年中にリリースする計画はない」と言及しているほか、一部メディアが報道していた「次世代AIモデル『Orion』の2024年中のリリース」についてもOpenAIが否定声明を発表しています。
OpenAIのCEOがネット掲示板に降臨し「GPT-5は2024年中に登場しない」「複数の製品を2024年中に発表する」「AGIは既存のハードウェアで実現可能」など重要情報を次々に投下 - GIGAZINE
なお、アルトマンCEOは問題の投稿の直後に「しまった。アカウントをミスった」と投稿しています。
damn, wrong account
— Sam Altman (@sama) November 2, 2024
・関連記事
OpenAIのCEOがネット掲示板に降臨し「GPT-5は2024年中に登場しない」「複数の製品を2024年中に発表する」「AGIは既存のハードウェアで実現可能」など重要情報を次々に投下 - GIGAZINE
OpenAIがAI検索サービス「ChatGPT search」を発表、何度もググる必要がなくなるとアピール - GIGAZINE
OpenAIが言語モデルの事実性を測定するベンチマーク「SimpleQA」をオープンソースでリリース - GIGAZINE
OpenAIがBroadcomおよびTSMCと共同で初のチップを開発・製造予定、独自製造の野望を縮小 - GIGAZINE
OpenAI幹部がChatGPTの収益を語る、週間アクティブユーザーは2億5000万人で収益の75%は一般有料ユーザー - GIGAZINE
OpenAIがコードネーム「Orion」という次の主力AIモデルを12月に発売する予定という報道をOpenAIが否定 - GIGAZINE
・関連コンテンツ