ソフトウェア

OpenAIが「大規模言語モデルが人間の知能にどれだけ近づいたか」を評価する基準を作成


GPT-4oなどの大規模言語モデルを開発するOpenAIが、大規模言語モデルの知能が人間レベルにどれだけ追いつけているのかを示すための評価スケールを作成したことを明らかにしました。

OpenAI Sets Levels to Track Progress Toward Superintelligent AI - Bloomberg
https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-superintelligent-ai


Here’s how OpenAI will determine how powerful its AI systems are - The Verge
https://www.theverge.com/2024/7/11/24196746/heres-how-openai-will-determine-how-powerful-its-ai-systems-are

OpenAIの広報担当者が経済紙のBloombergに語ったところによると、OpenAIの従業員向け全体会議で、AIの新しい評価スケールが共有されたとのこと。


このスケールはレベル1からレベル5まで、5つの段階で構成されており、レベルが進めば進むほど人間に追いついていると評価されます。

OpenAIは記事作成時点での大規模言語モデルはレベル1であり、レベル2に近づいているとしています。OpenAIによれば、レベル2は博士レベルの教育を受けた人間と同等の基本的な問題解決能力を持つシステムと評価されるそうです。また、レベル3は「ユーザーに代わって行動できる」、レベル4は「新しいイノベーションを生み出せる」、最高段階のレベル5は「組織全体の仕事を行うことができる」レベルに設定されているそうです。


OpenAIによる新しい評価スケールは、ロスアラモス国立研究所とのパートナーシップを締結した直後に導入されたとのこと。

OpenAIとロスアラモス国立研究所がAIの安全性強化のために協力 - GIGAZINE


OpenAIは「ほとんどの経済的に価値のあるタスクで、人間を上回るレベルで高度に自律的なシステム」として、汎用人工知能(AGI)の開発を目指しています。サム・アルトマンCEOは2023年10月に「AGIの完成にはあと5年ほどかかる」と発言していますが、レベル5に相当するAGIが完成するまでには膨大な計算能力と資金が必要となります。

ただし、この評価スケールはあくまでも暫定的なものであるため、今後従業員や投資家、理事会からのフィードバックをもとに評価基準が微調整される可能性があります。

この記事のタイトルとURLをコピーする

・関連記事
MicrosoftがOpenAIの理事会オブザーバーを辞任、Appleもオブザーバー就任計画を撤回 - GIGAZINE

OpenAIのサム・アルトマンCEOとハフポスト創設者が新会社「Thrive AI Health」を設立、超パーソナライズされたヘルスコーチAI提供へ - GIGAZINE

OpenAIが中国からのアクセスを制限した後もMicrosoft Azure経由でOpenAIのAIモデルを利用可能な状態が続く - GIGAZINE

GPT-3.5ベースのChatGPTのコーディング能力は「古い問題には有効も新しい問題では困難に直面する」ことが明らかに - GIGAZINE

「AIのトレーニングにかかるコストはわずか3年で1000億ドルに上昇するかもしれない」とAnthropicのCEOが予想 - GIGAZINE

AIはバブルなのか? - GIGAZINE

in ソフトウェア, Posted by log1i_yk

You can read the machine translated English article here.