ソフトウェア

OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応


OpenAIが2024年7月18日に、コスト効率に優れた小型モデルの「GPT-4o mini」を発表しました。低コストでありながら、一部のベンチマークでGPT-4を上回るスコアを示したGPT-4o miniは、GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供が開始されています。

GPT-4o mini: advancing cost-efficient intelligence | OpenAI
https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

OpenAI Releases GPT-4o Mini, a Cheaper Version of Flagship AI Model - Bloomberg
https://www.bloomberg.com/news/articles/2024-07-18/openai-releases-gpt-4o-mini-a-cheaper-version-of-flagship-ai-model

OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT | Ars Technica
https://arstechnica.com/information-technology/2024/07/openai-launches-gpt-4o-mini-which-will-replace-gpt-3-5-in-chatgpt/

OpenAIが発表したGPT-4o miniは、言語モデルのマルチタスクの言語理解を測定するベンチマークの「MMLU」で82%のスコアを獲得し、LMSYSのリーダーボードでもGPT-4を上回る評価を得たモデルです。

各ベンチマークの結果は以下のとおり。GPT-4o miniは、GPT-4oには及ばないものの、ほとんどのベンチマークでGPT-3.5 TurboやGoogleの軽量モデル「Gemini Flash」、Anthropicの小型モデル「Claude Haiku」を上回る成績を収めました。


優れたパフォーマンスを示しながらも低コストで、入力トークン100万当たりの費用は15セント(約23円)、出力トークン100万当たりでは60セント(約100円)しかかからず、GPT-3.5 Turboより60%以上も安価です。


GPT-4o miniの入力コンテキストウィンドウのサイズは12万8000トークンで、リクエストごとに最大1万6000の出力トークンをサポートし、2023年10月までの知識を備えています。


コスト以外に特筆すべき点は、OpenAIが開発した安全対策技術である「命令階層(instruction hierarchy)」を組み込んだ同社初のAIモデルになるという点です。指示に優先順位をつけるこの技術により、AIモデルはプロンプトインジェクション攻撃やジェイルブレイクなどの影響をより受けにくくなります。

既に、GPT-4o miniはAPI経由での画像入力に対応しており、OpenAIは将来的にテキスト、画像、映像、音声の入出力もサポートする予定としています。

Free、Plus、TeamプランのChatGPTユーザーは、GPT-3.5の代わりにGPT-4o miniを使うことができます。また、近日中にEnterpriseユーザーもGPT-4o miniにアクセスできるようになるとのこと。


OpenAIのAPI製品責任者であるオリヴィエ・ゴードマン氏は、「最先端技術を実現し、最もパワフルで有用なアプリケーションを構築するという我々のミッションのため、今後も最先端モデルの開発を続けて限界を押し広げていきたいと思いますが、私たちは最高の小型モデルも提供していきたいと考えています」と話しました。

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが「正確かつ分かりやすい文章を出力するAI」の開発手法を公開 - GIGAZINE

OpenAIが「大規模言語モデルが人間の知能にどれだけ近づいたか」を評価する基準を作成 - GIGAZINE

ChatGPTのミスを見つけるためのGPT-4ベースのモデル「CriticGPT」が開発される - GIGAZINE

GPT-4oはどのように画像をエンコードしてトークンに分解しているのか? - GIGAZINE

OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表 - GIGAZINE

in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.