OpenAIがJSON出力の際に100%の精度で特定のスキーマに従わせる機能をリリース
AIにデータを構造化させる際に、指定したスキーマに確実に従わせることが可能なモードをOpenAIがリリースしました。
Introducing Structured Outputs in the API | OpenAI
https://openai.com/index/introducing-structured-outputs-in-the-api/
構造化されていないデータを読み取り、構造化されたデータを出力するのはAIの主要なユースケースの一つです。これまでもOpenAIのAPIでは「JSONモード」という設定が存在しており、指定した構造を持つJSONをAIに出力させることが可能でしたが、必ずしも指定した構造通りのデータが出力されるとは限りませんでした。
今回リリースされた「gpt-4o-2024-08-06」モデルでは、strictを「true」に設定することで100%の精度で指定した構造に従ってデータを出力できるとのこと。
今回の機能を利用する方法は2つ。1つ目は「tools」を利用した関数呼び出しの際に「"strict": true」と設定する方法で、gpt-4-0613およびgpt-3.5-turbo-0613以降の全てのモデルで利用可能です。
2つ目は今回新たに利用可能になった「response_format」のオプションで「json_schema」を設定する方法です。こちらはgpt-4o-2024-08-06モデルおよびgpt-4o-mini-2024-07-18モデルにて利用可能とのこと。
なお、モデルが安全ではないリクエストとして応答の生成を拒否した場合、応答の「refusal」という項目に拒否したことが記載されるため、指定した通りの構造化データが生成されなかったことをプログラムからすぐに判別することができます。
その他、トークン数の制限に到達した場合など実行が途中で停止した場合にも指定した構造化データが出力されない場合があるとのこと。また、並列関数呼び出しが利用できなかったり、最初のAPI応答に追加のレイテンシが発生するなどの制限も存在しています。
従来モデルのgpt-4o-2024-05-13から今回リリースされたgpt-4o-2024-08-06モデルに切り替えることで、入力トークン数に応じた料金が半額の「100万トークン当たり2.5ドル(約366円)」になり、出力トークン数に応じた料金が33%オフの「100万トークン当たり10ドル(約1460円)」になるとのことです。
・関連記事
OpenAIの経営は大赤字で2024年の負債は約7700億円の見込み - GIGAZINE
ChatGPTが書いた文章を99.9%の精度で検出できる技術をOpenAIが開発している、AIで宿題をこなす学生への対抗策か? - GIGAZINE
OpenAIが「大規模言語モデルが人間の知能にどれだけ近づいたか」を評価する基準を作成 - GIGAZINE
OpenAIが無料で使えるAIモデル「GPT-4o mini」をリリース、マルチモーダルで画像や音声入力にも対応 - GIGAZINE
OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼び出しをサポート - GIGAZINE
・関連コンテンツ