ネットサービス

OpenAIが「GPT-3.5 Turbo」のファインチューニング機能をリリース、用途に合わせた独自のカスタマイズが可能に


対話型AIのChatGPTを開発したOpenAIが、2023年3月にリリースしたGPTモデルファミリー「GPT-3.5 Turbo」のファインチューニング(微調整)機能を発表しました。GPT-3.5 Turboをファインチューニングすることにより、「出力する言語を固定する」「応答の言葉遣いをブランドや企業のイメージに沿ったものにする」など、ユーザーの用途に合わせたカスタマイズが可能になるとのことです。

GPT-3.5 Turbo fine-tuning and API updates
https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates


OpenAI brings fine-tuning to GPT-3.5 Turbo | TechCrunch
https://techcrunch.com/2023/08/22/openai-brings-fine-tuning-to-gpt-3-5-turbo/

OpenAI opens GPT-3.5 Turbo up for custom tuning - The Verge
https://www.theverge.com/2023/8/22/23842042/openai-gpt-3-5-turbo-fine-tuning-enterprise-business-custom-chatbot-ai-artificial-intelligence

機械学習におけるファインチューニングとは、トレーニング済みモデルを新たなデータセットを用いて再トレーニングすることで、細かいタスクに適したパラメーターへ微調整することを指します。大規模言語モデルをファインチューニングすることで、企業や開発者は特定のタスクに適したモデルを作成し、ユーザーに対してユニークかつ差別化されたエクスペリエンスを提供できます。


新たにOpenAIは2023年8月22日のブログで、GPT-3.5 Turboのファインチューニングが可能になったことを発表し、GPT-4のファインチューニング機能も2023年秋にリリース予定であると報告しました。

OpenAIによると、GPT-3.5 Turboをファインチューニングしたバージョンは、特定のタスクでベーシックなGPT-4に匹敵するか、それを上回る性能を発揮する可能性が示されているとのこと。また、ファインチューニングのために送受信されるデータが、OpenAIやその他の組織によって利用されることはないと説明しています。


すでにプライベートベータ版ではGPT-3.5 Turboのファインチューニング機能が提供されているそうで、以下のような一般的なユースケースでGPT-3.5 Turboのパフォーマンスを大幅に向上させられたとOpenAIは述べています。

・操作性の向上
ファインチューニングによって、企業は「簡潔に答える」「特定の言語で応答する」といった指示に対し、モデルがより適切に従うようにすることができます。たとえば、開発者はファインチューニングを利用して、「常にドイツ語で答える」といった指示に対してモデルが常にドイツ語で答えるようにすることが可能だそうです。

・信頼性の高い出力フォーマット
モデルが常に一定の書式に従って応答するようにしたい場合も、ファインチューニングが役立ちます。これはコードの補完やAPI呼び出しの作成、JSONスニペットへの変換といった、特定の応答形式が必要なアプリケーションにとって重要です。

・カスタムトーン
ファインチューニングはモデルが出力する文章の質感を洗練させる上で優れた方法であり、GPT-3.5 Turboがブランドイメージに沿った口調を崩さないように調整することができます。


OpenAIによると、ファインチューニングはパフォーマンスを向上させるだけでなく、パフォーマンスを維持しつつ入力プロンプトを短縮することも可能だとのこと。初期のテスターはプロンプトのサイズを最大90%減少させ、API呼び出しを高速化すると共にコストを削減することができたとOpenAIは述べています。

記事作成時点では、ファインチューニングには「データの準備」「ファイルのアップロード」「ファインチューニングジョブの作成」といった手順が必要です。OpenAIは近いうちに、進行中のファインチューニングジョブや完成モデルのスナップショットなどへのアクセスを容易にするUIをリリース予定だとしています。なお、ファインチューニングを行ってもデフォルトモデルの安全機能を維持するため、ファインチューニング用のデータはモデレーションAPIおよびGPT-4搭載のモデレーションシステムを経由し、安全でないトレーニングデータの検出が行われるとのこと。


ファインチューニングのコストはトレーニングで1000トークンあたり0.008ドル(約1.16円)、入力で1000トークンあたり0.012ドル(約1.75円)、出力で1000トークンあたり0.016ドル(約2.33円)となっています。10万トークン(約7万5000語)のトレーニングファイルを使用したGPT-3.5 Turboのファインチューニングには、約2.4ドル(約350円)のコストがかかると推定されています。

この記事のタイトルとURLをコピーする

・関連記事
「GPT-4の改良」「コストの削減」などOpenAIがAPIの大幅アップデートを発表、GPT-4を利用できる人数の増加にも意欲的 - GIGAZINE

無料でノートPCでも実行可能な70億パラメータのチャットボット「GPT4ALL」発表 - GIGAZINE

Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6%をたたき出す「phi-1」を発表 - GIGAZINE

OpenAIがGPT-4などAI最新モデルを月額350万円~2000万円超で使える「Foundry」開始 - GIGAZINE

独自のデータセットでGPTのような大規模言語モデルを簡単にファインチューニングできるライブラリ「Lit-Parrot」をGoogle Cloud Platformで使ってみた - GIGAZINE

Stability AIがChatGPTと同等の性能を持つオープンソースの大規模言語モデル「FreeWilly」を公開 - GIGAZINE

OpenAIが「GPT-4」を一般公開し誰でも利用可能に、ChatGPT内でコードを実行する機能も正式リリース - GIGAZINE

「GPT-4」発表、司法試験上位10%&日本語でもめちゃくちゃ高性能&画像処理もプログラミングも可能で「初代iPhoneと同等の衝撃」とも評される - GIGAZINE

「自動ムービー編集」「ゲーム開発」「文章校正」「論文要約」などGPT-4がわずか3週間で生み出した14の画期的ツール - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by log1h_ik

You can read the machine translated English article here.