ソフトウェア

OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼び出しをサポート


OpenAIが画像の読み取りに対応したマルチモーダルAI「GPT-4 Turbo with Vision」の一般公開を開始しました。


ドキュメントのモデルのページを確認すると、「gpt-4-turbo-2024-04-09」の導入と同時に「gpt-4-turbo」の参照先が「gpt-4-turbo-2024-04-09」に変わっている事が分かります。


今回一般公開されたGPT-4 Turbo with Visionはこれまでプレビュー版として使用することが可能でした。そうしたプレビュー版のGPT-4 Turbo with Visionを活用して作成されたアプリをOpenAIのデベロッパーXアカウントが紹介しています。

AIスタートアップのCognitionはAIエンジニアの「Devin」を開発しており、GPT-4 Turbo with Visionを使用してさまざまなコーディングタスクをこなせるようになりました。「この問題を修正して」とお願いするだけでドキュメントやコードを確認し、必要な依存関係を処理しつつコードを仕上げるというデモムービーが公開されています。


AIヘルス&フィットネスアプリを展開するHealthifyはGPT-4 Turbo with Visionを使用し、世界中の食品の写真認識を通じてユーザーに栄養に関する情報を提供する「Snap」というサービスを構築しました。


tldrawは無限に広がるキャンバス上にUIなどを描けるサービスで、GPT-4 Turbo with Visionを使用することで描いたUIを自動でコード化できるようになりました。


なお、OpenAIでプロジェクトマネージャーを務めているオーウェン・キャンベル=ムーア氏によると新しいバージョンは画像を処理できるようになっただけでなく、数学など従来の機能面でも大幅に改善されているとのことです。

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが無料版ChatGPTをアカウントなしで誰でも利用できるようにすると発表 - GIGAZINE

100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明 - GIGAZINE

OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 - GIGAZINE

OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース - GIGAZINE

OpenAIがハリウッドにムービー生成AI「Sora」を売り込んでいると報道される - GIGAZINE

in ソフトウェア, Posted by log1d_ts

You can read the machine translated English article here.