ソフトウェア

ChatGPTのリアルタイムビデオ機能をついにOpenAIがリリース、サンタっぽい声で応答してくれる「サンタモード」も追加


OpenAIの発表イベント「12 Days of OpenAI」の6日目である2024年12月13日に、ChatGPTの「Advanced Voice Mode」にリアルタイムビデオ機能が追加されたことをOpenAIが発表しました。この機能では、AIとリアルタイムに会話しながら「周囲の映像から状況を判断」などのタスクを実行可能です。



ChatGPT now understands real-time video, seven months after OpenAI first demoed it | TechCrunch
https://techcrunch.com/2024/12/12/chatgpt-now-understands-real-time-video-seven-months-after-openai-first-demoed-it/

You can make ChatGPT sound like Santa Claus for the holidays | TechCrunch
https://techcrunch.com/2024/12/12/you-can-make-chatgpt-sound-like-santa-claus-for-the-holidays/

以下はChatGPTでのリアルタイムビデオ機能のデモ映像です。

Santa Mode & Video in Advanced Voice—12 Days of OpenAI: Day 6 - YouTube


リアルタイムビデオ機能を開始するには、チャットバーの横にある音声アイコンをタップしてAdvanced Voice Modeを起動。


ChatGPTに対して「目の前に何があるか分かる?」と質問すると、ChatGPTは「ケトルやドリッパーなどのコーヒーを入れるためのセットが見えます。コーヒーを入れようとしているのですか?」と即座に返答。


続いて「コーヒーを入れる手順を教えて」と尋ねたところ、ChatGPTは「もちろん!まずはフィルターをドリッパーにセットします。続いて熱湯を注いでドリッパーとマグカップを暖めてください」と回答しました。


その後もChatGPTは「熱湯はそっと注ぐ」など、的確なアドバイスをユーザーに提供してくれました。


また、リアルタイムビデオ機能ではChatGPTと画面共有してアドバイスを受けることも可能。まずはAdvanced Voice Modeを起動し、三点リーダー「…」ボタンをタップ。その後、「Share Screen」をタップします。


「Screem Broadcast」画面が表示されるので「Start Broadcast」をタップ。


以下の画面が表示されれば、ChatGPTとの画面共有は完了です。


画面共有を実行した状態で、メッセージアプリを開きます。「この写真について相手に何と伝えたらいい?」とユーザーが尋ねると、ChatGPTは「こう伝えてはどうでしょう。『君のサンタの格好はクリスマスにピッタリだね!ホーホーホー!というサンタの掛け声の練習を続ければ、すぐにショッピングモールでのサンタの仕事が舞い込んでくるよ!』」と伝えました。


OpenAIによると、記事作成時点でリアルタイムビデオ機能はChatGPTの有料サブスクリプションプラン「ChatGPT Plus」「ChatGPT Team」「ChatGPT Pro」ユーザーにのみ提供されており、「ChatGPT Enterprise」「ChatGPT Edu」の加入者が利用できるようになるのは2025年1月以降とのことです。

また、OpenAIはAdvanced Voice Modeの音声プリセットに「サンタモード」を追加したことを発表しました。

OpenAIによるデモでは「クリスマスでお気に入りの伝統行事は?」とユーザーが尋ねると、「サンタモード」のChatGPTは「すてきな質問だね!最もお気に入りの行事は、子どもたちが暖炉のそばに靴下を吊るすことだよ!」とまるでサンタクロースのように回答しています。


「この人についてどう思う?」と尋ねられたChatGPTは「とても素晴らしい口ひげだね!」と語りました。


OpenAIによると、サンタモードは2024年12月13日以降、Advanced Voice Modeが利用できるすべてのユーザーに展開されるとのこと。また、サンタとのチャットはチャット履歴に保存されないそうです。

この記事のタイトルとURLをコピーする

・関連記事
ついにSiriからChatGPTを使用可能に、Apple IntelligenceとChatGPTの統合で - GIGAZINE

OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能 - GIGAZINE

OpenAIが12日間にわたって新発表を続けることを告知 - GIGAZINE

OpenAIが最高のモデルを無制限に使える新規プラン「ChatGPT Pro」をリリース、o1モデルの正式版も登場 - GIGAZINE

OpenAIが動画生成AI「Sora」を正式にリリース、ChatGPT Plus・Proプランで利用可能 - GIGAZINE

in ソフトウェア,   ウェブアプリ,   動画, Posted by log1r_ut

You can read the machine translated English article here.