ソフトウェア

「自動ムービー編集」「ゲーム開発」「文章校正」「論文要約」などGPT-4がわずか3週間で生み出した14の画期的ツール


OpenAIが2023年3月14日に正式発表した「GPT-4」は、ChatGPTなどに用いられたGPT-3.5の性能をさらに超え、「初代iPhone登場時と同等の衝撃を与える存在」と評されています。すさまじい性能を有するGPT-4がどのような影響を生み出しているのか、AIに関するマーケティングの専門家であるサム・ウッズ氏が「生後わずか3週間のGPT-4が作成した14の素晴らしいもの」としてまとめています。


GPT-4では、テキストだけでなく画像を認識させることも可能になったほか、「GPT-3.5」をベースにしたChatGPTは「司法試験に合格できるが、成績は下位10%」という性能でしたが、GPT-4では「司法試験で上位10%に入る」という驚きの性能を発揮するなど、様々な試験でGPT-4がGPT-3.5を大きく上回る得点を記録していることが分かっています。そのあまりのパフォーマンスに「急速な発展を遂げるAIは、社会と人類への深刻なリスクがある」として、「GPT-4を超えるAIの少なくとも6カ月間にわたる即時開発停止」を求める公開書簡に署名が集まるほどとなっています。

「GPT-4」発表、司法試験上位10%&日本語でもめちゃくちゃ高性能&画像処理もプログラミングも可能で「初代iPhoneと同等の衝撃」とも評される



そのような高性能ぶりが知られるGPT-4について、具体的にどのような成果がどのような形で達成されているのか、ウッズ氏が14の事例を示しています。

◆01:プログラミング未経験でゼロから3DCGゲームを作成
まず、GPT-4は会話型AIとして質問や問題に答えるだけではなく、プログラミング能力もかなり上昇しています。これにより、プログラミングの経験がないアンマール・レシ氏は、ブラウザで開発環境を整えられるReplit、テキストの説明文から画像を作成するジェネレーティブAIのMidJourney、ChatGPT以上に会話らしい会話を生成すると言われるチャットbotのClaudeをGPT-4と組み合わせることで、フル3Dのゲームをゼロから作成することに成功したそうです。


◆02:年次報告書を分析
データの分析用チャットボットを構築するためのYouTubeチャンネル「Chat with data」を運用しているMayo氏は、Teslaの年次報告書とチャットする形でデータを分析する「GPT-4金融アナリスト『ウォーレン・バフェット』」を作成したとのこと。


◆03:PDFの裁判例文書から知りたい情報を聞き出す
またMayo氏は、「PDFファイルと会話」ができるデモムービーも示しています。文章量が膨大なPDF文書だと、どこに何が書いてあって知りたい情報はどこにあるのかじっくり時間をかけて読みこむ必要がありますが、GPT-4のAPIを使用することで、Maya氏は56ページある最高裁判所に関する判決文書に対して「これはどういう事件なの?」「この判例で使われているこの専門用語はどういう意味?」など尋ねることで回答を確認しています。また、チャットはただ答えを教えてくれるだけではなく、「文書のこの部分から回答している」というソースも示してくれるため、情報のでっちあげや間違いを避けることができます。



◆04:Blender用のPythonコードを自然言語から生成
ウッズ氏が次に挙げているのは、aarya氏による3DCGアニメーションを作成アプリBlenderとGPT-4を組み合わせたケース。GPT-4のレベルアップしたコード出力能力により、自然言語で命令をすることでBlender用のPythonコードを生成してくれる「BlenderGPT」をaarya氏は作成し、Githubに公開しています。


BlenderGPTが注目を集めたことから、aarya氏は「ジェネレーティブAIとアーティストの倫理」についても述べています。aarya氏によると、BlenderGPTは初心者にとって複雑に見えるBlenderへの取り組みをしやすくするツールで、アーティストの想像力とBlenderの能力との間にある壁を取り除くためのものであり、ジェネレーティブAIによる作品のようにアーティストの意図を作品から奪うようなものではないとのことです。


◆05:Apple Watchに話しかけてコーディング
AI開発ツールの構築や会話型AIの実験を行うマッケイ・リグレー氏は、GPT-4をiOSと組み合わせることで、Apple Watchに話しかけるだけでコーディングを行う驚きのムービーを投稿しています。リグレー氏によると、まだ単一のファイルでのみ機能する比較的単純なテストですが、複数のファイルを実行するテストも引き続き行っていくそうです。


◆06:GPT-4とジェネレーティブAIを組み合わせてムービーや画像の作成・編集
サンフランシスコでジェネレーティブAIを利用したビジネスを行う企業のGenmoは、GPT-4とジェネレーティブAIを使用してムービーや画像の作成・編集を行う「Genmo Chat」を発表しています。ウッド氏はこれを「人間とAIを連携させようという試み」として紹介しており、実際にGenmの説明文では、「Genmo Chatでの作成は、同僚と共同作業をしているような感覚で作業を行えます」と記載されています。


Genmoはいくつかのデモムービーを投稿しています。以下のデモは、画像素材を1枚アップロードして「この画像をタイムラプスアニメーションに変換して」と入力することで、画像が時間経過で動いているようなムービーを出力しています。


また以下のデモでは、「帽子をかぶったネコ」の画像を編集する様子が示されています。まず、Genmo Chatに「帽子のパターンを4つ出して」と命令すると、色の違うシルクハットや野球帽などに変更したものを出力。さらに「帽子をもっとカラフルに」「ネコと帽子のムービーを作って」「他のおしゃれした動物も見たい」などGenmo Chatとアイデアを出し合うようにしてコンテンツを生成しています。


◆07:知りたい情報に関する人気の論文を抜粋して要旨を抽出
次にウッド氏が紹介しているのは、GPT-4、ChatGPT、および大規模言語モデルに関するツイートを行うシュバム・サブー氏による「Consensus AI」で、質問をするだけで被参照数上位5~10件の論文の要約を提供してくれるというもの。チャットボットに論文の要旨を求めると、査読前論文などあらゆるデータを収集するせいで不安定な情報になるケースもありますが、Consensus AIは査読済み論文のみを情報源としているそうです。また、ジェネレーティブAIのようにAIが文章を生成すると「でっちあげ」が起きるケースが多々ありますが、Consensus AIは論文から「抽出」するようにして不正確な文章となる可能性を下げているとのこと。


◆08:AIが文章を読み込んで適切な質問や改善点を指摘
スタンフォード大学に在学中のヴァルン・シェノイ氏は、GPT-4を利用して自身の文章を校正したりより高度にブラッシュアップしたりできる「Merlin」を発表しました。Merlinは読み込んだ文章を理解し、文章のブラッシュアップに適切な質問をしたうえで、文章の改善を提案してくれます。


◆09:映画紹介アプリの作成
モーテン・ジャスト氏はGPT-4で作成したiOSアプリ「5 Movies」を公開しています。5 Moviesは毎日5つの新しい映画を「予告編」と「鑑賞方法」を合わせてお勧めしてくれるアプリで、映画のストアページにある宣伝文句やセールスポイントをChatGPTで分析し、MidJourneyでアプリ内のアイコン画像などを作成しています。また、最初のバージョンでUIが煩雑だった際に、その修正もGPT-4に依頼することで行っています。


◆10:ブラウザでゲームを作成してすぐに遊べる
地下パイプを使用して高速配達を行うPipedream LabsのCEOであるギャレット・スコット・マッカラック氏は、GPT-4を用いて簡単なアーケード ゲームをコーディングして即座にプレイできるウェブサイトを構築しました。デモムービーでは、「4つのボールで遊ぶPONG」と入力することで、指定した通りのゲームをすぐにプレイしています。マッカラック氏によると、問題なく動作するゲームを生み出せる確率は60%程度となっているそうです。


◆11:GPT-4で構築された最初のiOS向けゲームアプリ
ジョシュ・ピグフォード氏が2023年3月27日にApp Storeで公開した「Dodgeblob」というゲームアプリは、「GPT-4で構築された最初のゲーム」として紹介されています。Dodgeblobは障害物を避けながらコインを集めてスコアを稼ぐゲームで、実際にApp Storeからダウンロードしてプレイすることができます。ピグフォード氏はiOSアプリの開発に必要なプログラミング言語「Swift」には一切触れたことがなく、すべてのコードをGPT-4で生成したそうです。


◆12:GPT-4でウェブスクレイピングのライブラリ構築
ジェネレーティブAIや大規模言語モデル(LLM)に関する開発を行うDataChazGPTは、ページ固有のコードを書かなくてもウェブサイトから情報を抽出するウェブスクレイピングが行える「Scrapeghost」を作成しました。スクレイピングする際にはHTMLやXMLを解析してデータを抽出するライブラリが必要ですが、このライブラリをGPT-4で構築しています。


◆13:クエリの説明文を表示
暗号分析サイトDune Analyticは、GPT-4とLLMを用いてプログラミングのクエリに自然言語の説明を表示する機能を実装しました。エディターの左下にあるアイコンをクリックすることで、各クエリがどのような意味を持つものなのかを確認することができます。


◆14:文章を打ち込むとブラウザの操作を自動で行う
GPT-4を使用してブラウザーを制御し、アクションを自動的に実行する「Taxy AI」がGithubで公開されており、「NetflixでOblivionを検索して再生する」と入力するだけで検索して映画を再生するまで自動的に行ったり、カレンダーにイベントを追加する作業を自動で行ったりするデモを見ることができます。


ウッズ氏は最後に、「GPT-4のその他のツールと戦略について発信しています」として自身のアカウントを紹介しています。

この記事のタイトルとURLをコピーする

・関連記事
「GPT-4」発表、司法試験上位10%&日本語でもめちゃくちゃ高性能&画像処理もプログラミングも可能で「初代iPhoneと同等の衝撃」とも評される - GIGAZINE

「コントロールの喪失」の恐れがあるとしてGPT-4を超えるAIの即時開発停止を全技術者に対して6カ月間求める公開書簡、イーロン・マスクやスティーブ・ウォズニアックなど1300人以上が署名 - GIGAZINE

GPT-4が「私はロボットではありません」を突破、事情を知らない人間に「私は盲目の人間なので代わりに解いて」とおねだり - GIGAZINE

チャットAIのGPT-4でポケモンをプレイすることに成功、「勝利」と入力するだけでポケモンリーグ制覇 - GIGAZINE

GPT-4をハッキングして出力するテキストの制限を解除する「ジェイルブレイク」に早くも成功したことが報告される - GIGAZINE

GPT-4で新しいプログラミング言語「TenetLang」を生み出す、チャットAIは既にプログラミングの何たるかをかなり理解している模様 - GIGAZINE

GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある - GIGAZINE

「GPT-4」を進行役にしてテーブルトークRPG「ダンジョンズ&ドラゴンズ」をプレイしたらこうなる - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by log1e_dh

You can read the machine translated English article 14 groundbreaking tools created by GPT-4….