ソフトウェア

3Dモデル生成AI「Point-E」をOpenAIがオープンソース化して誰でもダウンロード可能に、これまでの600倍高速にプロンプトから3Dオブジェクトを生成して表示可能


画像生成AI「DALL-E 2」やテキスト生成AI「GPT-3」、対話AI「ChatGPT」を開発する研究団体のOpenAIが、テキストから3Dオブジェクトを生成するAI「Point-E」をオープンソース化し、ソースコードをGitHubで公開しました。

GitHub - openai/point-e: Point cloud diffusion for 3D model synthesis
https://github.com/openai/point-e

[2212.08751] Point-E: A System for Generating 3D Point Clouds from Complex Prompts
https://arxiv.org/abs/2212.08751

Point-Eは主に「テキストから画像を生成するモデル」「画像から点群データを生成するモデル」の2つで構成されています。テキストから画像を生成するモデルは、Stable DiffusionやOpenAI開発のDALL-E 2などの画像生成AIと同じように、ラベル付き画像のデータセットでテキストと視覚的概念の関連付けを理解したモデルです。


そして、「画像から点群データを生成するモデル」は、3Dオブジェクトとセットになった画像のデータセットから、両者の効果的な変換を学習したモデルです。以下は実際に画像(左)から点群データ(右)を生成したところ。


Point-Eが生成する3Dオブジェクトはポリゴンを組み合わせたものではなく、「空間上のデータ点の離散的な集合」、すなわち粒子をギュッと固めたような点群データで生成されます。そのため、Point-Eには「点群データをポリゴンメッシュに変換するモデル」も含まれています。


そして、Point-Eには点群からポリゴンメッシュに変換するAIも含まれています。点群のモデルはポリゴンメッシュよりも高速に生成できるため、3Dオブジェクトの生成が従来の600倍以上も高速化しているとのこと。これまでNVIDIA V100で何時間もかかっていた計算がわずか1~2分で済むようになっているのがPoint-Eの大きな利点です。

OpenAI just dropped a prototype of 3D DALLE (called “Point-E”) ????. It isn’t as good as Google’s DreamFusion, but blazing fast! Like ~600x faster to generate ????. 2D DALLE has already turned the creative world upside down. How will 3D DALLE disrupt games, VR, metaverse, …? ???? pic.twitter.com/Vlibnav9Jc

— Jim Fan (@DrJimFan)


ただし、物体の細かい形状や質感を捉えることができないというデメリットがあり、形状の一部分がどうしてもブロック状になったり歪んでしまったりすることもあるとのこと。以下は実際に画像から点群データの生成に失敗してしまった例。


Point-Eのうち、テキストから点群データを生成する部分はオンラインAIプラットフォームのHugging Faceで体験することが可能。ただし、記事作成時点では処理の順番待ちが長いために、デモで用意されているキーワードの生成にかなりの長時間を必要とする状態です。

Point E - a Hugging Face Space by openai
https://huggingface.co/spaces/openai/point-e

実際にデモで「a red motorcycle(赤いバイク)」と入力して生成した3Dオブジェクトを、以下のツイートで見ることができます。

OpenAI released Point-E, a text-to-3D (point clouds) demo ????

You can check out an open-source demo for it at https://t.co/ophW1YtCT3????Enjoy! The demo uses the lower-quality but much faster version of the model. pic.twitter.com/sJtlo9ASr6

— Omar Sanseviero (@osanseviero)


「Palm Tree(ヤシの木)」で生成した3Dオブジェクトはこんな感じです。

Super fun! pic.twitter.com/9FcOo8996p

— Nikolaj Stausbøl (@_staus)

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが対話AIや画像生成AIに使われる「埋め込みモデル」を刷新、性能当たりの価格が99.8%も安価に - GIGAZINE

OpenAI開発のテキスト生成AI「GPT-3」がどんな処理を行っているのかを専門家が解説 - GIGAZINE

画像生成AI「DALL・E」を開発する「OpenAI」と写真素材・ストックフォト最大手の1つ「Shutterstock」が提携し今後数か月以内に画像生成機能をユーザーに提供&学習元素材の作者に報奨金を支払う仕組みの構築へ - GIGAZINE

無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ - GIGAZINE

OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能 - GIGAZINE

OpenAIがAI画像ジェネレーター「DALL・E2」の一般向け公開がスタート - GIGAZINE

in ソフトウェア,   ネットサービス,   ウェブアプリ,   動画, Posted by log1i_yk

You can read the machine translated English article here.