テキスト・画像・動画から3Dワールドを生成するマルチモーダルワールドモデル「Marble」が一般公開される



現地時間の2025年11月12日、スタンフォード人工知能研究所で所長を務めたコンピューターサイエンスの権威であるフェイフェイ・リ氏らが立ち上げたAI企業のWorld Labsが、独自のマルチモーダルワールドモデル「Marble」を発表しました。



空間知能はAIの新たなフロンティアで、その潜在能力を最大限に発揮するには強力なワールドモデルが不可欠です。ワールドモデルでは、3Dワールドを再構築・生成・シミュレートし、人間とエージェントの両方がそれらとインタラクションできるようにする必要があります。「空間知能を備えたワールドモデルは、今後数年間で幅広い業界に変革をもたらすことになるだろう」とWorld Labsは言及しています。



World Labsは2025年9月に、画像やテキストから3Dワールドを作成することができるワールドモデル「Marble」のプレビューを公開しました。それ以来、Marbleはベータ版の初期ユーザーに提供され、ユーザーは独自の3Dワールドを作成しています。





現地時間の2025年11月12日、そんなMarbleを誰でも利用できるように一般公開すると、World Labsは発表しました。



一般公開に当たりMarbleは大規模マルチモーダル化を実現しており、テキスト・画像・動画・3Dレイアウトから3Dワールドを生成可能となります。Marbleではインタラクティブに3Dワールドを編集・拡張・結合することが可能で、作成した3Dワールドはガラススプラット・メッシュ・動画としてエクスポート可能。これにより、ユーザーはきめ細やかな制御で3Dワールドを作成・編集できるようになります。



World Labsはワールドモデルについて、「人間は本質的にマルチモーダルであり、視覚・聴覚・触覚・言語などを統合して世界に対するメンタルモデルを構築します。これらの異なる表現は相互に作用し、豊かになり、強化し合うことで、私たち人間が世界を理解し、その中で行動することを可能とします。ワールドモデルも同様に動作するはずで、大規模マルチモーダルで利用可能なあらゆる入力信号を完全な3Dワールドに取り込むことが可能となり、新しい情報が利用可能となるにつれ、世界に対する理解を反復的に更新できる必要があります。Marbleはこのビジョンの実現に向けて大きく前進した、次世代のワールドモデルとして類をみない存在です。多様な入力タイプから3Dワールドを構築できるようになり、ユーザーは3Dワールドを反復的に編集したり拡張したりできるようになりました。Marbleの新機能により、生成したワールドを思いのままにコントロールできるようになり、シンプルな画像やテキストプロンプトから完全な3Dワールドを素早く作成したり、2Dと3Dの両方でインタラクティブに編集したりと、頭の中にあるイメージを現実のものにすることができます」と説明しています。





さらに、World LabsはクリエイティブハブのMarble Labsを開設しました。アーティスト、エンジニア、デザイナーがワールドモデルの限界に挑戦し、大胆なアイデア、現実世界のワークフロー、そしてゲーム、VFX、デザイン、ロボティクスなど、様々な分野における新たな可能性を披露することができるプラットフォームです。Marble Labsには詳細なケーススタディ、チュートリアル、ドキュメントも掲載されており、誰でも独自の3Dワールドを学習・構築共有することができます。



Marble Labsには以下からアクセス可能です。



Marble Labs | World Labs

https://www.worldlabs.ai/labs





これに加えて、World LabsはMarbleに3Dワールドを直接編集するAIネイティブツールの「Chisel」も発表しました。Chiselは上級ユーザーが3Dワールドを作成するための新しい実験的な編集モードで、ボックスや平面などの粗い3Dシェイプを使用したり、既存の3Dアセットをシーンにインポートしたりすることで、3Dワールドの大まかな構造を3Dでレイアウトできるようになります。



Chiselでは大まかな3Dシーンをレイアウトした後、シーンのビジュアルスタイルを説明するテキストプロンプトや、大まかなレイアウトには存在しない追加要素を追加できます。Marbleはこれらの入力を組み合わせることで、完全に詳細な3Dワールドを作成できます。



さらに、Marbleで生成できる3Dワールドが拡張され、これまでよりも広い3Dワールドを生成できるようになりました。また、3Dワールド同士を合成するコンポーザーモードも登場しており、これまでよりも広大な3Dワールドを自由に構築可能都なっています。





Marbleのエクスポート形式のひとつであるガラススプラットは、3Dシーンを半透明のパーティクルの大きな集合として表現するもので、THREE.jsに統合されたオープンソースのクロスプラットフォームレンダラーであるSparkを使用することで、ブラウザ上でレンダリングすることも可能です。



Marbleで生成できる3Dワールドがどんなものになるのかは、以下の動画を再生するとよくわかります。



