テキストや画像から高精度な3Dアセットを作り出すAIシステム「Hunyuan3D 2.0」をTencentがオープンソースで公開

中国の大手IT企業であるTencentが、単一の画像やテキストのプロンプトから高精度の3Dアセットを生成するAIシステム「Hunyuan3D 2.0」を発表しました。「Hunyuan3D 2.0」のソースコードは、AIプラットフォームのHugging Faceでオープンソースとして公開されています。
I am truly honored to announce that our 3D open source project has entered its 2.0 version, presenting revolutionary effects that rival those of commercial products. https://t.co/YM3GVb9BQM https://t.co/IexQULxv2U pic.twitter.com/8kJAgyCac2
— Hunyuan (@TXhunyuan) January 21, 2025
tencent/Hunyuan3D-2 · Hugging Face
https://huggingface.co/tencent/Hunyuan3D-2
Tencent introduces 'Hunyuan3D 2.0,' AI that speeds up 3D design from days to seconds | VentureBeat
https://venturebeat.com/ai/tencent-introduces-hunyuan3d-2-0-ai-that-speeds-up-3d-design-from-days-to-seconds/
「Hunyuan3D 2.0」は2024年に登場したHunyuan3D 1.0の最新バージョンであり、アセットの形状を生成する「Hunyuan3D-DiT」と、テクスチャーを合成する「Hunyuan3D-Paint」という2つの基本コンポーネントによって構成されています。
「Hunyuan3D-DiT」は拡散モデルとTranformerを組み合わせたDiffusion Transformerに基づいて構築された形状生成モデルであり、入力された画像やプロンプトに適切に合致する形状を生成します。そして「Hunyuan3D-Paint」は、生成されたメッシュまたは手動で作成されたメッシュに対して、高解像度で鮮やかなテクスチャーマップを生成するとのことです。

以下の図は、一番左の画像を入力として与え、複数の形状生成モデルで作り出した3D形状データ(ジオメトリ)を比較したもの。その他の形状生成モデルと比較して、一番右の「Hunyuan3D-DiT」が生成した3Dジオメトリはかなりクオリティが高いことがわかります。

また、以下は同じ3Dジオメトリを基にして、異なるテクスチャー合成モデルでテクスチャーを生成したもの。一番右の「Hunyuan3D-Paint」が生成したテクスチャーは、その他のモデルと比較して色合いや塗り分けが自然なことがうかがえます。

他のオープンソースやクローズドの3D生成モデルと「Hunyuan3D 2.0」のパフォーマンスを、各種ベンチマークで比較した結果が以下。「Hunyuan3D 2.0」は客観的なベンチマークで高い性能を示しているとTencentは主張しています。

「Hunyuan3D 2.0」の事前学習済みモデルはHugging Faceの公式ページでダウンロードすることが可能。テクノロジー系メディアのVentureBeatは、「TencentはHugging Faceを通じて、システムのほぼすべての部分を共有しています。開発者はプロフェッショナルな環境ですぐに使えるように、このコードを使用して標準の設計ソフトウェアと連携する3Dモデルを作成可能になりました」と述べました。
・関連記事
3Dモデルを0.5秒で作れるAI「Stable Fast 3D」が登場したので使ってみた - GIGAZINE
テキストや画像から多用途かつ高品質な3Dアセットを自動生成できる3D生成AIモデル「TRELLIS」 - GIGAZINE
「画像からゲームのように視点操作可能な3Dシーンを生成するAI」をWorld Labsが発表、実際に3Dシーンを探索できるデモページも公開中 - GIGAZINE
Google DeepMindが1枚の画像からプレイ可能な3D世界を生成できるAIモデル「Genie 2」を発表 - GIGAZINE
中国IT大手TencentがNVIDIAに頼らず自社製AIインフラのAI学習能力を20%強化 - GIGAZINE
Appleが中国でのAI機能提供に向けてTencentやByteDanceと交渉中との報道 - GIGAZINE
・関連コンテンツ
in ソフトウェア, ネットサービス, Posted by log1h_ik
You can read the machine translated English article Tencent releases open source 'Hunyuan3D ….