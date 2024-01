「A fox dressed in suit dancing in park(公園で踊るスーツ姿のキツネ)」というプロンプトで比較するとこんな感じでした。

MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation https://magicvideov2.github.io/ MagicVideo-V2は、ByteDanceの研究チームが開発したテキストから動画を生成するAIです。基本的な構造は以下のようになっており、まずは入力されたテキストに基づいて「T2I(Text to Image)」モジュールで1024×1024ピクセルの画像を生成します。続いて「I2V(Image to Video)」モジュールで、静止画像から連続して動画になる600×600ピクセルの画像を32枚生成し、さらに「V2V(Video to Video)」モジュールで1048×1048ピクセルの解像度に拡張するとのこと。最後に「Interpolation(内挿)」モジュールでシーケンスを94フレームに拡張すると説明されています。

2024年01月18日 09時00分00秒 in ソフトウェア, ネットサービス, 動画, Posted by log1h_ik

