Googleが最大4Kの動画を生成できるAI「Veo 2」を発表、人間による評価でOpenAIのSoraを上回る
Googleが2024年12月16日に動画生成AIの「Veo 2」を発表しました。最大4Kまでの解像度の動画を作成できるほか、実写風動画以外にアニメ調の動画を作成可能で、カメラに対する指示も忠実に反映できると述べられています。
Veo 2 - Google DeepMind
https://deepmind.google/technologies/veo/veo-2/
Updates to Veo, Imagen and VideoFX, plus introducing Whisk in Google Labs
https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥
— Google DeepMind (@GoogleDeepMind) 2024年12月16日
We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
Introducing Veo 2, our new, state-of-the-art video model (with better understanding of real-world physics & movement, up to 4K resolution). You can join the waitlist on VideoFX. Our new and improved Imagen 3 model also achieves SOTA results, and is coming today to 100+ countries… pic.twitter.com/FtwNKyicEc
— Sundar Pichai (@sundarpichai) 2024年12月16日
2024年5月にGoogleは動画生成AIとして「Veo」を発表していました。前バージョンであるVeoで作成できる動画の解像度は1080pまででしたが、Veo 2では4K解像度に対応。リアリティなど品質も向上しています。
自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表 - GIGAZINE
公式の作例はこんな感じ。被写界深度を適切に理解し、背景をぼかして顔にフォーカスを当てた動画を作成できています。
Veo demo | Cartoon girl - YouTube
ホットケーキに蜂蜜をかける動画では、蜂蜜の動きをきれいに生成することに成功。後半のコーヒーを注ぐシーンは本物なのかAIによる生成物なのかを見分けるのは難しそうです。
Veo demo | Pancakes - YouTube
以下の動画は養蜂家が蜂蜜を手に取るシーン。実写との区別はほとんどつきません。
Veo demo | Beehive - YouTube
人間の評価者による他の動画生成モデルとの比較結果はこんな感じ。1003個のプロンプトを元にそれぞれのAIで動画を作成し、人間が「どちらの動画が優れているか」を評価しました。比較対象は「Meta Movie Gen」「Kling v1.5」「Minimax」「Sora Turbo」の4つ。いずれとの比較でもVeo 2の方が高い評価を獲得しています。
「どちらの動画がよりプロンプトと一致しているか」という軸で評価してもVeo 2の方が高い評価を獲得しました。
Veo 2が生成する動画には目に見えない透かしであるSynthIDが含まれており、AIによる生成物かどうかを見分けられるようになっているとのこと。発表と同時にVideoFXで一部のユーザーを対象にVeo 2が利用可能になっています。今後アクセスできるユーザーの数を増やしていく予定です。
すでにXにはユーザーによる多数の作例が投稿されています。
Veo 2 imagines neurips parties in the future ;) pic.twitter.com/NqxUyU669w
— Dumitru Erhan (@doomie) 2024年12月16日
A monkey and a potato riding a bike under water surrounded by colorful fish and sharks. #veo2 pic.twitter.com/pwQi7U4BhP
— Ruben Villegas (@RubenEVillegas) 2024年12月16日
"A pair of hands skillfully slicing a ripe tomato on a wooden cutting board"#veo pic.twitter.com/VDuxnkvIa0
— Agrim Gupta (@agrimgupta92) 2024年12月16日
Capybara gymnastics ✅
— Thomas Kipf (@tkipf) 2024年12月16日
Generated with #Veo2 pic.twitter.com/nbw5euLZis
Generated with #Veo2 pic.twitter.com/cgbOpaFVpR
— Shlomi Fruchter (@shlomifruchter) 2024年12月16日
A broccoli wearing a leather jacket and carrot wearing a tank top having a steak dinner #veo2 pic.twitter.com/T4RgKjeeN1
— Ruben Villegas (@RubenEVillegas) 2024年12月16日
Veo v2 generates a meeting of animals #Veo2
— Hernan Moraldo (@hhm) 2024年12月16日
Prompt: A meeting of a lion, a bear and a giraffe, all of them wearing suits. Photorealistic, cinematic. pic.twitter.com/626pv15PSG
Google Veo 2.
— Dave Clark (@Diesol) 2024年12月16日
Prompt: A bartender making an old-fashioned cocktail.
Text2Video. Two variations. #VideoFX #Veo2 @GoogleDeepMind pic.twitter.com/QdCjazGsw1
Google is so back 🔥🔥
— AshutoshShrivastava (@ai_for_success) 2024年12月16日
They just announced Veo 2, an AI video generation model, and it’s incredible.
They’ve also updated the Imagen 3 image-generation model.
10 examples below 👇 pic.twitter.com/adP4syE0VF
the sweater frogs can moooove #veo2 pic.twitter.com/mtB5MqLl1W
— Ben Poole (@poolio) 2024年12月16日
Just got access to Veo 2 on AI Test Kitchen! Results look amazing#VideoFX #Veo2 pic.twitter.com/4rQGgWi0vQ
— Dylan Neve (@DylanNeve10) 2024年12月16日
Soccer from the future, according to Veo 2 #veo2 pic.twitter.com/9ROFtvrgMb
— Hernan Moraldo (@hhm) 2024年12月16日
"An astronaut exploring an underwater alien shipwreck."#veo2 pic.twitter.com/oTz4h03XjE
— Gabriel Barth-Maron (@gbarthmaron) 2024年12月16日
I love the synchronization of the flowers with the walk #veo2 pic.twitter.com/Kq1vDhXZwo
— Dumitru Erhan (@doomie) 2024年12月16日
The physics understanding with Veo 2 is insane.
— AP (@angrypenguinPNG) 2024年12月16日
Prompt : "A man jogging on a treadmill" https://t.co/sUXLemuVhQ pic.twitter.com/YtF7oPsFN8
・関連記事
スパコンで10の25乗年もかかる計算をわずか5分で実行できる量子チップ「Willow」をGoogleが発表 - GIGAZINE
Googleが「Gemini 2.0」を発表、高速な軽量モデルで前世代上位モデルを圧倒的に上回る性能 - GIGAZINE
人々はAIが生成した物語に本能的な嫌悪感を持っており人が書いた物語より没入できないことが判明 - GIGAZINE
テキストや画像から多用途かつ高品質な3Dアセットを自動生成できる3D生成AIモデル「TRELLIS」 - GIGAZINE
「AIは実際のところ従業員の生産性を低下させている」という指摘 - GIGAZINE
・関連コンテンツ