生成AIを用いた画像制作で注目を集めてきた米Midjourneyは6月18日(米国時間)、同社初の動画生成AIモデル「V1 Video Model」をリリースした。
現在、V1を用いた動画生成はWeb版のみで提供されており、画像から動画を生成する「Image-to-Video」機能が利用可能である。
ユーザーは画像をアップロードするか、Midjourneyで生成した画像を使用し、その画像に基づいて最大5秒の動画を4本生成することができる。
生成方法には「自動」と「手動」の2種類が用意されている。「自動」では、AIが画像から動きを推定して動画を自動生成する。「手動」では、ユーザーがテキストによるプロンプトを使って動きを指定できる。また、被写体やカメラの動きの強度を「ロー・モーション(Low Motion)」と「ハイ・モーション(High Motion)」の2段階から選択することができ、簡易ながらも一定のカスタマイズ性が確保されている。
さらに、生成された動画は最大4回まで、1回あたり4秒ずつ延長することが可能である。これにより、最長で21秒の動画を作成できる。
Midjourneyによると、V1の動画生成には画像生成の約8倍の処理コストがかかる。1秒の動画生成が一枚のアップスケール(高解像度化)画像生成とほぼ同じコストであり、「従来の市場価格と比べて25倍以上も安価である」と強調。CEOのデビッド・ホルツ氏は「楽しく、簡単で、美しく、そして手頃な体験となることを目指している」と述べている。
動画生成機能は、最も安価な「Basic」プラン(月額10ドル)でも利用可能であるが、ひと月あたり画像200枚分程度の生成上限が設けられている。「Pro」(月額60ドル)および「Mega」(月額120ドル)プランでは、「Relaxモード」によって生成数の制限なしに動画を作成できる。
Introducing our V1 Video Model. It's fun, easy, and beautiful. Available at 10$/month, it's the first video model for *everyone* and it's available now. pic.twitter.com/iBm0KAN8uy— Midjourney (@midjourney) June 18, 2025
OpenAIの「Sora」やRunwayの「Gen-4」、Adobeの「Firefly」、Googleの「Veo」など、AI動画生成分野の競争は激しさを増している。 Midjourneyは画像生成において、商用環境での使用を目的としたAIツールの開発に注力する競合と異なり、クリエイターやアーティストに向けた創造性重視のアプローチで差別化を図ってきた。
同社は、3D空間内を自由に移動・操作できる仮想世界の構築という壮大な構想を掲げている。この実現には、画像モデル、動画モデル、3Dモデル、そしてリアルタイムで動作する高速処理技術(リアルタイムモデル)といった複数の要素が必要となる。Video Modelはこのうち動画生成の要素を担う技術的基盤となる。
今後1年間でMidjourneyは、これらの要素を個別に開発・公開し、最終的には統合して「リアルタイムのオープンワールドシミュレーションが可能なモデル」へと昇華させる計画である。
編集部おすすめ