字節跳動(バイトダンス)の次世代AI動画生成モデル「Seedance2.0」のベータ版が先ごろリリースされた。マルチモダリティを同時に受け入れ、それらを相互に作用させることができるクリエートスタイルや内蔵されたムービングショット機能の完成度などが世界的に注目を集めている。
海外のプロクリエーターが同モデルを使って制作したビデオクリップがたちまち注目を集めた。動画を見ると、男性が人混みをかき分けながら猛スピードで走り、路上で果物を売っている露店に衝突。オレンジが道の上に散らばる。そして、一瞬スローモーションになった後、男性は起き上がって、再びダッシュで逃げ始める。コメント欄には「ちょっと待って。どこからAIで作ったの?」といった完成度の高さに驚く声がたくさん寄せられている。
現時点で、「Seedance2.0」のベータ版は、中国の一部のアプリなどだけに導入することができ、まだ使うことができない海外のクリエーターは「待ちきれない」と言わんばかりに、中国のAIクリエーターが公開しているレビュー動画をシェアし始めている。アニメのストーリーボードを使って生成したアクション映画のシーンにしても、テキスト入力だけで生成した複数のシーンからなる動画にしても、「Seedance2.0」は完成度の高い動画を生成することができるため、多くの海外のクリエーターが「ワンクリックで映画が生成できる日もそう遠くないのかもしれない」と感慨深げなコメントを寄せている。
中国のクリエーターも同モデルのパフォーマンスに驚きの声を上げている。「黒神話:悟空(BlackMyth:Wukong)」を開発した遊戯科学(ゲームサイエンス)の馮驥(フォン・ジー)CEO(最高経営責任者)は、試用後、「『Seedance2.0』は現時点で、世界トップレベルの動画生成モデル。
モデルの能力が飛躍的に高まる中、「Seedance2.0」ではコンテンツのセキュリティーの面でも積極的な模索が行われている。ユーザーはデジタルヒューマン生成ツール「即夢AI(DreamAvatar)」や大規模言語モデル「豆包(Doubao)」を通して「Seedance2.0」を利用する場合、まず録音と録画が必要で、人による認証を経て、自分のキャラクターを生成し、AIのショート動画に登場できるようになる。
ベータ版の紹介文によると、「Seedance2.0」には、「Dual-branchDiffusionTransformer(デュアルブランチ・ディフュージョン・トランスフォーマー)」アーキテクチャが搭載されており、ユーザーはテキストプロンプトを入力するかリファレンス画像をアップするだけで、オリジナルサウンドトラック付きのさまざまなシーンからなる動画コンテンツを生成することができる。最も画期的なのは「単一のタスクで連続する複数のシーンを生成する能力」で、AIはエピソードのロジックを自動で解析し、連続するシーンからなる動画を生成できるほか、キャラクターや明るさ、スタイル、雰囲気などを高度に一致させることができ、「ポストプロセス」がほぼ「ゼロ」の動画を完成させることができる。そのため、これまでのAI動画ツールの断片化されたビデオクリップしか生成できないという限界を超え、プロフェッショナルな動画制作のハードルやコストを大幅に下げている。(提供/人民網日本語版・編集/KN)











