中国・清華大学のAI研究グループ「TSAILラボ」はこのほど、マルチモーダルAIを手がける「生数科技(Shengshu Technology)」と共同で、動画生成を高速化するフレームワーク「TurboDiffusion」をオープンソースで公開した。動画生成AIの品質を維持したまま、生成速度を100~200倍高速化できる点が、世界のAI関係者の関心を集めている。
大規模言語モデルの性能向上に伴い、テキストや画像の生成に続いて、動画生成がコンテンツ生成の主な方向性となりつつある。しかし、現実的なボトルネックも存在する。米エヌビディアの「H100」をはじめとする高性能GPUを用いても、ショート動画の生成に数分かかってしまうため、実際の利用には限界がある。多くのクリエイターは「GeForce RTX 4090」や「GeForce RTX 5090」といったコンシューマー向けGPUを利用しているが、できることはさらに限られてくる。
TurboDiffusionは、動画生成AIで主流となっているDiffusion(拡散)モデルの高速化を目的として開発されたツールで、RTX 5090を100~200倍高速化する効果がある。テキストからの動画生成(T2V)や画像からの動画生成(I2V)に対応し、高解像度・長時間の動画でも超高速で生成できる。
実測データでも高速化効果は明らかで、パラメータ数140億(14B)規模のI2Vモデルを用いて720P(1280×720画素)で5秒の動画を生成した結果、通常の処理では4549秒(約76分)を要したが、TurboDiffusionを用いると38秒で完了した。
*1元=約22円で計算しています。
(36Kr Japan編集部・茶谷弥生)








![[音声DL版]TRY! 日本語能力試験 N3 改訂版](https://m.media-amazon.com/images/I/41mXWATUVjL._SL500_.jpg)
![【Amazon.co.jp限定】ダリオ・アルジェント PANICO (ビジュアルシート2枚セット付) [Blu-ray]](https://m.media-amazon.com/images/I/41fRCrYhFTL._SL500_.jpg)

![BELIEVE 日本バスケを諦めなかった男たち 豪華版 [Blu-ray]](https://m.media-amazon.com/images/I/51Daz1hpRML._SL500_.jpg)