急速な発展が、様々な議論と話題を呼ぶ生成AI。生成AIとクリエイティブの関係は、これからどうなっていくのか。
エンターテインメントとテックが重なる領域で仕事をするAIHUB CTO・新井モノと、3DCGでの長いキャリアがあるアニメーション監督・瀬下寛之が、それぞれの立場から、その未来について対話した。

■プロフィール

瀬下寛之(せした・ひろゆき)
アニメーション監督。Studio KADAN所属。1967年生。1980年代から様々な分野のCGやVFX制作に従事。『シドニアの騎士』、『亜人』、『BLAME!』、『GODZILLA』三部作などを監督。
最新作『ルパン三世VSキャッツ・アイ』がAmazon PrimeVideo、『GAMERA -Rebirth-』『カミエラビ』がNetflixにて配信中。新海誠監督『すずめの戸締まり』ではCGキャラクター演出を担当している。

新井モノ(あらい・もの)
AIHUB株式会社 代表取締役CTO/アーティスト/エンジニア
PM/PdM/アーキテクトとして、エンタメ×Tech領域を中心に数多くの起業/プロジェクトを手掛ける。日本Linux協会、日本医師会ORCA管理機構"ORCA Project"の立ち上げに参画。AIHUB株式会社の設立以降は、生成系AI研究開発、ユースケース開発、社会実装、責任あるAIとweb3技術の融合に力を注ぐ。生成系AIのクリーンな基盤学習モデルを作るアニメチェーン構想の設立メンバー。

■AI開発のしくみと懸念すること
――瀬下監督が3DCGの世界に入ったのはいつごろになりますか。

瀬下 1987年頃ですね。専門学校の先生だったダグラス・ラーナー氏の紹介で花博(1990年開催の「国際花と緑の博覧会」)の富士通パビリオンのプロジェクトに参加しました。LLNL(ローレンス・リバモア国立研究所)のネルソン・マックス博士やIMAX社創業者のローマン・クロイター氏など錚々たる面々がリードしていたプロジェクトでアルバイトです。その後、1989年にリンクスというCG制作会社に入社して、そこでも花博の郵政共同館(郵政省・NTT・KDD共同館)の仕事をすることになりました。またか!と思いましたけど(笑)。


新井 そうですか。当時は僕はオムニバス・ジャパンの相川(潔)さんのカバン持ちをしていました。リンクスさんにもいろいろお世話になりましたね(笑)。あと、オムニバス・ジャパンやリンクスなど各社が作った合弁会社にも所属してました。

瀬下 へえ! 結構、近いところにいた感じなんですね。

新井 ただ私は3DCGからは途中で離れてしまって、OSとかオープンソースを活用した開発のほうへ進むことにしました。
それで現在はAIも含め、エンターテインメントとテックが重なるところで仕事をしています。

瀬下 ちょうど1980年代にも、AIブームがありましたよね。当時はLISP(※AI研究にも使われる高級言語)を使ったシンボリックスというワークステーションが有名で、群れの動きのシミュレーションなどで驚いた記憶があります。先進的なアイデアがたくさんあった時代でしたが、理論上は魅力があっても実用レベルでは演算時間が?万年かかるとか(笑)、マシンスペックなどの環境制限も多かったです。ですから、今や、こんなにAIが一般化する時代が到来したことにすごく興奮しているし、様々な議論も、実用が近づいたからこそのプロセスなんだと、ポジティブに捉えています。

新井 近年のAIの発展の節目は、2017年にトランスフォーマーという仕組みが登場したことです。
これはディープラーニングの手法のひとつですが、AIの歴史はこれ以前か以後かで大きく分かれます。また現在のAI開発はオープンソースコミュニティが背景にあって、論文の共有と機能の実装がものすごく早いサイクルで行われているのも、急激な発達の要因のひとつです。かつては大学や企業の研究者が論文を書き、それが査読されて学会誌に載った後、実際のプロダクトが制作される、数年のサイクルで動いていました。

現在は論文がすぐにネット上にアップされる仕組みがあり、数日後はその論文に基づいたプラグインが実装されるというペースで物事が進んでいます。いわゆる“伽藍(がらん)とバザール”ですね。石を積み上げて伽藍を作るように巨大プロジェクトを完成させるのではなく、バザールのように個人商店が集まってワイワイとやる中で新しいものが生まれてくるというのが、現在のAI開発です。


だからAIのイノベーションは、様々な才能の人に触ってもらうことができる環境整備こそ重要じゃないかとよくいわれています。そういうところを背景に「階層マージ」という手法や「コントロールネット」という拡張機能といった、画期的なブレイクスルーが生まれました。

瀬下 3DCGの世界では、Blenderがまさにオープンソースのソフトウェアとして頭角を現していますね。様々なアイデアが次々に実現して集積し、相互に刺激しあうことでまた新しいアイデアが生まれる。オープンソースコミュニティのメリットが最大限活用され、業界を席巻する勢いです。

話をAIに戻しますが、最近気になっているニュースがあって。先日の芥川賞を受賞した小説(九段理江『東京都同情塔』)について、作者が(一部に)AIを使用したと話しましたよね。あれは、どうしてそれをわざわざ明かしたのだろうか、ということが気になっているんです。例えば、いかに高性能なワープロだろうと鉛筆だろうと、みな同じクリエイティブのための道具に過ぎないですよね。AIも道具のひとつですから、そこはわざわざ言及しなくてもよかったのではないか、と思ったんです。

新井 確かにAIも、クリエイターが使う新しい“ペン”ではあります。ただ世間でAIの使用を不安に思うのが多い人は、そのペンが本当に大丈夫なのか、信頼性がおけるものなのかどうかが、外側から見ているとわからないからというところはあると思います。

瀬下 僕自身は将来的になんらかの形でAIを活用したいし、実験的に色々と試し始めています。ただAIを取り巻く議論を見ていると、AIそのものというより、それを取り巻く法整備や運用上のモラルなどが、逆に新しい規制や縛りを大量に生みだしていく方向に進んでいって、結果としてコミュニティのクリエイティビティ全体が低下していくんじゃないか、ということを心配しています。

■画像生成AIとアニメの関係について
――今の画像生成AIを取り巻く議論の中に、著作者の意志にかかわらずネットにある画像を学習している、というところがあると思います。生成AIの学習というのはどういうものか、改めて教えていただけますか?

新井 画像生成AIの学習は、大きくわけて3段階にわかれています。まず最初が基盤モデルの学習です。ここで世界のあり方や人間の概念など、基本的なことを学習させます。画像生成AIだと、ネット上で約50億枚を学習しています。次に追加学習という形で、アニメ調ならアニメ調、写真風なら写真といった、もう少し具体的なものを学習させ、それを基盤モデルとマージ(合体)させます。

そして最後に、集中学習といって、具体的にほしいビジュアルの参考になるデータを学習させます。著作権法30条の4で、少なくとも基盤学習と追加学習に画像が使われることは「著作物に表現された思想又は感情の享受を目的としない利用」ならばということで認められてはいます。一方で生成された成果物の利用の段階については、AIが描いたか人間が描いたかにかかわらず、「類似性」及び「依拠性」に基づいて判断され、この2つがあれば著作権侵害として認められる、というふうになっています。

――基盤モデルは50億枚も学習するのですか。

新井 実際に即していうと、学習のためのデータセットを作るというより、ごそっとデータをまとめた上で、児童ポルノなどの問題ある画像を機械的に除外するという形になっています。これはひとつひとつの画像を目視してやっているわけではないです。

瀬下 ある生成AIが出力した絵が、先行する作品に「似ている/似ていない」で議論になった時、果たして本当に人間に判定できるんでしょうか? 人間が描いている場合も、剽窃なのか、オマージュなのか、パロディなのか、いろんな可能性があってすぐには結論が出せない場合もありますよね。

生成AIが、なにかに似た絵を出力することで、「ちょっとでも似ていると感じられたらNG」という方向に社会が進んで、むしろ創造活動が制限されたりするんじゃないか、という懸念が少なからずあります。そうなると、むしろAIの絵の依拠性や類似性を判定するためのAIというものや国際基準がこれから必要になるんじゃないか、とも思います。「これは問題がありません」というお墨付きマークがあれば安心して楽しめるというような。

新井 現行の画像生成AIは、基盤モデルをそういう形で学習してますから、常にそういう不安はつきまといます。実は、私たちがその問題をクリアにするために今進めているのは、「許諾されたデータだけで基盤モデルを学習させた画像生成AI」の開発です(「Anime Chain FAQ」アニメチェーン構想)。「AIを使っていません」ということを立証しようとすると、悪魔の証明になってとても難しいですが、「安全なAIを使っています」ということなら証明できますから。

瀬下 アニメもどうやって作られたか、いわば「由来や原材料」を証明する時代が来る、と。

新井 そういうアプローチをしないと、基盤学習や追加学習に日本のアニメやイラストを勝手に使った画像生成AIが、今以上に幅をきかせてしまうことにもなりかねないなと。

瀬下 まさに食品などと同じですね。「有機農法で作られました」とか「遺伝子組換え作物は使っていません」みたいな(笑)。

新井 そうですね(笑)

瀬下 ただ、アニメの場合100~300人からのスタッフによる集団作業です。そこでひとつひとつの成果物に、ある種の履歴があり、それを見れば「安心できるAIを使っていることがわかる」という状況は、かなり煩雑になるかも。ブロックチェーン技術を使えばできるのかもしれませんが、クリエイティブ外の作業が膨大になりそうで心配ですね。

新井 そこは作業者が行うというより、アプリやデバイスのレベルで自動的に記録が残るようにする形でできると思います。

瀬下 実は以前からクリエイターの事務作業全般の軽減を図ろうと、ブロックチェーン技術を活用することを考えているんですが、アプリやデバイスのレベルまで連動できれば、「著作の履歴を残す」為に応用できそうです。これから生成AIを活用していくには、そういうちゃんとした由来や履歴で作っていますよ、という証明がブランディングにも繋がる、ということでしょうね。

新井 そうです。許諾を得て画像を学習していれば、生成された画像を使った場合も、権利元に利益の一部を還元することもできると考えています。

――先ほど、基盤モデルの学習には50億枚の画像が使われているという話がありましたが、許諾の得られた画像もそれほど必要なのでしょうか?

新井 最新の論文だと2000万枚~3000万枚でも、同じぐらいの成果が出せるだろうという話になっています。これだと学習時間も十分の一になります。あとこれまでの生成AIの傾向として、基盤モデルの学習内容が欧米の美意識を反映したものになりがちなんです。例えていうと出汁が違う感じです。

瀬下 出汁ですか(笑)。

新井 そうです(笑)。今はそれを無理やり、日本人好みのものにして出力しているところがある。でも、ひとつのカルチャーが支配的になるよりは、いろんな価値観があったほうがいい。ジャパンコンテンツのためには、ジャパンコンテンツのための生成AIがあったほうがいい。さらにいうと、それもまた日本のクリエイティブの発信に、AIができることだと思います。

瀬下 別な視点で言えば、日本のカルチャーを守るためのAIという活用にも繋がりそうで素晴らしいですね。お話を聞いていると、生成AIは想像以上に近い未来に実用化できそうで期待です。実際、早く自分のアシスタントとして気軽にAIを使う時代が来てほしいですよ。……「締切をどうにかしてほしい」と話しかけたら「それはわかりません」って言うんじゃないやつです(笑)

新井 (笑)。

瀬下 話がSF的になって恐縮ですが、昔から自分の理想のAIのイメージってそんな感じです。直接的な指示とかじゃなくてもよくて、抽象的な会話のやりとりができて、そこからアドバイスとかインスピレーションとかに繋がったり。AIとそんなクリエイティブな関係になれるといいですね。