ぼやけた画像がくっきり鮮明に!Googleの画像合成AI技術が凄すぎて人間にも区別できないレベル
Photo by:Google AI
 低解像度の画像はぼやけていて、どんなに目を細めてみたところで、くっきり鮮明に見えることはない。

 だが、Googleが開発した画像合成AI技術を使うと、低解像度の画像をごく自然な高解像度画像に変換することができる。


 その出来栄えはあまりにも自然すぎて、処理された画像がオリジナルで、もともとの画像の方がモザイクでぼかされたものに思えてくるほどだ。

 この技術を応用すれば、不鮮明な古い写真を綺麗に仕上げたり、医療用の画像装置を改善したりと、さまざまな分野で役立つことが期待されている。

あえてノイズを追加することで高解像度画像を生成 これまで画像合成処理を行うAIとして一般的だったのは、「敵対的生成ネットワーク(GAN)」「変分オートエンコーダ(VAE)」「自己回帰モデル」といった深層生成モデルだった。

 しかしGoogle AIが投稿したブログ(21年7月16日付)によると、今回の技術には「SR3(Super-Resolution
via Repeated Refinement)
」といった「拡散モデル(diffusion model)」が採用されている。

 このモデルは、入力された画像データにあえてノイズを加えていく。どんどんノイズを加えて画像を破壊する。
そしてAIはその過程を学習する。

 画像をただのノイズにまで壊してしまったら、学習したニューラルネットワークにもとづき今度はそのプロセスを逆転する。すると、もともとの画像よりもずっと鮮明な画像が生成されるのだ。

[画像を見る]

Photo by:Google AI
人間が判別するのが難しいほど自然 Google AIは、人間の被験者にオリジナルの画像と修正された画像を見てもらい、どちらがオリジナルか当ててもらうという実験も行なっている。

 結果は、生身の人間ですらなかなか判別できなかった。

 従来の画像処理AIを使った場合、区別に失敗するケースは3割程度でしかなかったが、最新モデルでは、50%近くの人が判別できなかったのだ。


[画像を見る]

Photo by:Google AI

[画像を見る]

Photo by:Google AI
SR3による連続処理で高解像度画像を生成 もう1つ紹介されているのは、「Cascaded Diffusion Models(CDM)」」という技術だ。これはSR3などの分散モデルを連続的に行うことで、低解像度画像を高解像度にアップスケールすることができる。

 32 x 32ピクセルの画像を256 x 256ピクセルに変換しても、わんちゃんやチーズバーガーはごく自然な写りだし、64 x 64ピクセルの人物を1024 x 1024ピクセルにしてもなんの違和感も感じない。

[画像を見る]

Photo by:Google AI

[画像を見る]

Photo by:Google AI

[画像を見る]

Photo by:Google AI

[画像を見る]

Photo by:Google AI
 この最先端AI画像加工技術に対し、Facebook上では
・こいつを日本の某映像に試してみるよ。
・修正画像と同じ解像度の元の写真があればもっと面白いだろうね。修正画像は確かに自然だけど、オリジナルとはどのくらい違うんだろう?
・昔の映画がネタにされることがあるけれど、今では一気に綺麗にする魔法のボタンがあるわけね。

・この技術からはどんな狡猾な悪用法が生まれるんだい?
・つまり映像内の隠された顔は全部丸見えってこと? いい話とは思えないな。
 などの声が上がっていた。さて、みんなならこのAIでどんな画像を高解像度にしてみたいだろうか?

 モザイクを全て取り外すことができる上に高解像度になる魔法の技術だと大喜びしている人は世界中に存在しそうだけども、そこはパンドラの箱なのかもしれないし、そうでもないのかもしれない。

画像・動画、SNSが見れない場合はオリジナルサイト(カラパイア)をご覧ください。