「記事のただ乗り」をめぐって、国内外の報道機関(著作権者)と生成AI(人工知能)企業が火花を散らしている。
国内では8月、読売新聞に続いて朝日新聞と日本経済新聞が相次いで、米国の新興生成AI企業パープレキシティを相手取り、AIを使った検索サービスに記事を無断で利用しているとして、記事の利用差し止めや、それぞれ約22億円の著作権侵害の損害賠償を求める訴訟を起こした。
海外でも、米ニューヨークタイムズ(NYT)が2023年12月、オープンAIとマイクロソフトを著作権侵害で訴えたのを皮切りに、生成AI企業に対する訴訟が頻発している。
報道機関の一連の訴えに対し、生成AI企業は争う構えで、訴訟の行方は予断を許さない。
既存の新聞社や放送局が、時間や労力、費用をかけて作成した「信頼できる記事」を、対価も支払わずに無断で利用して、自社の利益を得ようとする「ただ乗り」が許されるなら、報道機関の活動そのものが危機に陥りかねない。ただでさえ、デジタル革命に乗り遅れて苦境に立たされているだけに、生成AIによる記事の簒奪は、生き残りの道を封じることになってしまう。
生成AI企業にとって、生成AIの精度を高めるうえで報道機関の記事は重要な情報源だ。だが、報道機関が衰退して良質な情報を入手できなくなれば、利用者に有用な回答を提供できず、自らのビジネスモデルを価値なきサービスに貶めることになりかねない。
生成AIの急速な進化に法整備が追いついていないだけに、将来を見通せば、生成AI企業は、報道機関と対峙するのではなく、共存する道を探ることが求められている。
■「対話型検索」と呼ばれる新しい検索サービス
生成AIは、記事だけでなくあらゆる著作物を「学習」し、新たなコンテンツを「生成」することで、ユーザーにかつてない利便性をもたらしている中でも、検索と生成AIを連動させた新しいサービスは「検索拡張生成(RAG)」と呼ばれる。
従来の「キーワード」を入力すれば関係サイトを一覧で表示する「キーワード型検索」に対し、話しかけるように文章を入力すると、AIが質問の意図を判断し、対話しているかのように文章で返してくる「対話型検索」だ。
基になっている情報は、ネット上に無数に散在する記事で、クローラーというロボットを使って集めた大量の記事を、要約したうえで回答する。参照元の記事を閲覧しなくても、知りたい情報を得られる手軽さがウリだ。文章だけでなく、画像や動画、音声などを基に、アニメや音楽などを作ることもできる。
先鞭をつけたとされるパープレキシティは、米オープンAIの出身者らが2022年に創業、米アマゾン創業者のジェフ・ベゾス氏や米半導体大手エヌビディアが出資、ソフトバンクも提携している。サンフランシスコに本拠を置き、従業員は約200人。ユーザーは世界中に広がり、月間1500万人以上が利用しているとされ、企業価値は180億ドル(約2兆6700億円)に上るという。
■RAGの弱点、平気で誤情報を流す現状
確かに、「RAG」の利便性は高い。だが、利用者が注意しなければならないのは、「RAG」は、平然と、そしてもっともらしく誤った情報を提供してしまうことだ。
生成AIが事実と異なる情報を生成する現象は「ハルシネーション(幻覚)」と呼ばれる。実際に使ってみればわかるが、誤った回答をするのは日常茶飯事で、うっかりするとだまされてしまう。新聞協会の調査によれば、「約6割の利用者が誤った回答を表示された経験がある」という。ハンパな数字ではない。
その原因は、誤った情報源を参照してしまう「学習」段階の問題、取得した情報が不完全なのに回答しようとする「生成」段階での問題、などさまざまな原因が指摘されている。黎明期ともいえる現段階では、利用者は、相当に用心してRAGを利用することが求められそうだ。
■読売、朝日、日経が異例の共同歩調
パープレキシティに対する訴訟で、国内の大手新聞3社に共通する問題は、記者が膨大な時間と労力を費やして取材・執筆した新聞社の記事を無断で集め、対価を支払わずに大量かつ継続的に利用する「ただ乗り」だ。
8月7日に訴訟の口火を切ったのは、読売新聞グループ。
読売新聞オンライン(YOL)の記事を無断利用しているとして、東京地裁に約21億6800万円の損害賠償と記事使用の差し止めなどを求める訴訟を起こした。
さらに、従来の検索エンジンは、記事サイトへの訪問を促すため広告収入に結び付いていたが、パープレキシティは回答を直接提示するためサイト訪問が減少(いわゆる「ゼロクリックサーチ」)し、営業利益を侵害する不法行為に当たるとも指摘、広告収入減少分の賠償も求めた。
朝日新聞社と日本経済新聞社も8月26日、それぞれ22億円の損害賠償などを求める訴訟を起こした。訴えの趣旨は読売新聞社とほぼ同じで、遅くとも2024年6月ごろから、両社の記事や情報を基に、記事が含まれた文章を回答結果として利用者のスマホやパソコンに表示する行為をくり返したという。
加えて、両社の社名や記事を引用元として示しながら、実際の記事とは異なる虚偽の事実を多数表示したと指摘、正確さが求められる新聞社の信用を損なうもので、不正競争防止法違反にもあたると訴えている。
また、3社はいずれも、防衛策として、自社のサイトに「robots.txt」というファイルを導入し、クローラーによる情報収集を拒否する意思を明らかにしているにもかかわらず、無視して記事が利用されているという。
国内の大手報道機関が訴訟で足並みをそろえるのは、きわめて異例。それだけ、事態の深刻さを表しているようだ。
■海外でも著作権侵害めぐり訴訟が頻発
海外では、すでに多くの訴訟やトラブルが起き、その数は50件を超えるという。
パープレキシティに対しては、米ニューズ・コープ傘下のダウ・ジョーンズ(ウォール・ストリート・ジャーナル=WSJの発行元)とニューヨーク・ポストが24年10月、ニューヨーク州の連邦地裁に著作権侵害訴訟を起こした。
いずれも、パープレキシティが自社のニュース記事を無断でコピーし、AIによる検索結果(「RAG」)の生成に利用していると主張、両社のサイトへの訪問者数が減少し、広告収入などの損失が生じていると訴えている。
また、英BBCは24年6月、コンテンツの無断利用に対する警告書を送付。ニューヨーク・タイムズも10月、記事の無断収集をやめるよう書簡で求めた。
一方、報道機関ではないが、百科事典で知られる米エンサイクロペディア・ブリタニカは25年9月、ウェブサイトの記事を無断で使われたとして提訴した。直近では、グーグルに対する訴訟も起きた。音楽雑誌『ローリング・ストーン』などを出版する米ペンスキーメディア(PM)が9月、コンテンツの違法使用を訴えたのだ。
生成AI企業は軒並み、被告の立場に置かれているといえる。
■国によって異なる著作権法
こうした一連の訴えに対し、生成AI企業は全面的に争う構えだ。
ただ、ひと口に著作権侵害と言っても、内容は多岐にわたる。
生成AIは、「学習」と「生成」の2段階を経て新しいコンテンツを生み出し、利用者に提供する。欧米では「学習」における是非を問うケースが多いのに対し、国内の訴訟は「生成」に焦点をあてている点で違いがある。
というのも、米国の著作権法では、特定の条件を満たせば著作権者の許諾を得なくても著作物の利用が認められるという「フェアユース(公正な利用)」が規定されている。
一方、日本の著作権法には「フェアユース」の概念はない。18年の法改正で著作物をAIの「学習」に使うためのデータ収集などは許諾なく利用できることを認める一方、「著作権者の利益を不当に害する」場合は利用できないとも規定した。
このため、「ただ乗り」をめぐる生成AI企業vs報道機関の闘いは、国や地域によって一様ではなく、一筋縄ではいかない複雑な構図になっている。
■2200億円の和解金支払いも
こうした中、米国の作家が米AI開発企業アンソロピックを、対話型AI「クロード」の開発にあたって著作権を侵害したと訴えた集団訴訟は、米カリフォルニア州連邦地裁が6月、合法的に購入した書籍の無断使用は「フェアユース」で著作権侵害にあたらないが、ネット上の海賊版サイトから無料でダウンロードした場合は著作権侵害にあたると認定。
アンソロピックは9月、海賊版を利用したことが特定された約50万冊について15億ドル(約2200億円)の和解金を支払うことになった。1冊あたり3000ドル(約44万円)になる。
また、判例検索サービスを運営する米トムソン・ロイターが原告となった訴訟では、デラウェア州連邦地裁が2月、判例要旨を第三者経由で入手してAIに学習させていた米AI開発会社ロス・インテリジェンスに対し、フェアユースを否定し権利侵害を認める判断を示した。
いずれも、著作権者側に有利な先行事例となった。もっとも、13人の作家集団が米メタを相手どって起こした訴訟はのように、原告側が損害を立証できなかったとして6月に訴えが退けられたケースもあった。
AIへの評価によって、裁判所の判断が割れているようにも見える。とはいえ、生成AI企業は著作権者とライセンス契約を結ばないとデータを集めにくくなる流れができつつあるともいえそうだ。
■報道機関との提携に動く生成AI企業
こうした事態を見込んで、生成AI企業の一部には、報道機関との摩擦を避けるため、記事の使用料を支払ったり、提携に踏み切る事例も出てきた。
オープンAIは24年5月、ニューズ・コープと記事のライセンス契約を結び、傘下のウォール・ストリート・ジャーナルなどの記事を使って、生成AIの学習や要約の作成に利用できるようにした。総額は、5年間で2億5000万ドル(約370億円)を超えるようだ。
また、米AP通信、英フィナンシャル・タイムズ(FT)、独アクセル・シュプリンガー、仏ル・モンドなどとも、ライセンス契約や提携関係を結んだという。
アマゾン・ドット・コムも5月、ニューヨークタイムズと、生成AIの学習向けに記事を利用する契約を結び、記事の使用料として年間最大2500万ドル(約37億円)を支払うことになった。
訴訟が相次ぐパープレキシティも8月、提携する報道機関に収益を分配する仕組みを年内にも導入する方針を明らかにした。当面の資金として4250万ドル(約62億円)を用意するという。
■国内外ともに遅れる法整備
「ただ乗り」をめぐる法整備は、国内外ともに遅れている。
米国では、司法省が24年11月、著作物をAIサービスの「学習」「生成」に使われないよう拒否できる仕組みの導入を求めた。一部の州では、著作物を保護するための州法制定を急ぐ動きも出ている。
欧州連合(EU)は24年8月にAI規制法が発効、違反した事業者には巨額の制裁金を科すことを定めたが、本格的な実施はこれから。
一方、日本では25年5月にようやく、AIの開発促進と安全確保の両立を目指す理念法のAI新法「AI関連技術の研究開発・活用推進法」が成立。
9月に発足したばかりの政府のAI戦略本部は、「AI基本計画」の策定を急いでいるが、政権交代のタイミングにぶつかり、先行きは不透明だ。
■新聞社が「記事の安売り」をやめる好機
記事やデータの利活用がどこまで許容されるかは、現状ではグレーゾーンといえる。法整備がままならない中、相次ぐ訴訟でグレーソーンの明確な線引きが行われることが期待される。
そうした中、報道機関と生成AI企業が記事使用のライセンス契約を結ぶことは、「信頼できるRAG」の普及に大きな一歩となろう。
記事や情報の著作権者が正当な対価を得られる仕組みができれば、両者にとってプラスであり、利用者も大きな恩恵を得られるに違いない。
もっとも、これまでに明らかになった一連の和解金やライセンス契約料が妥当な額かどうかは、微妙なところだ。
報道機関にとっては小さくない金額でも、巨大な富を得られる可能性のある生成AI企業にとってみれば、たいした金額とは言えないかもしれないからだ。
ネット草創期に、ネットの影響を軽んじた報道機関は、タダ同然の「激安」で記事を提供し、衰退の一因をつくってしまった苦い経験がある。
「生成AIでの記事の利活用」という新たな局面を迎え、報道機関にとって、記事の値決めは死活問題ともいえる最重要テーマになるだろう。取材・執筆を担保できないような使用料では、自滅の道を待ったなしに歩むことになりかねない。
生成AI企業は報道機関と共存する道を探るべきだ。
それは、生成AI時代の岩盤を強固にする作業でもある。
----------
水野 泰志(みずの・やすし)
メディア激動研究所 代表
1955年生まれ。名古屋市出身。早稲田大学政治経済学部政治学科卒。中日新聞社に入社し、東京新聞(中日新聞社東京本社)で、政治部、経済部、編集委員を通じ、主に政治、メディア、情報通信を担当。2005年愛知万博で博覧会協会情報通信部門総編集長を務める。日本大学大学院新聞学研究科でウェブジャーナリズム論の講師。新聞、放送、ネットなどのメディアや、情報通信政策を幅広く研究している。著書に『「ニュース」は生き残るか』(早稲田大学メディア文化研究所編、共著)など。
■メディア激動研究所:https://www.mgins.jp/
----------
(メディア激動研究所 代表 水野 泰志)