人気スマホアプリ・ポケモンGOのプレイヤーが撮影した写真が、意外なところで活躍している。世界中のプレイヤーが知らずに蓄積した300億枚の街の画像が、高層ビルの谷間でGPSより正確に位置を割り出す配達ロボットの「目」になったのだ。
遊びのデータが、先端ロボット技術を動かし始めている――。
■ポケモンが育てた測位技術
スマホのカメラ越しに捉えた現実世界に、生き生きとしたポケモンが姿を現す人気アプリの「ポケモンGO(Pokémon GO)」。
散歩中に出現するポケモンを捕まえたり、同じ場所を訪れたユーザーとのバトルに挑んだり、旅行先の名所に仕掛けられたアイテム入手スポットを巡ったりと、現実世界のマップと連動したプレイを楽しむ位置情報ベースのゲームアプリだ。
世界中にファンが存在し、公式情報を確認できる2019年の時点ですでに、累計ダウンロード数は10億回を突破している。
実はこうした膨大なユーザーが街角でピカチュウを追いかけるたび、スマートフォンのカメラが捉えた世界の風景が、運営する米ナイアンティック社のデータベースを育て上げてきた。その画像が今、ピザを届ける配達ロボットという先端サービスの「目」になろうとしている。
■GPSでは配達ロボが迷子になる
ナイアンティックからスピンアウトしたAI企業「ナイアンティック・スペーシャル」は、配達ロボットの米新興企業ココ・ロボティクスと提携。ナイアンティック・スペーシャルのジョン・ハンケCEOは、「ピカチュウを(スマホ画面上で)リアルに走らせることと、ココのロボットを安全かつ正確に(現実世界で)走行させることは、実は同じ問題なのです」と語る。
提携を初めに報じた米技術専門誌のMITテクノロジーレビューによると、ココはすでにアメリカの主要都市やヘルシンキで約1000台のロボットを走らせ、ピザや食料品を届けている。ただ、歩道を時速約8キロで進むロボットを都市部で正確に走らせるのは一筋縄ではいかない。
ナイアンティック・スペーシャルのブライアン・マクレンドンCTOは、「都市の谷間(アーバンキャニオン)はGPSにとって世界最悪の環境だ」と指摘する。高層ビルに挟まれた街路ではGPS信号がビル壁面に反射し、位置表示が最大50メートルもずれることがある。
マクレンドン氏は、「それだけで別の街区、別の方向、あるいは道路の反対側に立っていることになる」と続ける。これでは全く違った家にピザを届けかねず、配達の経路の移動にも支障が出る。
この難問に頭を抱えていた同社に、思いがけない突破口が開いた。ポケモンGOのプレイヤーが知らず知らずのうちに撮りためた、膨大な都市の風景。その視覚情報を土台にした、正確な測位技術だ。
■同じ場所の写真が大量にある強み
MITテクノロジーレビューによると、ナイアンティック・スペーシャルがモデルの訓練に用いた画像は、実に300億枚にのぼる。主な情報源となったのは、ポケモンのバトルアリーナなどゲーム内の重要拠点、いわゆるホットスポットだ。その数は世界で100万カ所を超える。
各拠点ごとに、ユーザーによって違う角度・時間帯・天候で撮影された画像が、数千枚単位で存在する。その1枚1枚に、スマートフォンの位置・向き・傾き・移動速度・方向などが、詳細なメタデータ(付随情報)として記録されている。
同社CTOのブライアン・マクレンドン氏は、「立っている場所が数センチという精度でわかります。中でも最も重要なのは、どこを見ているかがわかることです」と語る。
配達ロボットの制御には、現在の緯度経度を示す位置情報だけでは足りない。その点、カメラがどちらの方向を向いているか正確に判明しているポケモンGOのデータは、貴重な学習リソースとなった。
膨大な画像数ゆえに、2Dの画像から都市の建物の立体形状を推定することも可能になった。米テクノロジー情報サイトのテックスポットによれば、市街地の交差点や店舗、建物外壁といった特徴的なポイントを、複数の角度から撮影された画像をサンプリングし、立体構造を捉えるマルチビュー3Dを生成できるようモデルを訓練した。
データの充実したホットスポットで学習を重ねた結果、ホットスポットから離れた未知のエリアでも、わずかな画像から正確な位置と向きを割り出せるようになったという。
■ユーザーに画像を撮らせる仕組みづくり
ポケモンGOはそもそも、現実世界の特定の場所までプレイヤーを歩かせるゲームだ。バトルができる「ジム」やマップ上に出現するポケモンをゲットするため、ユーザーは喜んで地図のあちこちを歩き回る。
同じスポットに大勢が入れ替わり訪れるうちに、晴れの日も雨の日も、昼も夜も、さまざまな角度と高さから撮られた画像が、誰に頼まれるでもなく集まっていった。
米科学技術メディアのポピュラーサイエンスによると、2016年のピーク時にはアクティブユーザーが月間約2億3000万人に達した。一時の熱狂こそ冷めたものの、2026年の現在も推定約5000万人がプレイを続けている。世界中の街角で、日々新たな画像が生まれ続けているのだ。
データの蓄積を一気に加速させたのが、2020年に追加された「フィールドリサーチ」機能だ。
街角の彫像やランドマークにスマートフォンのカメラをかざせば、ゲーム内報酬がもらえる。プレイヤーは報酬を目指して撮影を繰り返し、そのたびに現実世界の画像データが開発元のサーバーへ送られていった。「ポケモンバトルアリーナ」と呼ばれる対戦エリアにも、バトル目当てのプレイヤーが密集し、格好のデータ集積スポットになった。
プレイヤー自身に、地図づくりに協力していた自覚はない。プレイヤーを誘導する遊びの仕掛けそのものが、世界規模の3Dマップをつくり上げる原動力となった。
■配達ロボット1000台に欠けていた「直感」
ココ・ロボティクスの共同創業者であるザック・ラッシュCEOは、ロボット配達の壁は「ロボットにはまだ人間のような直感がない」ことに尽きると端的に語る。「人間なら『GPSが機能していないけど、おそらくここが正しい場所だろう』と理解できます」
米ビジネス誌のフォーチュンによると、ココはロサンゼルスやシカゴ、マイアミ、ジャージーシティ、ヘルシンキなど国内外の都市に約1000台のロボットを展開し、すでに数百万マイルを走破してきた。それだけの距離を重ねてなお、高層ビルが林立するエリアではGPS信号が遮られたり乱反射したりし、ロボットは正確な位置をつかめない。
「ロボットが間違った場所で注文を待っていたら、顧客にとって最悪の体験になります」とラッシュ氏。だからこそ期待を寄せるのが、ナイアンティック・スペーシャルのVPS(ビジュアル・ポジショニング・システム=視覚測位システム)だ。膨大な画像による3Dマップを頼りに、「直感」のないロボットを、お腹を空かせたユーザーが待つ正しい住所へと導く。
協業はまだ初期段階にあるとラッシュ氏は認めつつも、「配達場所をより正確に特定できれば、顧客は喜んでくれます」と語った。

■衛星より正確に位置を割り出す
視覚測位システムは、衛星信号ではなく、カメラが捉える風景を直接解析して位置を割り出す。人間が自分の居場所を直感するのと同じだ。
フォーチュンが伝える原理はシンプルだ。ロボットのカメラがリアルタイムで周囲を撮影し、あらかじめ蓄えた膨大な画像データベースと照合して同じ場所を探し当てる。それだけで、位置と方角がわかる。
衛星を一切使わないから、高層ビルに囲まれてGPS信号が乱れる都心部、いわゆるアーバンキャニオンでも精度は落ちない。むしろ郊外よりも学習データが多い。ナイアンティック・スペーシャルの広報担当者は、「アーバンキャニオンでこそ、特に高い安定性を発揮します」と強調する。
測位の手法をめぐっては、配達ロボット各社で考え方が分かれる。テックスポットによると、競合のスターシップ・テクノロジーズは、自社ロボットのセンサーで新しい場所を走るたびに3D地図に書き加えていく。
対するナイアンティック・スペーシャルは、多数のユーザーから集めた画像でグローバルに適用できる基礎モデルを築くやり方だ。1つのモデルの精度を高め、これをもとにあらゆるロボットやデバイスに位置情報を提供する。

スターシップは自社ロボットが走った範囲しかカバーできないが、ナイアンティック・スペーシャルは世界中のポケモンGOなどのプレイヤーが歩いた場所すべてをもとに地図モデルを鍛えられる強みがある。
■文字認証は本のスキャンを手伝っていた
ユーザーの何気ない日常の行動が、気づけばテクノロジーの進化に貢献している。こうした現象は、ポケモンGO以外でも見られる。
初期の例で有名なものが、2007年にカーネギーメロン大学で生まれたreCAPTCHAだ。人間のユーザーが閲覧していることの証明として、ウェブサイトを閲覧する際に、表示されている文字と同じ文字を入力するよう促される。
英テクノロジー情報サイトのテックレーダーによると、認証画面で入力する2単語のうち片方は、実はreCAPTCHA側がデジタル化したいと考えている書籍の一節だったという。ユーザーは自分が人間だと証明するたび、知らず知らず書籍の文字起こしに手を貸していたわけだ。
2009年にグーグルがreCAPTCHAを買収すると、そこからわずか2年ほどで、グーグルブックスのアーカイブ全体と、1851年まで遡るニューヨーク・タイムズの過去記事1300万本が、reCAPTCHAの入力作業を通じてデジタル化された。
書籍のデジタル化が一段落すると、reCAPTCHAの出題は様変わりした。2012年以降、Googleストリートビューの番地や道路標識の画像を見分ける課題が画面に並ぶようになる。ユーザーが「私はロボットではない」と証明するたび、今度は自動運転車のAI訓練データが蓄積されていった。
その後、テスラはこの仕組みを、けた違いの規模で取り入れた。
米工学専門誌のIEEEスペクトラムによると、約7万人いる顧客がいつもどおりハンドルを握るだけで、走行データ総計約7億8000万マイル(約12億5000万km)分が収集されたという。1日に約100万マイル(約160万km)ずつ増えてゆくペースだ。
一方、グーグルの自動運転テスト車は2009年以降の累計で約140万マイル(約225万km)。テスラの顧客は、2日も経たないうちにその距離を超えてしまうデータを提供していた。
■データ活用に慎重論も
もっとも、「知らぬ間の貢献」という構図は技術の進歩にはプラスだが、倫理面で問題提起も起きている。
ポピュラーサイエンスは、地図アプリ「Waze」の事例を挙げる。ユーザーの位置データが、捜査目的で法執行機関へ渡っていたとされるケースだ。
ポケモンGOのナイアンティック・スペーシャルは現時点で、VPS(ビジュアルポジショニングシステム)データを当局に提供する計画を示していない。だが、写真に映った目印から正確な位置を割り出せるこの技術に法執行機関が目をつけても不思議ではないと、ポピュラーサイエンスは指摘する。
一方、ナイアンティックもこうしたリスクを自覚している。欧州ニュース専門放送局のユーロニュースによれば、ポケモンGOのスキャン機能はオプトイン(初期状態では不使用となっており、利用者が自ら参加意志を示して初めてデータが提供される)方式で、プレイヤーがランドマークや公共スペースの短い動画を選んで提出する仕組みだ。
同社は2019年以降、データの収集・利用について透明性を保ってきたと表明している。
■地図はもはやロボットが読むもの
ポケモンGOから始まった地図に、完成の日は来ない。街は絶え間なく変化し、ロボットが歩道を走るたびに、地図はまた少し精密になる。
MITテクノロジーレビューの取材に応じたナイアンティック・スペーシャルのハンケCEOは、「ロボティクスのカンブリア爆発(爆発的な多様化)が起きている」と語る。
地図を読むのは人間でなく、今後は機械が主体になっていくとハンケ氏は語る。「今の時代のテーマは、機械が世界を理解する上で有益な記述方式を完成させることです」
同社は配達ロボット企業ココとの提携を手始めに、地図上のあらゆる物体に属性情報をタグ付けし、機械が自らの位置と周囲で何が起きているのかを把握できる「リビングマップ」の構築を進めている。絶えず更新される生きた地図だ。
ポケモンGOのプレイヤーが街を歩いて蓄えた画像を頼りに、配達ロボットが道を選ぶ。そのロボットがまた、次の世代のロボットに向けて、新たなデータを持ち帰る。遊びから生まれたデータを出発点に、ロボットたちが世代を超えて受け継ぐデジタルの地図が育とうとしている。

----------

青葉 やまと(あおば・やまと)

フリーライター・翻訳者

1982年生まれ。関西学院大学を卒業後、都内IT企業でエンジニアとして活動。6年間の業界経験ののち、2010年から文筆業に転身。技術知識を生かした技術翻訳ほか、IT・国際情勢などニュース記事の執筆を手がける。ウェブサイト『ニューズウィーク日本版』などで執筆中。

----------

(フリーライター・翻訳者 青葉 やまと)
編集部おすすめ