「AIに好奇心を与えるとスーパーマリオやDoomが上達」、カリフォルニア大学バークレー校のチームが研究成果を発表

「AIに好奇心を与えるとスーパーマリオやDoomが上達」、カリフォルニア大学バークレー校のチームが研究成果を発表
カリフォルニア大学バークレー校の研究者が、AIの学習アルゴリズムに人間でいう"好奇心"となるモデルを組み込みました。そしてスーパーマリオブラザーズやDoomをプレイさせてみたところ、画面からの情報以外に特にフィードバックがない状態でもまるで人と同じような上達を見せたと発表しました。

昨年、プロ棋士を次々と倒したことで話題となったGoogleの囲碁AI「Alpha Go」は、モンテカルロ木探索、いわゆるモンテカルロ法という手法を用いて、次の一手を選びます。これは、それまでの経験と得られたものの相対的な関係から導き出される加重値から次に進むべき「枝」を選択していく方法。一般的に「強化学習」とも呼ばれ、我々の世界で例えれば、犬に「お手」や「おまわり」を教えるのと同じ方法といえます。

ただ強化学習の場合は、全体的な効率よりもその時点でどれを選ぶかが重要になってしまうため、いわゆる目先の利益を追ってしまい、場合によっては同じ失敗を永遠に繰り返すことも起こりえます。

しかし、カリフォルニア大学バークレー校の研究チームは、AIに即時の報酬がない場合でも敢えてそれを試行してみるようにしたとのこと。

研究者は好奇心と強化学習を組み合わせたAIに、スーパーマリオブラザーズやViZDoomをAIにプレイさせました。すると、たとえばスーパーマリオの場合は、以前は行き止まりの壁に向かって何度もジャンプするなどと言った行動を延々と繰り返していたのに対して、好奇心を備えたAIでは人間と同じように、敵キャラクターから逃げたり障害物を乗り越えるために操作の仕方を変えるなどの行動を試行し、徐々にスキルを上げていきました。またプレイヤーキャラクターが死んでしまうような行動を避けるようになったとのこと。

あわせて読みたい

気になるキーワード

Engadget 日本版の記事をもっと見る 2017年5月25日のIT記事をもっと見る
この記事にコメントする

\ みんなに教えてあげよう! /

次に読みたい関連記事「Apple」のニュース

次に読みたい関連記事「Apple」のニュースをもっと見る

新着トピックス

ITニュースアクセスランキング

ITランキングをもっと見る

コメントランキング

コメントランキングをもっと見る

トレンドの人気のキーワード一覧

新着キーワード一覧

このカテゴリーについて

最新IT業界情報やiPhoneやAndroidやガジェット、話題のサービス、IoT情報、スタートアップにまつわるニュースをお届け中。