0

「AIに好奇心を与えるとスーパーマリオやDoomが上達」、カリフォルニア大学バークレー校のチームが研究成果を発表

2017年5月25日 18時15分
カリフォルニア大学バークレー校の研究者が、AIの学習アルゴリズムに人間でいう"好奇心"となるモデルを組み込みました。そしてスーパーマリオブラザーズやDoomをプレイさせてみたところ、画面からの情報以外に特にフィードバックがない状態でもまるで人と同じような上達を見せたと発表しました。

昨年、プロ棋士を次々と倒したことで話題となったGoogleの囲碁AI「Alpha Go」は、モンテカルロ木探索、いわゆるモンテカルロ法という手法を用いて、次の一手を選びます。これは、それまでの経験と得られたものの相対的な関係から導き出される加重値から次に進むべき「枝」を選択していく方法。一般的に「強化学習」とも呼ばれ、我々の世界で例えれば、犬に「お手」や「おまわり」を教えるのと同じ方法といえます。

ただ強化学習の場合は、全体的な効率よりもその時点でどれを選ぶかが重要になってしまうため、いわゆる目先の利益を追ってしまい、場合によっては同じ失敗を永遠に繰り返すことも起こりえます。

しかし、カリフォルニア大学バークレー校の研究チームは、AIに即時の報酬がない場合でも敢えてそれを試行してみるようにしたとのこと。

研究者は好奇心と強化学習を組み合わせたAIに、スーパーマリオブラザーズやViZDoomをAIにプレイさせました。すると、たとえばスーパーマリオの場合は、以前は行き止まりの壁に向かって何度もジャンプするなどと言った行動を延々と繰り返していたのに対して、好奇心を備えたAIでは人間と同じように、敵キャラクターから逃げたり障害物を乗り越えるために操作の仕方を変えるなどの行動を試行し、徐々にスキルを上げていきました。

注: この記事は配信日から2週間以上経過した記事です。記事内容が現在の状況と異なる場合もありますのでご了承ください。

「「AIに好奇心を与えるとスーパーマリオやDoomが上達」、カリフォルニア大学バークレー校のチームが研究成果を発表」のコメント一覧 0

コメントするニャ!
※絵文字使えないニャ!