インベーダーもブロック崩しも自分で学んだAI
囲碁AI Alpha Goを生み出したGoogle傘下のDeep Mindは、他にも面白い開発で話題になった。スペースインベーダーやブロック崩しのゲームを一人でプレイしながら高得点を出せるようになるAIだ。そのAIは、画面の出力とスコアを最大化にするという評価関数によって、一人で「ルール」を学習しているように見える。 スペースインベーダーをこのAIにやらせたところ、最初はすぐに敵にやられてしまうが、30分くらい経過すると、いつ攻撃していつ隠れるべきかという感覚を学び、高得点が出せるようになったという。 実際のAIのプレイの様子が下記から確認ができる。うまく敵の攻撃をかわしながら、敵を攻撃しているのがわかる。
さらにブロック崩しについては2015年のNature誌に論文が発表されている。このAIにブロック崩しをやらせたところ、最初は何かよく分からないような感じで遊んでいるが、30分も経つと4回に1回しかミスをしなくなり、2時間も経つとほとんどマスターしてしまう。 実際のAIのプレイの様子は下記から確認ができる。プレイ回数が増えるほど上達していく様子がわかる。