10月19日,谷歌 DeepMind 團(tuán)隊(duì)帶來最新版本的AlphaGo ,代號(hào)為“AlphaGo Zero”。大家都知道 AlphaGo 曾經(jīng)擊敗了圍棋世界冠軍,讓許多優(yōu)秀的棋手都敗在了其面前。但是這次 DeepMind 團(tuán)隊(duì)帶來的“AlphaGo Zero”更加的強(qiáng)悍。
據(jù)悉“AlphaGo Zero”放棄了之前 AlphaGo 基于人類圍棋比賽的訓(xùn)練方式,采用了“自學(xué)成才”的方式,通過隨機(jī)下棋的方式來讓自己學(xué)習(xí)圍棋,并且不斷的提高棋藝。在“AlphaGo Zero”與 AlphaGo 的對(duì)戰(zhàn)中,“AlphaGo Zero”以100比0的比分擊敗了之前無敵于世的 AlphaGo 。根據(jù) DeepMind 公司首席研究員、倫敦大學(xué)學(xué)院教授大衛(wèi)·西爾佛(David Silver)所說的:“它能運(yùn)用基本原理自行創(chuàng)造知識(shí)。”
DeepMind 團(tuán)隊(duì)的 AlphaGo 在圍棋上無敵,但是在《星際爭(zhēng)霸II》中又如何呢?來自 AlphaGo 創(chuàng)造者 Julian Schrittwieser 為許多玩家解答了這個(gè)問題。Julian Schrittwieser 表示,“目前我們開放《星際爭(zhēng)霸II》的研究環(huán)境才過了幾個(gè)星期,還處在早期階段。相比圍棋,《星際爭(zhēng)霸II》的行動(dòng)空間要比圍棋復(fù)雜很多,而且需要觀察的空間也要大得多。從技術(shù)角度而言,我認(rèn)為最大的難點(diǎn)區(qū)別就是圍棋是一個(gè)處于在完全的信息展示環(huán)境下的游戲,而星際爭(zhēng)霸由于有著戰(zhàn)爭(zhēng)迷霧,所以信息情報(bào)并不完美?!?/span>
之前谷歌曾又使用測(cè)試AI與當(dāng)前《星際爭(zhēng)霸II》AI進(jìn)行比賽,但始終沒有獲得勝利,不知道這次 DeepMind 團(tuán)隊(duì)能不能利用“AlphaGo Zero”全新的學(xué)習(xí)方式來創(chuàng)造能與《星際爭(zhēng)霸II》選手匹敵的 AI ,不過這個(gè)難度確實(shí)很大,《星際爭(zhēng)霸II》不僅需要高手速,還需要運(yùn)營(yíng)、戰(zhàn)略等等,看來能不能創(chuàng)造出這個(gè) AI 還是一回事了。
全部評(píng)論