近日,來(lái)自O(shè)penAI開發(fā)的人工智能bot擊敗《DOTA2》頂級(jí)選手Dendi,引起電競(jìng)圈軒然大波。
Dota2 是一款由玩家操作單一游戲角色,進(jìn)行多人對(duì)戰(zhàn)的競(jìng)技游戲。Open AI 嘗試把游戲規(guī)則教會(huì)給人工智能,之后開始讓它不斷和自己對(duì)戰(zhàn)來(lái)提高水平。
Open AI 的開發(fā)工程師 Jakub Pachocki 介紹說(shuō):” Dota 2 的人工智能最開始只會(huì)在地圖上亂跑,莫名地死于敵人攻擊后,它開始學(xué)會(huì)哪些行為是錯(cuò)誤的,逐漸地它開始學(xué)會(huì)補(bǔ)兵,攻擊對(duì)面英雄,訓(xùn)練過(guò)程中其實(shí)沒(méi)有突然的大突破,就是一點(diǎn)點(diǎn)地升級(jí)?;镜膶W(xué)會(huì)以后就也逐漸學(xué)會(huì)比較復(fù)雜的操作了?!?/p>
Open AI 的網(wǎng)站介紹了人工智能如何通過(guò)自我訓(xùn)練來(lái)掌握敵人出現(xiàn)后可能會(huì)做出的操作數(shù)據(jù),并作出最正確的應(yīng)對(duì)。OpenAI 的 CTO Greg Brockman 解釋說(shuō),Dota2 的人工智能從零開始,訓(xùn)練了一個(gè)小時(shí)以后就已經(jīng)可以打過(guò)內(nèi)置的 AI 了,連續(xù)訓(xùn)練了 2 個(gè)星期的時(shí)間后就達(dá)到戰(zhàn)勝職業(yè)玩家的水平。
令人驚訝地是,在 Open AI 的內(nèi)部測(cè)試中,人工智能已經(jīng)完全戰(zhàn)勝了世界知名Dota2 選手 SumaiL 和 Arteezy 等人。
鑰匙體育館內(nèi)的比賽也和之前內(nèi)部測(cè)試的結(jié)果一樣,Dendi 在第一局比賽中以 2:0 告負(fù),而第二局比賽開始僅短短十分鐘之后,Dendi 就選擇了直接認(rèn)輸,此時(shí)AI的實(shí)力相比第一局已經(jīng)更上一個(gè)層次,而在此期間并沒(méi)有程序員為AI添加代碼,這就是自我學(xué)習(xí)。
比賽中AI正在卡兵:
在此之前的游戲 AI 大多建立在由策劃設(shè)計(jì)的游戲腳本上,AI 的行為完全由腳本觸發(fā)執(zhí)行,它的智能程度取決于游戲策劃考慮的細(xì)致程度,所以和游戲 AI 會(huì)在比賽中出現(xiàn)固定的行動(dòng)模式和大量模仿玩家策略的戰(zhàn)術(shù)表現(xiàn)。
但 Open AI 的人工智能帶來(lái)了新的體驗(yàn)。它并不是通過(guò)腳本行動(dòng),也沒(méi)有使用模仿學(xué)習(xí)或者數(shù)據(jù)搜索,而是從頭記錄 Dota2 的規(guī)則,通過(guò)和自我對(duì)戰(zhàn)來(lái)了解每一種行動(dòng)會(huì)產(chǎn)生什么后果,從而預(yù)測(cè)其他玩家下一步可能的操作,做到了在復(fù)雜環(huán)境下的隨機(jī)應(yīng)變。而僅僅訓(xùn)練 2 個(gè)星期就打敗 Dendi的 Dota2 人工智能,也計(jì)劃用長(zhǎng)達(dá) 1 年的時(shí)間來(lái)實(shí)現(xiàn)可以和人類進(jìn)行團(tuán)體對(duì)戰(zhàn)的功能。
全部評(píng)論