精品一区二区在线欧美日韩,亚洲永久网址在线观看

導(dǎo) 讀近日，來(lái)自O(shè)penAI開(kāi)發(fā)的人工智能bot擊敗《DOTA2》頂級(jí)選手Dendi，引起電競(jìng)?cè)幦淮蟛ā? Dota2 是一款由玩家操作單一游戲角色，進(jìn)行多人對(duì)戰(zhàn)的競(jìng)技游戲。Open AI 嘗試把游戲...

近日，來(lái)自O(shè)penAI開(kāi)發(fā)的人工智能bot擊敗《DOTA2》頂級(jí)選手Dendi，引起電競(jìng)圈軒然大波。

為了擊敗DOTA2職業(yè)選手，這個(gè)AI“自我學(xué)習(xí)”了兩周

Dota2 是一款由玩家操作單一游戲角色，進(jìn)行多人對(duì)戰(zhàn)的競(jìng)技游戲。Open AI 嘗試把游戲規(guī)則教會(huì)給人工智能，之后開(kāi)始讓它不斷和自己對(duì)戰(zhàn)來(lái)提高水平。

Open AI 的開(kāi)發(fā)工程師 Jakub Pachocki 介紹說(shuō)：” Dota 2 的人工智能最開(kāi)始只會(huì)在地圖上亂跑，莫名地死于敵人攻擊后，它開(kāi)始學(xué)會(huì)哪些行為是錯(cuò)誤的，逐漸地它開(kāi)始學(xué)會(huì)補(bǔ)兵，攻擊對(duì)面英雄，訓(xùn)練過(guò)程中其實(shí)沒(méi)有突然的大突破，就是一點(diǎn)點(diǎn)地升級(jí)?；镜膶W(xué)會(huì)以后就也逐漸學(xué)會(huì)比較復(fù)雜的操作了?！?/p>

Open AI 的網(wǎng)站介紹了人工智能如何通過(guò)自我訓(xùn)練來(lái)掌握敵人出現(xiàn)后可能會(huì)做出的操作數(shù)據(jù)，并作出最正確的應(yīng)對(duì)。OpenAI 的 CTO Greg Brockman 解釋說(shuō)，Dota2 的人工智能從零開(kāi)始，訓(xùn)練了一個(gè)小時(shí)以后就已經(jīng)可以打過(guò)內(nèi)置的 AI 了，連續(xù)訓(xùn)練了 2 個(gè)星期的時(shí)間后就達(dá)到戰(zhàn)勝職業(yè)玩家的水平。

為了擊敗DOTA2職業(yè)選手，這個(gè)AI“自我學(xué)習(xí)”了兩周

令人驚訝地是，在 Open AI 的內(nèi)部測(cè)試中，人工智能已經(jīng)完全戰(zhàn)勝了世界知名Dota2 選手 SumaiL 和 Arteezy 等人。

鑰匙體育館內(nèi)的比賽也和之前內(nèi)部測(cè)試的結(jié)果一樣，Dendi 在第一局比賽中以 2：0 告負(fù)，而第二局比賽開(kāi)始僅短短十分鐘之后，Dendi 就選擇了直接認(rèn)輸，此時(shí)AI的實(shí)力相比第一局已經(jīng)更上一個(gè)層次，而在此期間并沒(méi)有程序員為AI添加代碼，這就是自我學(xué)習(xí)。

比賽中AI正在卡兵：

為了擊敗DOTA2職業(yè)選手，這個(gè)AI“自我學(xué)習(xí)”了兩周

在此之前的游戲 AI 大多建立在由策劃設(shè)計(jì)的游戲腳本上，AI 的行為完全由腳本觸發(fā)執(zhí)行，它的智能程度取決于游戲策劃考慮的細(xì)致程度，所以和游戲 AI 會(huì)在比賽中出現(xiàn)固定的行動(dòng)模式和大量模仿玩家策略的戰(zhàn)術(shù)表現(xiàn)。

但 Open AI 的人工智能帶來(lái)了新的體驗(yàn)。它并不是通過(guò)腳本行動(dòng)，也沒(méi)有使用模仿學(xué)習(xí)或者數(shù)據(jù)搜索，而是從頭記錄 Dota2 的規(guī)則，通過(guò)和自我對(duì)戰(zhàn)來(lái)了解每一種行動(dòng)會(huì)產(chǎn)生什么后果，從而預(yù)測(cè)其他玩家下一步可能的操作，做到了在復(fù)雜環(huán)境下的隨機(jī)應(yīng)變。而僅僅訓(xùn)練 2 個(gè)星期就打敗 Dendi的 Dota2 人工智能，也計(jì)劃用長(zhǎng)達(dá) 1 年的時(shí)間來(lái)實(shí)現(xiàn)可以和人類(lèi)進(jìn)行團(tuán)體對(duì)戰(zhàn)的功能。