何止 Meta x Oakley,小米等十家 AI 拍攝眼鏡上新!下半年好看!

AlphaGo 真的要去打星際了?DeepMind 用星際爭霸訓(xùn)練 AI
人工智能不下圍棋改玩電競。
在征服了雅達(dá)利游戲,以及圍棋選手李世石和柯潔之后,Google 旗下的人工智能實(shí)驗(yàn)室 DeepMind 將眼光瞄向了更高的挑戰(zhàn) —— 星際爭霸。
事實(shí)上,星際爭霸的游戲方式非常適合 DeepMind 訓(xùn)練人工智能的記憶、計(jì)劃等高級的技能。自去年 AlphaGo 打敗李世石之后,DeepMind 就和星際爭霸的創(chuàng)造者暴雪游戲公司達(dá)成合作,用游戲訓(xùn)練 AI。今天,用于訓(xùn)練 AI 系統(tǒng)的軟件在 Deep Mind 官網(wǎng)上發(fā)布了出來。
這個(gè)叫做 SC2LE 的軟件主要包括一套用于加速 AI 在星際爭霸的訓(xùn)練的工具,具體內(nèi)容如下:
- 由暴雪公司開發(fā)的機(jī)器學(xué)習(xí) API,幫助開發(fā)者和研究人員參與到星際爭霸游戲中
- 一個(gè)匿名的游戲數(shù)據(jù)集
- 開源的 DeepMind 工具集 PySC2,可以讓研究人員非常容易地使用暴雪游戲的 API
- 一系列簡單的增強(qiáng)學(xué)習(xí)迷你游戲,用于測試 AI 系統(tǒng)特定的功能和任務(wù)
- 一些研究論文,幫助開發(fā)者了解整個(gè)游戲環(huán)境,報(bào)告迷你游戲的測試結(jié)果等
SC2LE 軟件工具包能夠讓 AI 系統(tǒng)像人類玩家一樣玩游戲,也就是說,AI 系統(tǒng)和人類玩家有著相同的約束條件,比如開局時(shí)無法看到游戲的全地圖、無法快速點(diǎn)擊鼠標(biāo)。這就要求 AI 系統(tǒng)通過不斷地試錯(cuò)來進(jìn)行學(xué)習(xí), 或者叫做「增強(qiáng)學(xué)習(xí)」。

為什么星際爭霸可以用來訓(xùn)練 AI 系統(tǒng)呢?
在計(jì)算的精度和速度上,計(jì)算機(jī)遠(yuǎn)超人類,但是在更高層級的「抽象思維」能力上,計(jì)算機(jī)短時(shí)間內(nèi)還無法達(dá)到人類的水平,而電子游戲就是訓(xùn)練計(jì)算機(jī)「抽象思維」的重要工具。星際爭霸被玩家們稱作最難的即時(shí)戰(zhàn)略游戲,該游戲的搜索和決策空間比圍棋大了多個(gè)數(shù)量級,AI 在進(jìn)行訓(xùn)練時(shí)不僅要考慮戰(zhàn)斗策略,環(huán)境探索,建筑和技能升級,還要考慮資源的搜集和分配等因素。另外,游戲早期所采用的生產(chǎn)和戰(zhàn)斗策略不一定會(huì)立即產(chǎn)生效果,所以游戲玩家必須做好長期的戰(zhàn)略規(guī)劃,這對 AI 來說是個(gè)不小的挑戰(zhàn)。
DeepMind 研究員,同時(shí)也是星際爭霸頂級玩家的 Oriol Vinyals 說:「游戲提供的一個(gè)很有趣的機(jī)制叫做『戰(zhàn)斗迷霧』,它迫使玩家探索地圖,找到敵人的位置,分析敵人的發(fā)展?fàn)顩r。對于人類玩家來說,『探索地圖』這樣的游戲方式已經(jīng)習(xí)以為常,但對 AI 來講就不一定 ,AI 需要不斷地學(xué)習(xí)才能形成一種常識,這樣的挑戰(zhàn)在之前的圍棋大戰(zhàn)是不存在的。」
對于 AI 的訓(xùn)練,DeepMind 希望通過一系列的「迷你游戲」,將整個(gè)游戲分解成多個(gè)可管理的,簡單的機(jī)制進(jìn)行訓(xùn)練,比如收集資源、游戲單位的移動(dòng)、造房子等,然后從中來評估 AI 的訓(xùn)練結(jié)果。

根據(jù) DeepMind 的初步調(diào)查顯示,AI 在這些迷你游戲中表現(xiàn)良好。但在一場完整的游戲比賽中,再強(qiáng)大的 AI 系統(tǒng)也無法完成一場最簡單的星際爭霸比賽,DeepMind 表示,他們將繼續(xù)優(yōu)化訓(xùn)練方法,爭取在深度增強(qiáng)學(xué)習(xí)領(lǐng)域有所突破。
DeepMind 和暴雪的訓(xùn)練正在進(jìn)行中,但是已經(jīng)有專業(yè)玩家對「人機(jī)大戰(zhàn)」表示興趣十足。韓國星際電競選手卞玄宇說:「我不認(rèn)為現(xiàn)在的人工智能在星際爭霸上能夠打敗一位專業(yè)的玩家,至少在我有生之年內(nèi)不會(huì)。」
計(jì)算機(jī)不斷采用新的方式來解決問題,并形成一種「常識」,這是一件很有挑戰(zhàn)性,也很有意思的事情,它有可能會(huì)給世人帶來很多驚喜。不過,作為一名 AI 和電子游戲的愛好者,我期待著人類玩家和人工智能在星際爭霸上對決的那天。