技術(shù)人員好像對(duì)馬里奧系列游戲十分偏愛,之前就有團(tuán)隊(duì)研究出一套\u00A0AI 系統(tǒng),能夠通過觀看視頻來重建《超級(jí)馬里奧兄弟》的游戲引擎,而最近,程序員 SethBling 訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)來玩《馬里奧賽車》(初代),在觀看 15 個(gè)小時(shí)的游戲視頻并改進(jìn)一些行為后,這套系統(tǒng)在游戲的獎(jiǎng)杯賽中獲得了金牌。
SethBling 稱這套系統(tǒng)為 MariFlow,通過學(xué)習(xí)人類玩家的操作來進(jìn)行訓(xùn)練,它會(huì)經(jīng)過 5 層的計(jì)算來預(yù)測(cè)玩家會(huì)在哪個(gè)點(diǎn)按下按鈕。MariFlow 最大的特點(diǎn)就是使用了循環(huán)神經(jīng)網(wǎng)絡(luò),這意味著它可以對(duì)前面的信息進(jìn)行記錄,當(dāng)然,這需要人為進(jìn)行加權(quán),讓 MariFlow 知道哪些信息才是重要的。
不同于普通的橫版 2D 游戲,賽車游戲中會(huì)遇到的突發(fā)狀況要復(fù)雜得多,有時(shí) MariFlow 會(huì)陷入死循環(huán)中,在原地打轉(zhuǎn)。為了克服這種情況,SethBling 記錄了 15 個(gè)小時(shí)的游戲玩法,通過在各種極端的條件下進(jìn)行訓(xùn)練,MariFlow 才能應(yīng)對(duì)各種狀況,知道該怎么做。

在《馬里奧賽車》的大獎(jiǎng)賽模式里,玩家要與電腦 AI 進(jìn)行比賽,而 SethBling 自己訓(xùn)練的 MariFlow 已經(jīng)在蘑菇杯和花杯中獲得了金牌,在星星杯中還是銀牌。
