哈薩比斯眉開(kāi)眼笑的道:“沒(méi)錯(cuò)!”
“快演示給我看看!”辛頓頗為激動(dòng)。
從上個(gè)世紀(jì)50年代人工智能剛形成概念的時(shí)候起,游戲始終都是人工智能的重要測(cè)試手段。
早在1990年的時(shí)候,人工智能就在跳棋項(xiàng)目上擊敗了人類(lèi)世界冠軍。
1997年,ibm的超級(jí)計(jì)算機(jī)“深藍(lán)”擊敗了國(guó)際象棋世界冠軍卡斯帕羅夫。
2011年,另一臺(tái)ibm計(jì)算機(jī)“沃森”在游戲《危險(xiǎn)邊緣》中擊敗了所有人類(lèi)玩家。
deepmind也試圖從游戲項(xiàng)目入手挖掘人工智能的潛力,他們開(kāi)發(fā)出了一個(gè)會(huì)玩游戲的人工智能,主要目標(biāo)瞄準(zhǔn)了雅達(dá)利游戲。
雅達(dá)利是一種上世紀(jì)80年代流行一時(shí)的主機(jī),曾經(jīng)是游戲市場(chǎng)的霸主,卻由于推出了一款史上最垃圾的游戲《et》而一蹶不振,最后被任天堂的fc取而代之。..
但在很多歐鎂人的心中,雅達(dá)利游戲依然是經(jīng)典,其中最出名的幾款游戲《太空入侵者》、《乒乓》和《打磚塊》都被deepmind列入人工智能的攻克名單。
來(lái)到演示電腦前,屏幕上正在進(jìn)行著一場(chǎng)《打磚塊》游戲,沒(méi)有人操控,擋板自動(dòng)的在屏幕下方游走,一次又一次的把小球彈向上方磚墻。
哈薩比斯道:“弗拉德,你來(lái)給大家講解一下吧?!?
弗拉德?姆尼是deepmind的資深工程師,這臺(tái)正在打磚塊的人工智能系統(tǒng)正是他率領(lǐng)團(tuán)隊(duì)做出來(lái)的,聞點(diǎn)了點(diǎn)頭道:“諸位,我們使用一種全新的深度神經(jīng)網(wǎng)絡(luò)構(gòu)造方法,制作出了這個(gè)系統(tǒng)。通過(guò)反復(fù)試錯(cuò)來(lái)學(xué)習(xí)《打磚塊》的游戲方法和每一種擊球角度的細(xì)微差別,目前已經(jīng)玩了14283局游戲,系統(tǒng)已經(jīng)能夠分析出哪一種動(dòng)作是有效擊打,哪一種是無(wú)效擊打,我們稱(chēng)這種學(xué)習(xí)方式為強(qiáng)化學(xué)習(xí)?!?
“在最初的系統(tǒng)中,它需要300個(gè)小時(shí)以上,才能精通這款游戲,并且通關(guān)。經(jīng)過(guò)我們不斷調(diào)整算法和結(jié)構(gòu)之后,它現(xiàn)在已經(jīng)能夠在30分鐘之內(nèi)學(xué)會(huì)游戲的基本規(guī)則,1個(gè)小時(shí)達(dá)到普通玩家的熟練度,每次都能準(zhǔn)確的接到小球命中磚塊,2個(gè)小時(shí)候它就學(xué)會(huì)了進(jìn)階技巧,能夠找準(zhǔn)角度把球打入磚塊后的狹窄空間,利用小球在磚塊之前的反彈碰撞快速得分?!?
“目前,這個(gè)系統(tǒng)在游戲中的得分已經(jīng)超越了deepmind的所有人。”姆尼最后的一句話發(fā)人深省。
辛頓一直靠在墻邊安靜的聽(tīng)著,直到此時(shí)問(wèn)道:“所以你們的系統(tǒng)真的是每一次都從頭學(xué)習(xí)打磚塊的游戲技能?”
姆尼道:“沒(méi)錯(cuò)。我們只是設(shè)定了一個(gè)目標(biāo),比如得到最高的分?jǐn)?shù),它就可以自動(dòng)試錯(cuò)和學(xué)習(xí),制訂一些獨(dú)特的游戲策略。這些策略的最終目標(biāo)就是得到最高分。然后,它每次都能成功,只是每一次耗費(fèi)的時(shí)間越來(lái)越短?!?
“真是令人震驚……”辛頓喃喃道。
李睿盡管早就知道人工智能會(huì)在十年后掀起狂風(fēng)巨浪,也依然和辛頓一樣,受到了深深的震撼。
_c