文/趙挪亞
在圍棋這個(gè)人類(lèi)一直以來(lái)占據(jù)著優(yōu)勢(shì)的項(xiàng)目里,谷歌旗下DeepMind開(kāi)發(fā)的人工智能(AI)AlphaGo已經(jīng)先后擊敗了柯潔和李世石兩位頂尖棋手。但說(shuō)來(lái)難以置信,DeepMind開(kāi)發(fā)的AI能打敗人類(lèi)世界棋王,卻無(wú)法通過(guò)英國(guó)高中的數(shù)學(xué)考試。
《分析神經(jīng)模型的數(shù)學(xué)推理能力》
4月2日,谷歌旗下的DeepMind團(tuán)隊(duì)公布了一份名為《分析神經(jīng)模型的數(shù)學(xué)推理能力》的研究報(bào)告(Analysing Mathematical Reasoning Abilities of Neural Models)。在這項(xiàng)研究中,團(tuán)隊(duì)讓AI接受一項(xiàng)包含了算術(shù)、幾何、概率和測(cè)量的數(shù)學(xué)測(cè)試,考題有 40 題,難度大約是英國(guó)高中數(shù)學(xué)的程度。
DeepMind給出的40道英國(guó)高中數(shù)學(xué)題
不過(guò),在這40道高中難度的數(shù)學(xué)題中,擁有強(qiáng)大通用算法和遠(yuǎn)超人類(lèi)計(jì)算能力的人工智能,卻只答對(duì)了14題,正確率只有35%,是實(shí)打?qū)嵉牟患案瘛?/strong>
值得一提的是,在AI參加測(cè)試以前,團(tuán)隊(duì)已經(jīng)為其做好了充足訓(xùn)練。據(jù)DeepMind介紹,他們?yōu)锳I建立了一個(gè)包含200萬(wàn)道題目的題庫(kù),涵蓋了算術(shù)、代數(shù)、概率、微積分等各種題型。
同時(shí),團(tuán)隊(duì)也派出了循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 和Transformer兩大當(dāng)下性能最先進(jìn)的模型參與測(cè)試。
為什么人工智能無(wú)法答對(duì)高中數(shù)學(xué)題呢?
原來(lái),最主要的原因是AI“看不懂”題目。DeepMind旗下的AI雖然已經(jīng)擁有了極強(qiáng)的機(jī)器翻譯能力,但依然抵不住數(shù)學(xué)問(wèn)題的復(fù)雜性和語(yǔ)言多樣性的壓力。
對(duì)AI而言,數(shù)學(xué)符號(hào)和題目本身就很難理解
對(duì)人類(lèi)而言,要解決數(shù)學(xué)問(wèn)題,要應(yīng)用到的不只有計(jì)算能力,還有各種各樣的認(rèn)知技能。比如理解題干,需要將文字或圖標(biāo)轉(zhuǎn)換為算術(shù)運(yùn)算符。
而對(duì)于依賴(lài)大量數(shù)據(jù)分析來(lái)尋求解決問(wèn)題規(guī)律的AI而言,數(shù)學(xué)語(yǔ)言的復(fù)雜性是一座難以逾越的高山。
其次,AI“舉一反三”的能力,也無(wú)法與人類(lèi)一較高下。它只能處理一些內(nèi)部存儲(chǔ)的問(wèn)題,無(wú)法超越已有的環(huán)境去理解新的東西。
而人類(lèi)在解決數(shù)學(xué)問(wèn)題時(shí),會(huì)進(jìn)行推理,從已知的公理中找到最佳策略,而在具體的運(yùn)算過(guò)程中,必須利用工作記憶來(lái)完成運(yùn)算。
據(jù)DeepMind研究人員總結(jié),現(xiàn)階段AI在推論的能力上,還不及人類(lèi)。在解答問(wèn)題時(shí),人腦動(dòng)用了多種認(rèn)知能力,包括將符號(hào)分類(lèi)、演算、運(yùn)用工作記憶來(lái)儲(chǔ)存中間值、還要運(yùn)用學(xué)到的規(guī)則或定理等。
相反,AI則擅長(zhǎng)模式比對(duì)、機(jī)器翻譯和強(qiáng)化式學(xué)習(xí),但彈性遠(yuǎn)不及人腦。它們不太能將事物推論到已有經(jīng)驗(yàn)的環(huán)境外,更無(wú)法處理刻意亂輸入的資訊。
不過(guò),雖然目前AI還無(wú)法當(dāng)數(shù)學(xué)老師,但他們已經(jīng)稱(chēng)霸了相當(dāng)多的領(lǐng)域。除了圍棋以外,DeepMind旗下的AI又在游戲《星際爭(zhēng)霸2》(StarCraft II)的測(cè)試賽中,5-0橫掃世界頂尖職業(yè)選手。
責(zé)任編輯:肖舒
特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請(qǐng)及時(shí)與ts@hxnews.com聯(lián)系或者請(qǐng)點(diǎn)擊右側(cè)投訴按鈕,我們會(huì)及時(shí)反饋并處理完畢。
已有0人發(fā)表了評(píng)論