在圍棋這個人類一直以來占據(jù)著優(yōu)勢的項目里,谷歌旗下DeepMind開發(fā)的人工智能(AI)AlphaGo已經(jīng)先后擊敗了柯潔和李世石兩位頂尖棋手。但說來難以置信,DeepMind開發(fā)的AI能打敗人類世界棋王,卻無法通過英國高中的數(shù)學(xué)考試。
《分析神經(jīng)模型的數(shù)學(xué)推理能力》
4月2日,谷歌旗下的DeepMind團隊公布了一份名為《分析神經(jīng)模型的數(shù)學(xué)推理能力》的研究報告(Analysing Mathematical Reasoning Abilities of Neural Models)。在這項研究中,團隊讓AI接受一項包含了算術(shù)、幾何、概率和測量的數(shù)學(xué)測試,考題有 40 題,難度大約是英國高中數(shù)學(xué)的程度。
DeepMind給出的40道英國高中數(shù)學(xué)題
不過,在這40道高中難度的數(shù)學(xué)題中,擁有強大通用算法和遠(yuǎn)超人類計算能力的人工智能,卻只答對了14題,正確率只有35%,是實打?qū)嵉牟患案瘛?/strong>
值得一提的是,在AI參加測試以前,團隊已經(jīng)為其做好了充足訓(xùn)練。據(jù)DeepMind介紹,他們?yōu)锳I建立了一個包含200萬道題目的題庫,涵蓋了算術(shù)、代數(shù)、概率、微積分等各種題型。
同時,團隊也派出了循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 和Transformer兩大當(dāng)下性能最先進的模型參與測試。
為什么人工智能無法答對高中數(shù)學(xué)題呢?
原來,最主要的原因是AI“看不懂”題目。DeepMind旗下的AI雖然已經(jīng)擁有了極強的機器翻譯能力,但依然抵不住數(shù)學(xué)問題的復(fù)雜性和語言多樣性的壓力。
對AI而言,數(shù)學(xué)符號和題目本身就很難理解
對人類而言,要解決數(shù)學(xué)問題,要應(yīng)用到的不只有計算能力,還有各種各樣的認(rèn)知技能。比如理解題干,需要將文字或圖標(biāo)轉(zhuǎn)換為算術(shù)運算符。
而對于依賴大量數(shù)據(jù)分析來尋求解決問題規(guī)律的AI而言,數(shù)學(xué)語言的復(fù)雜性是一座難以逾越的高山。
其次,AI“舉一反三”的能力,也無法與人類一較高下。它只能處理一些內(nèi)部存儲的問題,無法超越已有的環(huán)境去理解新的東西。
而人類在解決數(shù)學(xué)問題時,會進行推理,從已知的公理中找到最佳策略,而在具體的運算過程中,必須利用工作記憶來完成運算。
據(jù)DeepMind研究人員總結(jié),現(xiàn)階段AI在推論的能力上,還不及人類。在解答問題時,人腦動用了多種認(rèn)知能力,包括將符號分類、演算、運用工作記憶來儲存中間值、還要運用學(xué)到的規(guī)則或定理等。
相反,AI則擅長模式比對、機器翻譯和強化式學(xué)習(xí),但彈性遠(yuǎn)不及人腦。它們不太能將事物推論到已有經(jīng)驗的環(huán)境外,更無法處理刻意亂輸入的資訊。
不過,雖然目前AI還無法當(dāng)數(shù)學(xué)老師,但他們已經(jīng)稱霸了相當(dāng)多的領(lǐng)域。除了圍棋以外,DeepMind旗下的AI又在游戲《星際爭霸2》(StarCraft II)的測試賽中,5-0橫掃世界頂尖職業(yè)選手。
責(zé)任編輯:唐秀敏
特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請及時與ts@hxnews.com聯(lián)系或者請點擊右側(cè)投訴按鈕,我們會及時反饋并處理完畢。
- 五國八支人工智能隊伍將來福州參加圍棋大賽2019-04-16
- 谷歌人工智能做高中數(shù)學(xué) 40題只對14題2019-04-15
- 認(rèn)知環(huán)境能力趕超動物 人工智能才稱得上“厲害”2019-04-15
- 最新教育資訊 頻道推薦
-
法國教育部:已在法留學(xué)生今年注冊費暫不上漲2019-04-16
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞
已有0人發(fā)表了評論