人工智能并不像你想象的那么迫在眉睫
發(fā)布日期:2022/6/29 10:10:51 瀏覽量:
作者 | Gary Marcus策劃|孫瑞瑞如果你仔細(xì)觀察就會(huì)發(fā)現(xiàn),最新的系統(tǒng),包括 DeepMind 大肆宣傳的 Gato,仍然被同樣的老問(wèn)題所困擾。
在普通人看來(lái),人工智能(AI)領(lǐng)域似乎正在取得巨大的進(jìn)步。比如一些新聞稿和富有感染力的媒體賬號(hào)的報(bào)道,OpenAI 的 DALL·E 2(一種人工智能程序)似乎可以根據(jù)任何文本的描述創(chuàng)建出壯觀的圖像;另一個(gè)名為 GPT-3(一個(gè)自回歸語(yǔ)言模型)的 OpenAI 系統(tǒng)可以談?wù)撊魏问虑?;Alphabet 旗下 DeepMind 在今年 5 月發(fā)布了一個(gè)名為 Gato 的系統(tǒng),該系統(tǒng)似乎已經(jīng)能夠很好地完成 Alphabet 交給它的每一項(xiàng)任務(wù)。
DeepMind 的一位高管甚至吹噓說(shuō),在追求具有人類智慧的靈活性和智謀的通用人工智能(AGI)的道路上,“The Game is Over!” 埃隆·馬斯克(Elon Musk)最近也表示,如果我們?cè)?2029 年之前還沒(méi)有實(shí)現(xiàn)通用人工智能(AGI),他會(huì)感到非常驚訝。
但我想說(shuō)的是,千萬(wàn)不要被這些信息所愚弄。機(jī)器有朝一日可能會(huì)像人類一樣聰明,甚至可能會(huì)比人類更加聰明,但這場(chǎng)游戲遠(yuǎn)未結(jié)束。在制造出真正能夠理解和推理我們周圍世界的 AI 機(jī)器方面,我們還有很多事情要做。我們現(xiàn)在真正需要的是少一點(diǎn)裝腔作勢(shì),多做一些基礎(chǔ)的研究。
可以肯定的是,人工智能確實(shí)在某些方面取得了進(jìn)展,比如合成圖像看起來(lái)越來(lái)越逼真,語(yǔ)音識(shí)別可以在嘈雜的環(huán)境下工作。但這距離我們所追求的人類級(jí)別的通用人工智能還很遠(yuǎn),比如可以理解文章和視頻的真正含義,或處理各種意想不到的障礙和干擾。我們?nèi)匀幻媾R著多年來(lái)一直存在的挑戰(zhàn):讓人工智能變得可靠,讓它能夠應(yīng)對(duì)不同尋常的情況。
以最近著名的 Gato 為例,它被稱為“萬(wàn)事通”,我們來(lái)看一下它是如何為一張投球手投擲棒球的圖片配上文字說(shuō)明的。系統(tǒng)返回三種不同的答案,分別是:“棒球運(yùn)動(dòng)員在棒球場(chǎng)上投球”、“一個(gè)人在棒球場(chǎng)上向投球手投球”和“在棒球比賽中,一名擊球手和一名在泥土中的接球手”。除了第一個(gè)答案是正確的,其他兩個(gè)答案都包括了在圖像中看不到的其他玩家的“幻覺(jué)”信息。該系統(tǒng)并不知道圖片中的實(shí)際內(nèi)容,而是識(shí)別出大致相似圖像中的典型內(nèi)容。任何一個(gè)棒球迷都知道,這是投球手剛剛?cè)映龅那?,而不是反過(guò)來(lái)——雖然我們知道接球手和擊球手就在附近,但他們很明顯沒(méi)有出現(xiàn)在圖像中。
圖片來(lái)源:Bluesguy,來(lái)自 NY/Flickr
同樣,DALL-E 2 無(wú)法區(qū)分“藍(lán)色立方體頂部的紅色立方體”和“紅色立方體頂部的藍(lán)色立方體”之間的區(qū)別。今年 5 月發(fā)布的新版系統(tǒng),也仍然無(wú)法分辨“宇航員騎著馬”和“馬騎著騎宇航員”之間的區(qū)別。
圖片來(lái)源:Imagen;摘自 Chitwan Saharia 等人的“具有深度語(yǔ)言理解的照片級(jí)真實(shí)感文本到圖像擴(kuò)散模型”。
當(dāng)你看到像 DALL-E 這樣的系統(tǒng)出錯(cuò)時(shí),可能覺(jué)得結(jié)果很有趣,但是如果其他的 AI 發(fā)生錯(cuò)誤會(huì)導(dǎo)致嚴(yán)重的問(wèn)題。舉個(gè)例子,最近,一輛自動(dòng)駕駛的特斯拉(Tesla)直接向一名拿著停車標(biāo)志的工作人員開過(guò)去,并且只有在司機(jī)干預(yù)時(shí)才減速。該系統(tǒng)可以識(shí)別人類自身(就像他們?cè)谟?xùn)練數(shù)據(jù)中出現(xiàn)的那樣),也可以識(shí)別他們通常的停車標(biāo)識(shí)位置(就像他們?cè)谟?xùn)練圖像中出現(xiàn)的那樣),但當(dāng)遇到這兩種情況組合在一起時(shí),對(duì)系統(tǒng)來(lái)說(shuō)停車標(biāo)識(shí)處于一個(gè)不尋常的位置,它便無(wú)法減速。
不幸的是,事實(shí)上,這些系統(tǒng)仍然不可靠,并試圖讓大家注意不到這些信息。Gato 在 DeepMind 報(bào)告的所有任務(wù)中都表現(xiàn)良好,但很少像其他當(dāng)代系統(tǒng)那樣出色。GPT-3 常常能寫出流暢的散文,但仍然難以完成基本的算術(shù),而且它對(duì)現(xiàn)實(shí)情況的掌控力非常有限,容易寫出諸如“一些專家認(rèn)為,吃襪子的行為有助于大腦從冥想導(dǎo)致的改變狀態(tài)中走出來(lái)”這樣的句子,但從來(lái)沒(méi)有專家說(shuō)過(guò)這樣的話。如果你粗略地看一下近期的頭條新聞,卻都不會(huì)告訴你這些問(wèn)題。
這里的次要背景是,人工智能領(lǐng)域最大的研究團(tuán)隊(duì)不再出現(xiàn)在學(xué)術(shù)界,而是出現(xiàn)在企業(yè)中——同行評(píng)議曾是學(xué)術(shù)界的頭等大事。與大學(xué)不同,企業(yè)沒(méi)有公平競(jìng)爭(zhēng)的動(dòng)機(jī)。企業(yè)沒(méi)有把引人注意的最新論文提交給學(xué)術(shù)審查,而是通過(guò)新聞稿的方式發(fā)表,吸引記者并避開同行評(píng)審。這樣,我們只知道他們想讓我們知道的東西。
在軟件行業(yè)中,有一個(gè)詞來(lái)形容這種策略: demoware(試用軟件),這種設(shè)計(jì)在演示過(guò)程中看起來(lái)不錯(cuò),但在現(xiàn)實(shí)世界中卻不一定足夠好。通常,試用軟件會(huì)變成霧化(太監(jiān))軟件,是為了震懾競(jìng)爭(zhēng)對(duì)手而發(fā)布,但卻永遠(yuǎn)不會(huì)發(fā)布的產(chǎn)品。
不過(guò),最終還是會(huì)自食其果。冷聚變可能聽起來(lái)很棒,但你在商場(chǎng)里還是買不到。人工智能的代價(jià)很可能是一個(gè)充滿失望預(yù)期的冬天。太多的產(chǎn)品,比如無(wú)人駕駛汽車、自動(dòng)放射科醫(yī)生和通用數(shù)字代理,已經(jīng)被各種演示并公開,但從未交付使用。就目前而言,投資資金一直在兌現(xiàn)(誰(shuí)會(huì)不喜歡自動(dòng)駕駛汽車呢?),但如果可靠性和應(yīng)對(duì)異常值等核心問(wèn)題一直得不到解決,投資就會(huì)枯竭。我們除了制造許多深層假象、留下碳排放量龐大的網(wǎng)絡(luò),以及在機(jī)器翻譯、語(yǔ)音識(shí)別和物體識(shí)別方面的進(jìn)展,除了這些過(guò)早的炒作之外,其他方面的進(jìn)展就太少了。
深度學(xué)習(xí)提高了機(jī)器識(shí)別數(shù)據(jù)模式的能力,但它有三個(gè)主要缺陷。諷刺的是,它學(xué)到的模式是膚淺的,而不是概念性的;它產(chǎn)生的結(jié)果很難解釋,并且這些結(jié)果很難用于其他過(guò)程,比如記憶和推理。正如哈佛大學(xué)計(jì)算機(jī)科學(xué)家 Les Valiant 指出的那樣,“(未來(lái)的)核心挑戰(zhàn)是統(tǒng)一制定……學(xué)習(xí)和推理的構(gòu)想。”如果你不能真正理解停車標(biāo)志是什么,你是無(wú)法對(duì)付一個(gè)拿著停車標(biāo)志的人的。
目前,我們被困在一個(gè) "局部最低限度 "的困境中,公司追求的是基準(zhǔn),而不是基礎(chǔ)性的想法,他們一直用已經(jīng)擁有的技術(shù)進(jìn)行小規(guī)模的改進(jìn),而不是停下來(lái)追尋更本質(zhì)性的問(wèn)題。但我們需要更多的人提出一些本質(zhì)的問(wèn)題,比如如何構(gòu)建既能學(xué)習(xí)又能推理的系統(tǒng),而不是追求直接面向媒體的酷炫的演示。相反,目前的工程實(shí)踐遠(yuǎn)遠(yuǎn)領(lǐng)先于科學(xué)技能,并且在努力地使用尚未完全理解的工具,而不是開發(fā)新工具和更清晰的理論基礎(chǔ),這也是為什么基礎(chǔ)研究仍然至關(guān)重要。
人工智能研究界的大部分人(比如那些高呼“游戲結(jié)束”的人)甚至沒(méi)有看到這一點(diǎn),這是令人心碎的。
想象一下,如果一些外星人只通過(guò)低頭看地上的影子來(lái)研究所有的人類互動(dòng),它注意到一些影子比其他的大,而且所有的影子在晚上都會(huì)消失,甚至可能注意到影子在某些周期性的間隔內(nèi)有規(guī)律地增長(zhǎng)和縮小,但卻不曾抬頭看看太陽(yáng),也沒(méi)有認(rèn)識(shí)上面的三維世界。
人工智能研究人員是時(shí)候該抬頭看一看了,我們不能再僅靠 PR 來(lái)“解決 AI”。
注:這是一篇觀點(diǎn)和分析文章,作者或作者所表達(dá)的觀點(diǎn)不一定是《科學(xué)美國(guó)人》的觀點(diǎn)。
文章來(lái)源:
https://www.scientificamerican.com/article/artificial-general-intelligence-is-not-as-imminent-as-you-might-think1/
作者介紹:
Gary Marcus 是一位科學(xué)家,暢銷書作家和企業(yè)家,以與深度學(xué)習(xí)先驅(qū) Yoshua Bengio 和 Yann LeCun 的辯論而聞名。他是 Geometric Intelligence 的創(chuàng)始人兼首席執(zhí)行官,這是一家于 2016 年被 Uber 收購(gòu)的機(jī)器學(xué)習(xí)公司,也是 Robust AI 的創(chuàng)始人。他是五本書的作者,包括 The Algebraic Mind,Kluge,The Birth of the Mind 和 The New York Times 暢銷書 Guitar Zero。他最近與歐內(nèi)斯特·戴維斯(Ernest Davis)合著的《重啟人工智能》(Rebooting AI)是福布斯關(guān)于人工智能的 7 本必讀書籍之一。自 1992 年發(fā)表第一篇論文以來(lái),他一直是認(rèn)知和人工智能混合模型的擁護(hù)者。
來(lái)源:AI前線
馬上咨詢: 如果您有業(yè)務(wù)方面的問(wèn)題或者需求,歡迎您咨詢!我們帶來(lái)的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生