GPT之父、OpenAI首席科學(xué)家llya,在斯坦福大學(xué)深度訪談的10個核心觀點(diǎn)
發(fā)布日期:2023/5/16 17:36:33 瀏覽量:
GPT之父,OpenAI首席科學(xué)家Ilya,2015年離開谷歌成為當(dāng)時新成立的OpenAI的技術(shù)主管。
llya于2015年入選MIT科技評論35歲以下35人榜單,于2022年當(dāng)選皇家學(xué)會院士。
近期llya連線斯坦福大學(xué)做了一小時的深度訪談,談到AI意識、開源與閉源、OpenAI商業(yè)化等諸多話題,本文是其核心觀點(diǎn)的整理,有刪減,供參考。
# 01
大語言模型的工作原理類似生物神經(jīng)網(wǎng)絡(luò)
人腦是我們在世界上最好的智能例子。我們知道人腦由大量神經(jīng)元組成,非常之多的神經(jīng)元。神經(jīng)科學(xué)家研究神經(jīng)元幾十年,試圖精確理解它們的工作原理。
盡管我們的生物神經(jīng)元的運(yùn)作仍然神秘,但最早的深度學(xué)習(xí)研究者在20世紀(jì)40年代提出了一個相當(dāng)大膽的推測:人工神經(jīng)元(我們在人工神經(jīng)網(wǎng)絡(luò)中使用的)與生物神經(jīng)元有點(diǎn)相似。這是一個假設(shè)。我們現(xiàn)在可以采用這個假設(shè)。
深度學(xué)習(xí)先驅(qū)取得的一項非常重要的突破就是發(fā)現(xiàn)了反向傳播算法。這是一條數(shù)學(xué)方程,說明人工神經(jīng)網(wǎng)絡(luò)應(yīng)該如何學(xué)習(xí)。它提供了一種方法,使用大型計算機(jī)實現(xiàn)這個神經(jīng)網(wǎng)絡(luò)的代碼,然后有一條方程可以編程,告訴我們這個神經(jīng)網(wǎng)絡(luò)應(yīng)該如何調(diào)整其連接以從經(jīng)驗中學(xué)習(xí)。
深度學(xué)習(xí)的大部分進(jìn)展歸結(jié)為:我們可以在大型計算機(jī)上構(gòu)建這些神經(jīng)網(wǎng)絡(luò),并可以在某些數(shù)據(jù)上訓(xùn)練它們,使這些大型神經(jīng)網(wǎng)絡(luò)做數(shù)據(jù)要求它們做的任何事情。
大型語言模型的想法是:如果有一個非常大的神經(jīng)網(wǎng)絡(luò),可能現(xiàn)在離人腦不遠(yuǎn)了,我們可以訓(xùn)練它來從文本中的前面幾個單詞猜測下一個詞。這就是大型語言模型的概念:訓(xùn)練一個大型神經(jīng)網(wǎng)絡(luò)來從先前的詞猜測文本中的下一個詞,你希望神經(jīng)網(wǎng)絡(luò)盡可能準(zhǔn)確地猜測出下一個詞。
回到我們最初的假設(shè),人工神經(jīng)元與生物神經(jīng)元可能沒太大不同。所以,如果有一個像這樣的大型神經(jīng)網(wǎng)絡(luò),可以很好的猜測下一個詞,那么它可能與人們說話時所做的事情沒什么不同。這就是我們得到的結(jié)果。
現(xiàn)在,當(dāng)你與這樣的神經(jīng)網(wǎng)絡(luò)對話時,它具有極佳的對下一個詞的理解,它可以縮小范圍,它看不到未來,但它可以根據(jù)其理解正確縮小可能性范圍。能夠非常準(zhǔn)確地預(yù)測下一個詞,這是AI理解運(yùn)作的方式。
# 02
讓機(jī)器去學(xué)習(xí)文本中的統(tǒng)計相關(guān)性,就可以把這些知識壓縮得非常好
我們正在學(xué)習(xí)一個世界模型,表面上看起來我們只是在學(xué)習(xí)文本中的統(tǒng)計相關(guān)性,但實際上,只是去學(xué)習(xí)文本中的統(tǒng)計相關(guān)性,就可以把這些知識壓縮得非常好。
神經(jīng)網(wǎng)絡(luò)所學(xué)習(xí)的是,生成文本的過程中的一些表述,這個文本實際上是這個世界的一個映射,世界在這些文字上映射出來,因此,神經(jīng)網(wǎng)絡(luò)正在學(xué)習(xí)從越來越多的角度去看待這個世界,看待人類和社會,看人們的希望,夢想,動機(jī),交互和情境。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一個壓縮的、抽象的、可用的表述。這就是正在準(zhǔn)確預(yù)測下一個詞的任務(wù)中,學(xué)習(xí)的東西,此外,你對下一個詞的預(yù)測越準(zhǔn)確,還原度越高,在這個過程中你得到的世界的分辨率就越高,所以這就是預(yù)訓(xùn)練階段的作用。
但是,這并不能讓神經(jīng)網(wǎng)絡(luò)表現(xiàn)出我們希望它能夠表現(xiàn)出的行為,你看一個語言模型,它真正要做的是回答以下問題,如果我在互聯(lián)網(wǎng)上有一些隨機(jī)的文本,它以一些前綴,一些提示開始,它將補(bǔ)全什么內(nèi)容呢?可能只是隨機(jī)地用互聯(lián)網(wǎng)上的一些文本來補(bǔ)全它,這和我想擁有一個助手是不同的,一個真實的,有幫助的,遵循某些規(guī)則的助手是需要額外訓(xùn)練的。
這就是微調(diào)和來自于人類老師的強(qiáng)化學(xué)習(xí),以及其他形式的人工智能協(xié)助可以發(fā)揮作用的地方,不僅僅是來自人類老師的強(qiáng)化學(xué)習(xí),也是來自人類和Al合作的強(qiáng)化學(xué)習(xí)。
# 03
深度學(xué)習(xí)的未來五到十年:訓(xùn)練規(guī)模見頂,垂直訓(xùn)練蓬勃發(fā)展
我預(yù)期深度學(xué)習(xí)會繼續(xù)取得進(jìn)展。有一段時間,很多進(jìn)展來自規(guī)?;?,我們在從GPT-1到GPT-3的過程中看到這一點(diǎn)最為明顯。但是事情會有一點(diǎn)變化。規(guī)?;M(jìn)展如此迅速的原因是因為人們有這些數(shù)據(jù)中心,因此,僅通過重新分配現(xiàn)有資源,就可以取得很大進(jìn)展。重分配現(xiàn)有資源不一定需要很長時間,只需要某人決定這樣做。
現(xiàn)在不同了,因為訓(xùn)練規(guī)模太大了,規(guī)?;倪M(jìn)展不會像以前那么快,因為建設(shè)數(shù)據(jù)中心需要時間。
但與此同時,我預(yù)計深度學(xué)習(xí)會從其他方面繼續(xù)取得進(jìn)展。深度學(xué)習(xí)的技術(shù)棧非常深,我預(yù)計會有許多層面的改進(jìn),結(jié)合在一起,仍然會帶來非常穩(wěn)健的進(jìn)展。我猜想可能會有新的,目前未知的深度學(xué)習(xí)屬性被發(fā)現(xiàn),這些屬性將被利用,我完全預(yù)期未來五到十年的系統(tǒng)將遠(yuǎn)遠(yuǎn)好于目前我們擁有的系統(tǒng)。但具體怎么樣,我認(rèn)為這有點(diǎn)難以回答。因為改進(jìn)可能只有一小部分重大改進(jìn),還有大量小改進(jìn),都集成在一個大型復(fù)雜的工程產(chǎn)物中。
到一定程度,我們應(yīng)該期待專業(yè)訓(xùn)練產(chǎn)生巨大影響,但是我們進(jìn)行廣義訓(xùn)練的原因僅僅是為了達(dá)到神經(jīng)網(wǎng)絡(luò)甚至能理解我們提出的問題的程度;
只有當(dāng)它有極其扎實的理解力時,我們才能進(jìn)入專業(yè)訓(xùn)練,真正從中受益。我認(rèn)為所有這些都是可能有成果的方向。
# 04
GPT很博學(xué),而人類則擅長專業(yè)研究,可以擁有從少量信息獲取深入理解的能力
直接比較我們?nèi)祟惡腿斯ど窠?jīng)網(wǎng)絡(luò)有點(diǎn)難,因為目前人類能從更少的數(shù)據(jù)中學(xué)習(xí)更多。
這就是為什么像ChatGPT這種神經(jīng)網(wǎng)絡(luò)需要如此多的數(shù)據(jù)來補(bǔ)償它們最初學(xué)習(xí)能力緩慢的原因。隨著我們訓(xùn)練這些神經(jīng)網(wǎng)絡(luò),使它們變得更好,學(xué)習(xí)能力開始出現(xiàn)。
但總的來說,人類學(xué)習(xí)的方式與這些神經(jīng)網(wǎng)絡(luò)開始的方式截然不同。例如,這些神經(jīng)網(wǎng)絡(luò)僅僅在數(shù)學(xué)或編程方面非常精通,但要達(dá)到一定的水平,比如精通微積分,需要大量的教科書,人可能只需要兩本教科書和200多個練習(xí)題就可以了。
目前,任何這樣的神經(jīng)網(wǎng)絡(luò)在知識范圍和規(guī)模方面肯定都超越人類。例如,它們在詩歌和任何話題上發(fā)言都很流暢,它們可以談?wù)摎v史事件和許多事情;但另一方面,人類可以進(jìn)行深入研究。一個專家會對某個話題有深入的理解,盡管可能只讀過少量文檔。
# 05
ChatGPT現(xiàn)在還沒有意識,但可以設(shè)計實驗去測試未來的AI 是否有意識
意識是棘手的,如何定義它?它長期以來一直難以定義,那么你如何在一個系統(tǒng)中測試它?也許有一個系統(tǒng)可以完美地運(yùn)行,完美地按你的預(yù)期運(yùn)行,但是由于某種原因,它可能并沒有自主意識。
我確實認(rèn)為有一個非常簡單的方法,有一個實驗可以驗證AI系統(tǒng)是否有意識,但我們現(xiàn)在還不能運(yùn)行。
但也許在未來,當(dāng)AI能從更少的數(shù)據(jù)中學(xué)習(xí)得非??鞎r,我們可以做如下實驗:
我們可以非常仔細(xì)地整理訓(xùn)練數(shù)據(jù),永遠(yuǎn)不會(在訓(xùn)練數(shù)據(jù)里)提到意識的任何事情,我們只會說"這里有一個球,這里有一個城堡,這里有像一個小玩具",你可以想象這種類型的數(shù)據(jù),它會非常受控,可能會有幾年的這種訓(xùn)練數(shù)據(jù)。
這樣的AI系統(tǒng)會與許多不同的教師互動,從他們那里學(xué)習(xí),非常仔細(xì),但永遠(yuǎn)不會談?wù)撘庾R,人們不會和AI談?wù)摮俗畋韺拥慕?jīng)驗概念之外的任何事情。
然后在某個時候,和這個AI坐下來,說好的,我想告訴你意識,這是人所描述但不是很清楚的現(xiàn)象,人們對此有不同的看法。
想象一下,如果AI說"天哪,我也有同樣的感覺,但我不知道如何表達(dá)",那就有意思了,這肯定是值得(研究人員)考慮的事情。
如果AI只是被訓(xùn)練來處理非常平凡的數(shù)據(jù),關(guān)于物體和移動,或者你知道的某些非常狹隘的概念。我們不提意識,但AI最終還是以我們能認(rèn)出來的方式雄辯和正確地談?wù)摚?AI擁有意識)將是令人信服的。
# 06
開源or閉源:AI能力較低時適合開源,AI能力足夠強(qiáng)大時開源則是不負(fù)責(zé)任的
我認(rèn)為AI面臨的挑戰(zhàn)是全方位的,涵蓋了許多不同的挑戰(zhàn)和危險,這些挑戰(zhàn)和危險彼此矛盾。我認(rèn)為開源與閉源是一個很好的例子。為什么開源是理想的?讓我這么說吧,開源AI有什么好處?答案是:防止AI建設(shè)者手中集中權(quán)力。
如果你生活在一個世界上,比如只有少數(shù)公司控制這種非常強(qiáng)大的技術(shù),你可能會說這是一個不理想的世界,AI應(yīng)該是開放的,任何人都可以使用AI。這是開源的論點(diǎn)。
當(dāng)然也有因為商業(yè)激勵反對開源,但還有另一個長期的論點(diǎn)也反對開源:那就是如果我們相信,AI最終會變得無與倫比的強(qiáng)大,如果我們達(dá)到一個AI如此強(qiáng)大的程度,你可以簡單地告訴它:“你能主動創(chuàng)建一個生物學(xué)研究實驗室嗎?主動完成所有的文書工作,運(yùn)營工作空間,招聘技術(shù)人員,聚合實驗,主動完成所有這些事情”。
當(dāng)AI開始變得令人難以置信的強(qiáng)大,難道這也應(yīng)該開源嗎?所以我對開源問題的立場是:我認(rèn)為可以考慮這些神經(jīng)網(wǎng)絡(luò)的能力。它們有多智能,能做多少事情。當(dāng)能力較低時,我認(rèn)為開源是一件好事,但在某個時候,(具體是哪個時候)可以辯論一下,但我會說,在某個時候,能力會變得如此巨大,以至于開源AI模型是明顯不負(fù)責(zé)任的。
在我看來,當(dāng)前AI的能力水平還不高,不至于因為安全考量而閉源模型。這種研究目前確實是競爭階段。我認(rèn)為,這些模型的能力如果繼續(xù)增強(qiáng),將有一天,安全考量會成為不開源這些模型的明顯和直接的驅(qū)動力。
# 07
非營利性組織性or營利性組織:需要合理的平衡
事實上,從某種意義上講,如果OpenAI能夠一直保持非營利狀態(tài),直到完成使命,那將是更可取的。
然而,值得指出的一點(diǎn)是,這些數(shù)據(jù)中心的成本非常高昂。我相信你讀過各種AI初創(chuàng)公司籌集的資金數(shù)額,其中的絕大部分都流向云計算提供商。為什么會這樣?原因是訓(xùn)練這些大型神經(jīng)網(wǎng)絡(luò)需要大量計算資源,這是很明顯的。
可以看到目前學(xué)術(shù)界和AI公司之間正在發(fā)生的分化。長期以來,許多十年里,人工智能領(lǐng)域的尖端研究都在大學(xué)的學(xué)術(shù)部門進(jìn)行。這一情況一直持續(xù)到2010年代中期。但在某個時候,這些項目的復(fù)雜性和成本開始變得非常高昂,大學(xué)無法與業(yè)界競爭,現(xiàn)在大學(xué)需要找到其他方式來獲得(資源)。
在這種背景下,非營利組織的問題是,向非營利組織捐款的人永遠(yuǎn)不會看到任何回報,這是真正的捐贈。不管你信不信,讓人向非營利組織捐款實際上要困難得多。
所以,我們在想,解決方案是什么,可以很好地采取行動?所以我們想出了一個我所知世界上所有公司結(jié)構(gòu)中獨(dú)一無二的主意。OpenAI 的公司結(jié)構(gòu)是絕對獨(dú)一無二的。OpenAI 不是一家營利性公司,它是一家限制利潤的公司。我想解釋這意味著什么。這意味著OpenAI的股權(quán)更像債券而不是正常公司的股權(quán)。債券的主要特征是一旦支付就消失了。換句話說,OpenAI對其投資者的義務(wù)是有限的,而不是正常公司對其投資者的無限義務(wù)。
薩姆·奧爾特曼沒有股權(quán),但其他創(chuàng)始人有。但也是有限制的。它與正常的創(chuàng)業(yè)公司股權(quán)不同,但也有一定相似之處,比如越早加入公司,限制越高,因為需要更高的限制來吸引初期投資者。隨著公司繼續(xù)成功,限制會降低。
這為什么重要?這是因為這意味著當(dāng)公司向投資者和員工支付完所有義務(wù)后,OpenAI會再次成為一家非營利組織。你可能會說這完全瘋狂,這不會改變?nèi)魏问虑?。但值得考慮的是我們期望什么,更重要的是考慮我們認(rèn)為AI將成為什么。
我認(rèn)為OpenAI實現(xiàn)其使命,向投資者和員工支付義務(wù),在計算機(jī)變得更強(qiáng)大的時期成為非營利組織,這時經(jīng)濟(jì)動蕩會很大,這種轉(zhuǎn)變將非常有益,這并不令人難以置信。這是限制利潤與非營利的答案。
# 08
AI需要走向有明智政府監(jiān)管的世界,但是并不意味著要“放慢進(jìn)步”,而是“讓進(jìn)步更合理”
的確,AI將變得極其強(qiáng)大和極其變革性。
我確實認(rèn)為,我們將要走向一個有明智政府監(jiān)管的世界,這里有幾個維度。我們希望生活在一個有明確規(guī)則的世界,例如訓(xùn)練更強(qiáng)大的神經(jīng)網(wǎng)絡(luò)。我們希望對這些神經(jīng)網(wǎng)絡(luò)今天能做什么,以及我們預(yù)期在一年內(nèi)或訓(xùn)練完成時能做什么進(jìn)行仔細(xì)的評估和預(yù)測。
理性地講,我不會用“放慢進(jìn)步”這一詞,我會用“使進(jìn)步合理”來描述。這樣,在每一步中,我們都做了功課,事實上,我們可以作出一個可信的說法,即“我們訓(xùn)練的神經(jīng)網(wǎng)絡(luò)系統(tǒng)正在做這件事,這里是所有的步驟,它已經(jīng)被驗證或認(rèn)證?!蔽艺J(rèn)為這就是我們要走向的世界,這也是正確的。
# 09
OpenAI的KPI,首要是技術(shù)進(jìn)步
最神圣的關(guān)鍵業(yè)績指標(biāo),我認(rèn)為這也是不同人會給你不同答案的問題類型。但如果我真的要縮小范圍,我會說,有幾個真正重要的KPI,其一無疑是技術(shù)進(jìn)步。
我們做了好研究嗎?我們對我們的系統(tǒng)有更好的理解嗎?我們能更好地訓(xùn)練它們嗎?我們能更好地控制它們嗎?我們的研究計劃得到很好的執(zhí)行嗎?我們的安全計劃得到很好的執(zhí)行嗎?我們對此多么滿意?我會說這將是我對主要KPI的描述,做一項很好的技術(shù)工作。
當(dāng)然,還有產(chǎn)品方面的事情,我認(rèn)為這很酷,但我會說,核心技術(shù)才是OpenAI的心臟,關(guān)于這項技術(shù)的開發(fā),控制和操縱。
# 10
給年輕人的建議:相信直覺,做獨(dú)特的自己
我認(rèn)為,一般來說,最好利用自己獨(dú)特的傾向。你知道,每一個人,如果你想想人可能擁有的一系列傾向、技能或天賦的組合,這樣的組合非常罕見。不管你選擇何種方向,利用這一點(diǎn)都是非常好的主意。
關(guān)于人工智能研究,我可以說一些東西,但是你要傾向于你自己的想法,真正問自己你能做什么,是否有些對你來說完全明顯的東西,讓你覺得為什么其他人都沒有理解。如果你有這種感覺,這是一個好跡象,這意味著你可能(可以做些事情) 我們要傾向于這一點(diǎn),探索它,看看你的直覺是真是假。
我的導(dǎo)師 Hinton說過這么一件事,我真的很喜歡,他說你應(yīng)該信任你的直覺,因為如果你的直覺很好,你會走得很遠(yuǎn),如果不好,那也沒辦法。
至于創(chuàng)業(yè)來說,我覺得這是一個你的獨(dú)特視角是否更有價值甚至至關(guān)重要的地方。也許我會解釋為什么我認(rèn)為在研究中(這種獨(dú)特視角)更有價值,在研究中它也非常有價值;但是在企業(yè)中,需要利用你獨(dú)特的生活經(jīng)歷,你看到了哪些東西,看到哪些技術(shù),看看你是否可以聚焦在某個方面,然后真的去做。
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生