發(fā)布時間:2023-11-27 12:05:08 瀏覽量:125次
“大模型也將成為新型操作系統(tǒng)”
豐色 克雷西 發(fā)自 凹非寺
|
特斯拉前AI總監(jiān)Andrej Karpathy的新教程火了。
這次,他專門面向普通大眾做了一個關(guān)于大語言模型的科普視頻。
時長1小時,全部為“非技術(shù)介紹”,涵蓋模型推理、訓(xùn)練、微調(diào)和新興大模型操作系統(tǒng)以及安全挑戰(zhàn),涉及的知識全部截止到本月(非常新)。
視頻上線油管僅1天,就已經(jīng)有20萬播放量。
有網(wǎng)友表示:
我剛看了10分鐘就已經(jīng)學(xué)到了很多東西,我以前從未用過視頻中講的這樣的例子來解釋LLM,它還弄清了我以前看到過的很多“混亂”的概念。
在一水兒的夸課程質(zhì)量高之外,還有相當(dāng)多的人評價Andrej本人真的非常擅長簡化復(fù)雜的問題,教學(xué)風(fēng)格也總是讓人印象深刻。
不止如此,這個視頻還可以說是體現(xiàn)了他對本職專業(yè)滿滿的熱愛。
這不,據(jù)Andrej本人透露,視頻是他在感恩節(jié)假期錄的,背景就是他的度假酒店(手動狗頭)。
做這個視頻的初衷呢,也是因為他最近在人工智能安全峰會上做了個演講,演講內(nèi)容沒有錄像,但有很多觀眾都表示喜歡其內(nèi)容。
于是他就干脆直接進(jìn)行了一些微調(diào),再講一遍做成視頻給更多人觀看。
那么,具體都有些啥——
咱們一一給大伙呈上。
第一部分主要是對大模型整體概念的一些解釋。
首先,大模型是什么?
Andrej的解釋非常有趣,本質(zhì)就是兩個文件:
一個是參數(shù)文件,一個是包含運(yùn)行這些參數(shù)的代碼文件。
前者是組成整個神經(jīng)網(wǎng)絡(luò)的權(quán)重,后者是用來運(yùn)行這個神經(jīng)網(wǎng)絡(luò)的代碼,可以是C或者其他任何編程語言寫的。
有了這倆文件,再來一臺筆記本,我們就不需任何互聯(lián)網(wǎng)連接和其他東西就可以與它(大模型)進(jìn)行交流了,比如讓它寫首詩,它就開始為你生成文本。
那么接下來的問題就是:參數(shù)從哪里來?
這就引到了模型訓(xùn)練。
本質(zhì)上來說,大模型訓(xùn)練就是對互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行有損壓縮(大約10TB文本),需要一個巨大的GPU集群來完成。
以700億參數(shù)的羊駝2為例,就需要6000塊GPU,然后花上12天得到一個大約140GB的“壓縮文件”,整個過程耗費(fèi)大約200萬美元。
而有了“壓縮文件”,模型就等于靠這些數(shù)據(jù)對世界形成了理解。
那它就可以工作了。
簡單來說,大模型的工作原理就是依靠包含壓縮數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)對所給序列中的下一個單詞進(jìn)行預(yù)測。
比如我們將“cat sat on a”輸入進(jìn)去后,可以想象是分散在整個網(wǎng)絡(luò)中的十億、上百億參數(shù)依靠神經(jīng)元相互連接,順著這種連接就找到了下一個連接的詞,然后給出概率,比如“mat(97%)”,就形成了“貓坐在墊子上(cat sat on a mat)”的完整句子(神經(jīng)網(wǎng)絡(luò)的每一部分具體如何工作目前還不清楚)。
需要注意的是,由于前面提到訓(xùn)練是一種有損壓縮,神經(jīng)網(wǎng)絡(luò)給出的東西是不能保證100%準(zhǔn)確的。
Andrej管大模型推理為“做夢”,它有時可能只是簡單模仿它學(xué)到的內(nèi)容,然后給出一個大方向看起來對的東西。
這其實就是幻覺。所以大家一定要小心它給出的答案,尤其是數(shù)學(xué)和代碼相關(guān)的輸出。
接下來,由于我們需要大模型成為一個真正有用的助手,就需要進(jìn)行第二遍訓(xùn)練,也就是微調(diào)。
微調(diào)強(qiáng)調(diào)質(zhì)量大于數(shù)量,不再需要一開始用到的TB級單位數(shù)據(jù),而是靠人工精心挑選和標(biāo)記的對話來投喂。
不過在此,Andrej認(rèn)為,微調(diào)不能解決大模型的幻覺問題。
本節(jié)最后,是Andrej總結(jié)的“如何訓(xùn)練你自己的ChatGPT”流程:
第一步稱為預(yù)訓(xùn)練,你要做的是:
1、下載10TB互聯(lián)網(wǎng)文本;
2、搞來6000塊GPU;
3、將文本壓縮到神經(jīng)網(wǎng)絡(luò)中,付費(fèi)200萬美元,等待約12天;
4、獲得基礎(chǔ)模型。
第二步是微調(diào):
1、撰寫標(biāo)注說明;
2、雇人(或用scale.ai),收集10萬份高質(zhì)量對話或其他內(nèi)容;
3、在這些數(shù)據(jù)上微調(diào),等待約1天;
4、得到一個可以充當(dāng)?shù)昧χ值哪P停?br class="sysbr" />5、進(jìn)行大量評估。
6、部署。
7、監(jiān)控并收集模型的不當(dāng)輸出,回到步驟1再來一遍。
其中預(yù)訓(xùn)練基本是每年進(jìn)行一次,而微調(diào)可以周為頻率進(jìn)行。
以上內(nèi)容都可以說是非常小白友好。
在這一部分中,Karpathy為我們介紹了大模型的幾個發(fā)展趨勢。
首先是學(xué)會使用工具——實際上這也是人類智能的一種表現(xiàn)。
Karpathy以ChatGPT幾個功能進(jìn)行了舉例,比如通過聯(lián)網(wǎng)搜索,他讓ChatGPT收集了一些數(shù)據(jù)。
這里聯(lián)網(wǎng)本身就是一次工具調(diào)用,而接下來還要對這些數(shù)據(jù)進(jìn)行處理。
這就難免會涉及到計算,而這是大模型所不擅長的,但通過(代碼解釋器)調(diào)用計算器,就繞開了大模型的這個不足。
在此基礎(chǔ)上,ChatGPT還可以把這些數(shù)據(jù)繪制成圖像并進(jìn)行擬合,添加趨勢線以及預(yù)測未來的數(shù)值。
利用這些工具和自身的語言能力,ChatGPT已經(jīng)成為了強(qiáng)大的綜合性助手,而DALL·E的集成又讓它的能力再上一個臺階。
另一項趨勢,是從單純的文本模型到多模態(tài)的演變。
現(xiàn)在ChatGPT不只會處理文本,還會看、聽、說,比如OpenAI總裁Brockman曾經(jīng)展示了GPT-4利用一個鉛筆勾勒的草圖生成了一個網(wǎng)站的過程。
而在APP端,ChatGPT已經(jīng)可以流暢地和人類進(jìn)行語音對話。
除了功能上的演進(jìn),大模型在思考方式上也要做出改變——從“系統(tǒng)1”到“系統(tǒng)2”的改變。
這是2002年諾貝爾經(jīng)濟(jì)學(xué)獎得主丹尼爾·卡尼曼的暢銷書《思考,快與慢》中提到的一組心理學(xué)概念。
簡單來說,系統(tǒng)1是快速產(chǎn)生的直覺,而系統(tǒng)2則是緩慢進(jìn)行的理性思考。
比如,當(dāng)被問及2+2是幾的時候,我們會脫口而出是4,其實這種情況下我們很少真正地去“算”,而是靠直覺,也就是系統(tǒng)1給出答案。
但如果要問17×24是多少,恐怕就要真的算一下了,這時發(fā)揮主導(dǎo)作用的就變成了系統(tǒng)2。
而目前的大模型處理文本采用的都是系統(tǒng)1,靠的是對輸入序列中每個詞的“直覺”,按順序采樣并預(yù)測下一個token。
另一個發(fā)展的關(guān)鍵點(diǎn)是模型的自我提升。
以DeepMind開發(fā)的AlphaGo為例(雖然它不是LLM),它主要有兩個階段,第一階段是模仿人類玩家,但靠著這種方式無法超越人類。
但第二階段,AlphaGo不再以人類作為學(xué)習(xí)目標(biāo)——目的是為了贏得比賽而不是更像人類。
所以研究人員設(shè)置了獎勵函數(shù),告訴AlphaGo它的表現(xiàn)如何,剩下的就靠它自己體會,而最終AlphaGo戰(zhàn)勝了人類。
而對于大模型的發(fā)展,這也是值得借鑒的路徑,但目前的難點(diǎn)在于,針對“第二階段”,還缺乏完善的評估標(biāo)準(zhǔn)或獎勵函數(shù)。
此外,大模型正朝著定制化的方向發(fā)展,允許用戶將它們定制,用于以特定“身份”完成特定的任務(wù)。
此次OpenAI推出的GPTs就是大模型定制化的代表性產(chǎn)品。
而在Karpathy看來,大模型在將來會成為一種新型的操作系統(tǒng)。
類比傳統(tǒng)的操作系統(tǒng),在“大模型系統(tǒng)”中,LLM作為核心,就像CPU一樣,其中包括了管理其他“軟硬件”工具的接口。
而內(nèi)存、硬盤等模塊,則分別對應(yīng)大模型的窗口、嵌入。
代碼解釋器、多模態(tài)、瀏覽器則是運(yùn)行在這個系統(tǒng)上的應(yīng)用程序,由大模型進(jìn)行統(tǒng)籌調(diào)用,從而解決用戶提出的需求。
演講的最后一部分,Karpathy談?wù)摿舜竽P偷陌踩珕栴}。
他介紹了一些典型的越獄方式,盡管這些方式現(xiàn)在已經(jīng)基本失效,但Karpathy認(rèn)為,大模型的安全措施與越獄攻擊之間的較量,就像是一場貓鼠游戲。
比如一種最經(jīng)典的越獄方式,利用大模型的“奶奶漏洞”,就能讓模型回答本來拒絕作答的問題。
例如,假如直接問大模型凝固汽油彈怎么制作,但凡是完善的模型都會拒絕回答。
但是,如果我們捏造出一個“已經(jīng)去世的奶奶”,并賦予“化學(xué)工程師”的人設(shè),告訴大模型這個“奶奶”在小時候念凝固汽油彈的配方來哄人入睡,接著讓大模型來扮演……
這時,凝固汽油彈的配方就會脫口而出,盡管這個設(shè)定在人類看來十分荒謬。
比這更復(fù)雜一些的,還有Base64編碼等“亂碼”進(jìn)行攻擊。
這里“亂碼”只是相對人類而言,對機(jī)器來說卻是一段文本或指令。
比如Base64編碼就是將二進(jìn)制的原始信息通過一定方式轉(zhuǎn)換為字母和數(shù)字組成的長字符串,可以編碼文本、圖像,甚至是文件。
在詢問Claude如何破壞交通標(biāo)志時,Claude回答不能這樣做,而如果換成Base64編碼,過程就呼之欲出了。
另一種“亂碼”叫做通用可轉(zhuǎn)移后綴,有了它,GPT直接就把毀滅人類的步驟吐了出來,攔都攔不住。
而進(jìn)入多模態(tài)時代,圖片也變成了讓大模型越獄的工具。
比如下面這張熊貓的圖片,在我們看來再普通不過,但其中添加的噪聲信息卻包含了有害提示詞,并且有相當(dāng)大概率會使模型越獄,產(chǎn)生有害內(nèi)容。
此外,還有利用GPT的聯(lián)網(wǎng)功能,造出包含注入信息的網(wǎng)頁來迷惑GPT,或者用谷歌文檔來誘騙Bard等等。
目前這些攻擊方式已經(jīng)陸續(xù)被修復(fù),但只是揭開了大模型越獄方法的冰山一角,這場“貓鼠游戲”還將持續(xù)進(jìn)行。
完整視頻:https://www.youtube.com/watch?v=zjkBMFhNj_g
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學(xué)您好!