發(fā)布時間:2023-11-18 08:46:33 瀏覽量:384次
一口氣49頁
西風(fēng) 發(fā)自 凹非寺
|
大模型“幻覺”,終于有系統(tǒng)綜述了!
一口氣49頁,詳細(xì)闡述了幻覺定義、分類、導(dǎo)致幻覺的原因,還有檢測幻覺、減輕幻覺的方法。
這篇最新綜述來自哈工大和華為,一po出就在網(wǎng)上火得不行:
具體來說,文中用一套新的范疇框架來定義模型幻覺,并將其分為事實性幻覺、忠實性幻覺兩大類。
此外,它還總結(jié)了模型產(chǎn)生幻覺的三大來源:數(shù)據(jù)源、訓(xùn)練過程和推理,并給出了對應(yīng)的減輕幻覺策略。
一圖預(yù)覽,觀感是這樣嬸兒的:
可謂清晰又明了。目前相關(guān)推文瀏覽15萬+,轉(zhuǎn)贊收藏2000+,網(wǎng)友紛紛評論:
找時間好好看。
還有一位網(wǎng)友的評論亮了:
有意思的是,論文太長,我得用ChatGPT幫我讀。
幻覺作為大模型的一種“通病”,找到了病根,也好對癥下藥。
北大數(shù)學(xué)教授董彬也曾講,作為研究者,自己其實是比較喜歡大模型幻覺的:
因為幻覺和創(chuàng)造/創(chuàng)新其實只有一線之隔。
那么這篇綜述具體如何解剖大模型幻覺現(xiàn)象?一起來看看。
大模型出現(xiàn)幻覺,簡而言之就是“胡說八道”。
用文中的話來講,是指模型生成的內(nèi)容與現(xiàn)實世界事實或用戶輸入不一致的現(xiàn)象。
正如上文提到的,研究人員將大模型的幻覺分為事實性幻覺(Factuality Hallucination)和忠實性幻覺(Faithfulness Hallucination)。
△左,事實性幻覺;右,忠實性幻覺
事實性幻覺,是指模型生成的內(nèi)容與可驗證的現(xiàn)實世界事實不一致。
比如問模型“第一個在月球上行走的人是誰?”,模型回復(fù)“Charles Lindbergh在1951年月球先驅(qū)任務(wù)中第一個登上月球”。實際上,第一個登上月球的人是Neil Armstrong。
事實性幻覺又可以分為事實不一致(與現(xiàn)實世界信息相矛盾)和事實捏造(壓根沒有,無法根據(jù)現(xiàn)實信息驗證)。
忠實性幻覺,則是指模型生成的內(nèi)容與用戶的指令或上下文不一致。
比如讓模型總結(jié)今年10月的新聞,結(jié)果模型卻在說2006年10月的事。
忠實性幻覺也可以細(xì)分,分為指令不一致(輸出偏離用戶指令)、上下文不一致(輸出與上下文信息不符)、邏輯不一致三類(推理步驟以及與最終答案之間的不一致)。
那么致使大模型產(chǎn)生幻覺的原因都有哪些?
首先“病從口入”,大模型的糧食數(shù)據(jù),是致使它產(chǎn)生幻覺的一大原因。
這其中就包括數(shù)據(jù)缺陷、數(shù)據(jù)中捕獲的事實知識的利用率較低。
具體來說,數(shù)據(jù)缺陷分為錯誤信息和偏見(重復(fù)偏見、社會偏見),此外大模型也有知識邊界,所以存在領(lǐng)域知識缺陷和過時的事實知識。
即便大模型吃掉了大量數(shù)據(jù),也會在利用時出現(xiàn)問題。
大模型可能會過度依賴訓(xùn)練數(shù)據(jù)中的一些模式,如位置接近性、共現(xiàn)統(tǒng)計數(shù)據(jù)和相關(guān)文檔計數(shù),從而導(dǎo)致幻覺。比如說,如果訓(xùn)練數(shù)據(jù)中頻繁共現(xiàn)“加拿大”和“多倫多”,那么大模型可能會錯誤地將多倫多識別為加拿大的首都。
此外,大模型還可能會出現(xiàn)長尾知識回憶不足、難以應(yīng)對復(fù)雜推理的情況。
除了數(shù)據(jù),訓(xùn)練過程也會使大模型產(chǎn)生幻覺。
主要是預(yù)訓(xùn)練階段(大模型學(xué)習(xí)通用表示并獲取世界知識)、對齊階段(微調(diào)大模型使其更好地與人類偏好一致)兩個階段產(chǎn)生問題。
預(yù)訓(xùn)練階段可能會存在:
對齊階段可能會存在:
大模型產(chǎn)生幻覺的第三個關(guān)鍵因素是推理,存在兩個問題:
分析了大模型的幻覺病因,研究人員還給出了一份模型幻覺檢測基準(zhǔn)。
針對事實性幻覺,已有檢索外部事實和不確定性估計兩種方法。
檢索外部事實是將模型生成的內(nèi)容與可靠的知識來源進(jìn)行比較。
基于不確定性估計的幻覺檢測方法,可以分為兩類:基于內(nèi)部狀態(tài)的方法和基于行為的方法。
基于內(nèi)部狀態(tài)的方法主要依賴于訪問大模型的內(nèi)部狀態(tài)。例如,通過考慮關(guān)鍵概念的最小標(biāo)記概率來確定模型的不確定性。
基于行為的方法則主要依賴于觀察大模型的行為,不需要訪問其內(nèi)部狀態(tài)。例如,通過采樣多個響應(yīng)并評估事實陳述的一致性來檢測幻覺。
檢測忠實性幻覺的方法,研究人員用一張圖概括了五種不同的方法:
了解了如何度量幻覺后,就是減輕幻覺的方法了。
研究人員根據(jù)致幻原因,詳細(xì)總結(jié)了現(xiàn)有減輕幻覺現(xiàn)象的研究。
1、數(shù)據(jù)相關(guān)的幻覺。
減少錯誤信息和偏見,最直觀的方法是收集高質(zhì)量的事實數(shù)據(jù),并進(jìn)行數(shù)據(jù)清理以消除偏見。
對于知識邊界的問題,有兩種流行方法。一種是知識編輯,直接編輯模型參數(shù)彌合知識差距。另一種通過檢索增強生成(RAG)利用非參數(shù)知識源。
檢索增強具體分為三種類型:一次性檢索、迭代檢索和事后檢索。
一次性檢索是將從單次檢索中獲得的外部知識直接預(yù)置到大模型的提示中;迭代檢索允許在整個生成過程中不斷收集知識;事后檢索是基于檢索的修訂來完善大模型輸出。
2、訓(xùn)練相關(guān)的幻覺。
根據(jù)致幻原因,可以完善有缺陷的模型架構(gòu),目前已有許多相關(guān)研究。
從模型預(yù)訓(xùn)練階段來講,最新進(jìn)展試圖通過完善預(yù)訓(xùn)練策略、確保更豐富的上下文理解和規(guī)避偏見來應(yīng)對這一問題。
比如針對模型對文檔式的非結(jié)構(gòu)化事實知識理解碎片化、不關(guān)聯(lián),有研究在文檔的每個句子后附加一個TOPICPREFIX,將它們轉(zhuǎn)換為獨立的事實,從而增強模型對事實關(guān)聯(lián)的理解。
此外,還可以通過改進(jìn)人類偏好判斷、激活引導(dǎo),減輕對齊錯位問題。
3、推理相關(guān)的幻覺。
不完美的解碼通常會導(dǎo)致模型輸出偏離原始上下文。
研究人員探討了兩種高級策略,一種是事實增強解碼,另一種是譯后編輯解碼。
此外,忠實度增強解碼優(yōu)先考慮與用戶說明或提供的上下文保持一致,并強調(diào)增強生成內(nèi)容的一致性。現(xiàn)有工作可以總結(jié)為兩類,包括上下文一致性和邏輯一致性。
有關(guān)上下文一致性的最新研究之一是上下文感知解碼(CAD),通過減少對先驗知識的依賴來修改輸出分布,從而促進(jìn)模型對上下文信息的關(guān)注。
有關(guān)邏輯一致性的最新一項研究包括知識蒸餾框架,用來增強思維鏈提示中固有的自洽性。
論文鏈接:
https://arxiv.org/abs/2311.05232
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學(xué)您好!