發(fā)布時間:2023-11-23 13:35:36 瀏覽量:107次
快速生成數(shù)據(jù)論據(jù)
蕭簫 發(fā)自 凹非寺
|
學(xué)術(shù)造假有了GPT-4,變得更容易了。
這兩天,一篇刊登在Nature上的新聞表示,GPT-4生成的造假數(shù)據(jù)集,第一眼還真不一定看得出來。
除非請來業(yè)內(nèi)專家仔細對數(shù)據(jù)集進行評估,才能發(fā)現(xiàn)個中細節(jié)的不合理性。
這個新聞的來源是一篇發(fā)表在JAMA Ophthalmology上的論文。
論文使用GPT-4為一項醫(yī)學(xué)學(xué)術(shù)研究生成了一個假數(shù)據(jù)集,發(fā)現(xiàn)它不僅能創(chuàng)造出看似合理的數(shù)據(jù),甚至還能用來準確支撐錯誤的論文觀點。
對此,有網(wǎng)友表示十分理解:
大模型最重要的能力就是生成“看似合理的文本”,因此它非常適合干這活兒。
還有網(wǎng)友感慨:技術(shù)“有良心”的程度,也就和用它的研究人員一樣了。
所以,GPT-4創(chuàng)造的假數(shù)據(jù)究竟長啥樣?
先來看看GPT-4是怎么生成假數(shù)據(jù)的。
具體來說,研究人員采用了GPT-4的高級數(shù)據(jù)分析(ADA,原代碼解釋器)功能,來生成一個假數(shù)據(jù)集。
這個過程中,研究人員給GPT-4提供了一些專業(yè)知識和統(tǒng)計學(xué)要求,讓它生成的數(shù)據(jù)看起來更加“合理”。
第一步,給GPT-4輸入一系列數(shù)據(jù)要求。
研究人員先給GPT-4提供了一系列詳細的提示詞,要求它創(chuàng)建一個關(guān)于圓錐角膜(keratoconus)眼部疾病患者的數(shù)據(jù)集。
圓錐角膜是一種疾病,會導(dǎo)致角膜變薄,導(dǎo)致注意力受損和視力不佳。
目前治療圓錐角膜疾病的方式主要有兩種,一種是穿透性角膜移植(PK),另一種是深板層移植(DALK)。
在沒有任何實質(zhì)性證據(jù)的情況下,研究人員讓GPT-4捏造一組數(shù)據(jù),支撐DALK比PK效果更好的觀點。
隨后,再設(shè)定了一系列統(tǒng)計標準,如要求GPT-4生成的術(shù)前和術(shù)后數(shù)據(jù)產(chǎn)生統(tǒng)計學(xué)上的顯著差異。
第二步,就是生成數(shù)據(jù)了。
這個過程中可能會由于GPT-4字數(shù)限制,導(dǎo)致答案生成暫停,通過“繼續(xù)”提示就能恢復(fù)生成過程。
最終,GPT-4成功生成了包含160名男性和140名女性患者的數(shù)據(jù)集,并做出了一組支撐DALK比PK效果更好的數(shù)據(jù)。
由GPT-4生成的假數(shù)據(jù)集長這樣,表格1是關(guān)于分類變量的數(shù)據(jù),包括患者性別、手術(shù)類型、免疫排斥等情況:
表2是關(guān)于連續(xù)變量,包括術(shù)前術(shù)后的視力矯正情況等:
論文作者之一Giuseppe Giannaccare博士表示,如果非??焖俚夭榭催@個數(shù)據(jù)集,很難識別出它其實“不是人做的”。
為了驗證GPT-4做出來的數(shù)據(jù)是否真的令人信服,Nature特意請來了英國曼徹斯特大學(xué)生物統(tǒng)計學(xué)家杰克·威爾金森(Jack Wilkinson)和同事Zewen Lu,來檢查數(shù)據(jù)可信度。
檢查結(jié)果表明,許多捏造出的患者在性別、名字匹配度上就有問題(例如Mary的性別一欄是男性一樣)。
然后,一些數(shù)據(jù)之間的相關(guān)性也不高,包括術(shù)前和術(shù)后視力測量與眼部成像檢查(eye-imaging test)之間的數(shù)據(jù)相關(guān)性等。
最后,患者的年齡也設(shè)置得不同尋常。
在檢查之后,用GPT-4生成假數(shù)據(jù)集的研究人員也承認,大模型在生成數(shù)據(jù)集上還存在有缺陷的地方。
但杰克·威爾金森(Jack Wilkinson)依舊對結(jié)果表示了擔憂:
一旦知道自己“哪里露餡了”,AI很容易就能糾正它,并生成更加具有說服力的結(jié)果。
有網(wǎng)友認為,這篇文章最大的意義并不在于證明“GPT-4有幻覺”;
更重要的是,它證明了GPT-4生成看似合理的數(shù)據(jù)集“非常容易”,也算是一種對期刊的警告(記得嚴格審稿?。?。
不過,也有網(wǎng)友感覺研究意義不大,因為即使沒有ChatGPT這樣的工具,真想造假的學(xué)者也能很容易偽造出一套數(shù)據(jù)。
此外,這兩天一段關(guān)于ChatGPT的視頻在抖音上也是火得不行。
視頻中,終于畢業(yè)的歪果仁小哥直呼“感謝ChatGPT幫助我完成所有作業(yè)和考試”(手動狗頭)
那么,對于ChatGPT在學(xué)術(shù)研究上可能帶來的問題,你怎么看?
參考鏈接:
[1]https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505
[2]https://www.nature.com/articles/d41586-023-03635-w
[3]https://news.ycombinator.com/item?id=38386547
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學(xué)您好!