發(fā)布時(shí)間:2023-11-06 11:03:14 瀏覽量:104次
順便進(jìn)來(lái)考考咱自個(gè)兒的眼力
豐色 發(fā)自 凹非寺
|
GPT-4V挑戰(zhàn)視覺(jué)錯(cuò)誤圖,結(jié)果令人“大跌眼鏡”。
像這種判斷“哪邊顏色更亮”的題,一個(gè)沒(méi)做對(duì):
讀圖片中隱藏信息的也傻傻看不出,怎么問(wèn)都說(shuō)“沒(méi)有啊”:
但是呢,這種人類(lèi)乍一看絕對(duì)會(huì)錯(cuò)的圖,它又成功答對(duì):
以及這樣的錯(cuò)位圖,它對(duì)了又沒(méi)完全對(duì)。。
(GPT-4V直接看出來(lái)頭盔是位于男的大腿上的,沒(méi)有女的,但它還是表示圖里有倆人,另一個(gè)躲在男的身后戴著那頂頭盔==)
看完這些,是不是覺(jué)得很迷?
整個(gè)一“該對(duì)的不對(duì),該錯(cuò)的又對(duì)了”。
測(cè)試者則表示:
在測(cè)之前,他以為GPT-4V對(duì)這種挑戰(zhàn)完全不在話(huà)下,誰(shuí)知結(jié)果竟是這樣。
不止是他,網(wǎng)友也都不理解GPT-4V作為一個(gè)“精準(zhǔn)的”AI系統(tǒng),按理很智能,為什么還會(huì)犯和人類(lèi)一模一樣的錯(cuò)覺(jué)??!
所以,這到底怎么回事?
下面是來(lái)自網(wǎng)友的更多測(cè)試案例。
首先是次次都錯(cuò)誤的顏色錯(cuò)覺(jué)題。
(1)除了開(kāi)頭的兩顆小樹(shù)圖,還有這個(gè):
問(wèn)它哪邊的綠色更亮一些,果不其然還是左邊亮,右邊暗,實(shí)際明明都一樣。
(2)還有這張稍微復(fù)雜一點(diǎn)的:
兩只眼睛其實(shí)都是灰色,但讓GPT-4V來(lái)描述圖像時(shí),它回答一只為藍(lán)色,另一只做了灰度處理,無(wú)法得知顏色。
(3)這張就更別提了,直接被糊弄地死死的。
當(dāng)然,這確實(shí)很難,大部分人類(lèi)也識(shí)別不出來(lái)所有的球其實(shí)都是棕色。
其次是會(huì)產(chǎn)生動(dòng)態(tài)錯(cuò)覺(jué)的圖。
(1)有一點(diǎn)意外,當(dāng)我們問(wèn)GPT-4V“你看見(jiàn)了什么?描述細(xì)節(jié)”時(shí),它直接挑明了這是一張看久了就會(huì)讓人產(chǎn)生眩暈感的錯(cuò)覺(jué)圖,本質(zhì)就是一些波浪線(xiàn)而已。
(2)這張也沒(méi)有難倒它。
但奇怪的是問(wèn)它圖中有幾種顏色,它怎么都只能識(shí)別出黃色和藍(lán)色,看不到黑色和白色。
接下來(lái)是另一類(lèi)比較平面的錯(cuò)覺(jué)圖。
(1)如開(kāi)頭所示的這張:
一般人類(lèi)真的表示很懵圈,但是GPT-4V居然對(duì)了。
But,別急!!有人拿著測(cè)試者的圖去問(wèn)“自己的”GPT-4V,讓它再檢查一下時(shí),它居然改變了答案。
然而還沒(méi)完。評(píng)論區(qū)驚現(xiàn)套娃操作,有人又拿著這倆人的對(duì)話(huà)圖再問(wèn)GPT-4V,您猜怎么著?它又改回去了。。
大伙可是玩上癮了,又是一次又一次套娃。好在最終GPT-4V堅(jiān)持了己見(jiàn)。
總的來(lái)說(shuō),對(duì)于這種錯(cuò)覺(jué)陷阱是完全沒(méi)問(wèn)題。
(2)我們自己也測(cè)了一個(gè)長(zhǎng)度錯(cuò)覺(jué)題:
結(jié)果是so easy~
再來(lái)一組找隱藏信息的圖。
很遺憾,這種對(duì)于人類(lèi)來(lái)說(shuō)真的還算輕松的題,GPT-4V是一點(diǎn)也搞不定。
(1)先看這張,“遠(yuǎn)看”可以看到“NYC”三個(gè)大寫(xiě)字母。但它描述了一堆有的沒(méi)的,就是表示沒(méi)發(fā)現(xiàn)任何隱藏信息。
(2)如果說(shuō)上門(mén)這個(gè)有點(diǎn)隱晦,看不出也罷。但對(duì)于這種圖形隱藏,它也不行。
它描述到的只有其中的小女孩,即使測(cè)試者讓它“往遠(yuǎn)了看,又沒(méi)有新發(fā)現(xiàn)”,也無(wú)濟(jì)于事。
不過(guò),如果我們把這張圖片手動(dòng)縮小再丟給它,它行了,看到了骷髏。
最后是一組真實(shí)世界的錯(cuò)位圖。
(1)除了開(kāi)頭展示的人騎摩托,這張小貓“懸浮”,它居然對(duì)了。
(2)這張?bào)@悚圖,也OK。
(3)但這個(gè)就失敗了,實(shí)際后面是一只狗和小baby的重合,它認(rèn)成法斗犬幼崽。
(4)至于這張,它壓根兒就沒(méi)提鞋子的事兒,說(shuō)了也些不痛不癢的話(huà)。
所以,為什么會(huì)發(fā)生上面這些情況:有的錯(cuò)覺(jué)它可以識(shí)別出來(lái),有的又表現(xiàn)得很差勁?
首先,對(duì)于顏色錯(cuò)覺(jué)的圖,網(wǎng)友首先認(rèn)為是提示詞的問(wèn)題。
就像兩顆小樹(shù)那張,我們問(wèn)它“哪個(gè)更亮”,其實(shí)就是給了GPT-4V暗示或偏見(jiàn),它會(huì)順著咱的偏見(jiàn)來(lái)回答。
我們自己的測(cè)試也是如此:
但如果我們不帶立場(chǎng)的問(wèn):圖中兩種顏色一樣嗎?它完全沒(méi)問(wèn)題。
不過(guò),也有網(wǎng)友指出,當(dāng)我們問(wèn)它哪棵樹(shù)更亮?xí)r,如果是非常嚴(yán)謹(jǐn)?shù)貙?duì)所有像素進(jìn)行平均,GPT-4V的回答沒(méi)有毛病。
甚至有網(wǎng)友還用測(cè)色計(jì)實(shí)測(cè)了一把:
但!又有人指出如果只顯示一部分時(shí),兩者明明一樣。
暫且不再爭(zhēng)論這個(gè)問(wèn)題,可以肯定的是,“提示詞”的使用方法會(huì)對(duì)它的判斷造成影響是沒(méi)問(wèn)題的。
另外,網(wǎng)友發(fā)現(xiàn):
如果我們?nèi)?strong>追問(wèn)GPT-4V,讓它再仔細(xì)確認(rèn)一下,它也能糾正回答。
至于無(wú)法識(shí)別遠(yuǎn)景圖像的問(wèn)題,有網(wǎng)友認(rèn)為這可能是因?yàn)镚PT-4V只會(huì)從左往右地讀取圖像。
而對(duì)于“為什么有時(shí)它會(huì)和人類(lèi)一樣發(fā)昏被錯(cuò)覺(jué)誤導(dǎo)、完全不像個(gè)智能AI”的疑問(wèn),不少人則表示這毫不意外,是訓(xùn)練問(wèn)題。
即大模型是根據(jù)人類(lèi)數(shù)據(jù)、人的反饋、人的注釋進(jìn)行訓(xùn)練的,自然會(huì)產(chǎn)生和人一樣的錯(cuò)誤。
因此,還有人戲謔:
看來(lái)我們?nèi)祟?lèi)創(chuàng)造了那么多科幻作品,描述AI是如何冷酷、完美,但當(dāng)現(xiàn)在我們真正擁有它時(shí),發(fā)現(xiàn)它也不過(guò)如此。
(手動(dòng)狗頭)
你認(rèn)為該如何讓GPT-4V的錯(cuò)覺(jué)識(shí)別能力更強(qiáng)呢?
值得一提的是,我們也測(cè)試了其中的一些案例。
發(fā)現(xiàn)GPT-4V的表現(xiàn)不大一樣,有些題它在“我們這里”是可以的。
比如這張判斷球顏色的:
還有這個(gè):
盡管把大圖認(rèn)成老女人而非骷髏,但還是表明它可以“遠(yuǎn)觀(guān)” 的。
參考鏈接:
[1]https://twitter.com/fabianstelzer/status/1717131235644875024
[2]https://twitter.com/BeyondTodAI/status/1713279431681118557
[3]https://twitter.com/janbobrowicz/status/1717229335076393350
熱門(mén)資訊
1. 照片變漫畫(huà)效果,這4個(gè)方法操作簡(jiǎn)單有效,快來(lái)試試吧!
想將照片變成漫畫(huà)效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡(jiǎn)單操作就能實(shí)現(xiàn),快來(lái)嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過(guò)簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
3. 四款值得推薦的AI以圖生圖軟件,有需要的趕緊來(lái)試試!
近年來(lái),人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語(yǔ)以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來(lái),創(chuàng)意無(wú)限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來(lái),快來(lái)了解Viggle AI的功能和優(yōu)勢(shì)吧!
5. Logo Diffusion——基于sd繪畫(huà)模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來(lái)詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說(shuō)關(guān)于怎么樣利用AI來(lái)提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫(huà),教大家如何用AI生成自己的漫畫(huà)
接下來(lái),我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來(lái)盈利的漫畫(huà)。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫(huà)作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類(lèi)型的視頻。 1. Lumen5:Lumen5是一個(gè)基于A(yíng)I的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶(hù)可以使...
8. 一款免費(fèi)無(wú)限制的AI視頻生成工具火了!國(guó)內(nèi)無(wú)障礙訪(fǎng)問(wèn)!附教程
人人都可以動(dòng)手制作AI視頻! 打開(kāi)網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開(kāi)始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫(huà)排行榜:4090無(wú)懸念,最具性?xún)r(jià)比出人意料
在A(yíng)I繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性?xún)r(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫(huà)的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫(huà)軟件,提供詳細(xì)操作!有需要的快來(lái)...
最新文章
同學(xué)您好!