發(fā)布時間:2024-08-07 10:11:49 瀏覽量:143次
互聯(lián)網(wǎng)上有一條經(jīng)典的“第 34 號規(guī)則”(Rule 34):如果一個東西存在,那么它必然會被用來搞黃色。AI 繪畫就很好地說明了這一點——目前最流行的幾個 AI 繪畫分享網(wǎng)站,都有至少三分之一的內(nèi)容是各種黃圖。
圖源:GIPHY
但是這里出現(xiàn)了一個小小的問題:人們普遍覺得,這些圖里的大多數(shù),雖然黃,但不“色”。
是千篇一律的僵硬神色和動作?或許是扭曲不自然的姿態(tài)?又或許是依舊容易畫錯的手指和奇怪的透視?是什么讓人能夠一眼分辨出某些圖是 AI 畫的?我們真的要乞靈于“靈性”“靈魂”這樣的詞語嗎?
當我們能夠理解,是什么讓人能夠判斷出一張圖是否是 AI 畫的,我們就能夠更好的理解 AI 繪畫本身。
圖源:GIPHY
如今,我們都多少大致了解過 AI 繪畫的原理:首先,我們要有一個訓練數(shù)據(jù)集,這個數(shù)據(jù)集里包括一系列的圖片,和與圖片對應的、描述圖片元素的一系列文本;把這些數(shù)據(jù)喂給 AI,AI 就能學會將這些文本和圖片之間聯(lián)系起來;專業(yè)的術(shù)語,就是將圖片中的內(nèi)容翻譯成一個“高維的文本向量”;如果這種內(nèi)容到向量之間的翻譯足夠合理,那么我們就可以將這個翻譯機制,也就是“多層神經(jīng)網(wǎng)絡(luò)”反過來使用,通過一系列的文本提示詞(prompts),將文本向量重新翻譯回相應的畫面。
如果我們將中間的 diffusion model 之類的技術(shù)細節(jié)省略,我們會發(fā)現(xiàn)一個目前 AI 繪圖和人類繪畫最基本的邏輯區(qū)別:AI 繪畫是從文字語言出發(fā)的;而人類的視覺藝術(shù),是從視覺本身出發(fā)的。
圖源:unsplash
我們與周遭的世界和環(huán)境,與其他人的接觸,都是我們對于這個“世界模型”的調(diào)用和運行;如果沒有這個世界模型,智能本身就不存在了。在認知科學里,這叫做“具身認知”:我們身體和外界的關(guān)系構(gòu)成了我們“認知模型”里非常重要的部分。而人類的抽象思維和語言(最關(guān)鍵的思考工具),則基本上完全依賴于對于這個物理世界的類比和模擬,這被稱作“具身模擬”。
相關(guān)的內(nèi)容可以參考幾本書《我們賴以生存的隱喻》《我們賴以生存的意義》《表象與本質(zhì)》。
這種對于物理世界的認識和建模,則是目前人工智能開發(fā)里最大的障礙:如何讓人工智能建立一個世界模型?讓它能夠理解它看到了什么,而不是作為一個單純的統(tǒng)計分類機器?自動駕駛實際上就卡在這里:機器智能機械的分類它接受到的影像數(shù)據(jù)并且做相應的反應,而很難將這些數(shù)據(jù)統(tǒng)計和歸納,建立一個世界模型,所以自動駕駛才會出那么多的無窮無盡的 corner case。
圖源:GIPHY
AI 繪圖與人類繪畫根本差異的原因也就在此:繪圖 AI 是沒有世界模型的。所謂的“上下文”或者說“邏輯”,就是這個世界的基本的規(guī)律;人手一般都會有五根手指,這就是規(guī)律之一。繪圖 AI 要能夠理解它看到了什么,而不是神經(jīng)網(wǎng)絡(luò)單純的記住了,某些元素和另一些元素一同出現(xiàn)的概率比較高,它才能表現(xiàn)得像一個人類畫師。
曾有很多人質(zhì)疑,AI 繪圖是否能真的從事“創(chuàng)造性”工作,最本質(zhì)的原因,就在于“創(chuàng)造性”本身就需要深刻的理解規(guī)律。
中國各地的景點一向有一個我很不喜歡的傳統(tǒng):一塊石頭,一座山峰,甚至是巖壁上的紋路,都要強行的把它攀附成某種具象的形象,然后再編出一段神話,相傳這里原本有一個巨大的天界的 XXX,因為惹怒了玉皇大帝被打入凡間,然后流落此地化成了這塊巨石 / 這座山峰云云。這種強行地,要把自然的隨機起伏特征強行解釋為有意義的特征,在統(tǒng)計學上,叫做“過擬合”。
圖源:GIPHY
那么這跟 AI 繪畫又有什么關(guān)系呢?這種強行地,要把自然的隨機起伏特征強行解釋為有意義的特征,在統(tǒng)計學上,叫做“過擬合”。當然,如果用自然語言,這就叫用力過猛。
所以除開“手指法”,我們識別 AI 繪畫的一個很重要的手段,就是 AI 繪畫經(jīng)常會“用力過猛”。人類畫師畫的圖一般而言都會有自己的輕重緩急:畫師會為自己想要強調(diào)的畫面增加更多細節(jié),而其余的部分就可以糊一點、簡單一些,自己省力之外觀眾也能自然而然地注視那些更重要的部分;而 AI 生成的畫面往往是平均的,AI 會在整個畫面上不分青紅皂白地堆滿各種似是而非的細節(jié),讓整個畫面顯得沒有重點。
一個熟悉 AI 繪畫的人能夠一眼鑒 AI,很多時候就在于這種視覺上的疲勞感覺:所有東西都很清晰,都很細致,都沒有必要。但是這種用力過猛如果放在合適的情境下,就不再是用力過猛了:使用合適的模型和充滿腦洞的提示詞,AI 繪畫能畫出那些人類畫師不太可能畫出來的離奇的圖出來。
圖源:civitai
在攝影圈里一直有個說法:金頭紅頭,最終看相機后面那顆頭。攝影師也會抱怨:總有人問,這張照片拍得真好,是用什么相機拍的?但是絕不會有人問畫家,這張畫畫得真好,是用什么畫筆畫的?
實際上在 AI 繪畫的現(xiàn)在,問題是同樣的:使用什么工具其實不是那么重要,重要的還是使用工具的人。繪畫的 AI 模型本身是沒有創(chuàng)造性的,而創(chuàng)造性要從使用 AI 的人那里生發(fā)出來。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學您好!