發(fā)布時間:2024-01-08 13:49:42 瀏覽量:235次
“我上我也行——嗎?”
AI作畫早就不是什么新鮮事。
從幾年前開始,每隔一段時間就會有一個新的“自動作畫AI”跳出來,憑借精心調(diào)試的案例吸足眼球。但到了大多數(shù)人手里,卻又只能畫出仿佛脫胎于克蘇魯神話的詭異產(chǎn)物,好奇心的熱乎勁冷卻后就被快速淡忘。
兩款能將簡單圖案復雜化的AI,仍然存在不少局限
直到最近,一批風格獨特的畫作開始在網(wǎng)上流行。天馬行空的構(gòu)圖、豐富的細節(jié)加上風格統(tǒng)一的筆觸無不彰顯著作者的藝術(shù)審美,只不過它們是出自AI之手。
作者:Aetherial
作者:Binx.ly
但在精致的畫面背后,最讓人吃驚的還是這些AI的畫圖方式:直接描述想象中畫面,它就能生成對應(yīng)圖像,就像能聽懂人類的自然語言一樣。一個“用嘴畫圖”的時代,仿佛已經(jīng)悄然即將來臨。
1
早在一年前,一個名叫wombo的AI繪圖程序就已經(jīng)引發(fā)過熱議。不需要任何繪畫基礎(chǔ),也不必懂復雜的參數(shù)調(diào)試,只要輸入一句簡單的提示詞,就能得到一張可能風格詭異但頗具神韻的作品。
只是更多時候,想得到一張符合想象的畫作并不容易。
當你嘗試描述“用吉普力工作室的風格畫出一個皮卡丘”時,可能收獲的卻是一幅“移動的皮卡丘城堡”;想看看蒸汽朋克的海拉魯大陸如何,卻只得到一個機械宇航員的側(cè)身像。想讓AI讀懂自己的心思,除了需要更精準的描述外,似乎更需要還是運氣。
最近開始流行的Disco Diffusion(以下簡稱DD),和wombo一樣基于Deepdream視覺程序,但相較之下它明顯更能和人類“互相理解”。不僅畫出的作品詭異氣氛大減,而且能更精準地還原場景描述,更能“聽懂人話”。
當我同樣輸入“一座巨大的哥特式城堡,矗立在波濤洶涌的流光之海中”時,兩個AI的作品對比非常明顯。DD已經(jīng)完全丟掉了滿是AI烙印的抽象畫風,用以假亂真的筆觸還原了我想要的風格,而這距離我的想象已經(jīng)非常接近。
右側(cè)兩幅DD畫作是同一描述下生成的不同結(jié)果
相比于wombo固定種類的畫風選項,DD通過直接添加不同的關(guān)鍵詞調(diào)節(jié)畫作風格。這些詞匯可以是繪畫形式、流派名稱、藝術(shù)家名字或者具體到某個作品的標題。
同樣是上述哥特城堡的描述,加上“中國山水畫”或“梵高的星月夜”的補充后,得到的結(jié)果就大相徑庭。
在一個名為weirdwonderfulai的網(wǎng)站上,眾多使用者總結(jié)出了同一句話在不同作者、流派、關(guān)鍵詞下得到的上百種結(jié)果以供參考,由此可以看出DD強大的風格把控力。
許多創(chuàng)作者的悉心調(diào)教后的DD,已經(jīng)完全具備“畫出”一系列成熟作品的潛質(zhì)。社區(qū)里有不少人經(jīng)過初步摸索,畫出的作品已經(jīng)很難看出AI處理的痕跡。
作者:annetropy
作者:kelseyY
再搭配上不同主題和風格,完全能得到以假亂真的概念場景作品,稍加后期的人工修飾,就是一套賣相十足的成熟作品集。
作者:LIUXIYAUN
但與此同時,我們也都明白AI并不能真的聽懂人話。在無法幫助它快速學習迭代的情況下,不少人選擇和AI角色互換,讓自己接受訓練,試圖去理解AI眼里的人類語言。
2
“一幅由greg rutkowski和thomas kinkade創(chuàng)作的漂亮畫作:一座燈塔在洶涌的血海邊閃耀著光芒,Artstation的流行風格,黃色配色方案。”
作為官方給出的描述語模版,每個DD的使用者都見過上述這句話。語法規(guī)范的描述語不算長,其中卻包含了畫家、畫種、內(nèi)容、風格和配色方案等要素,讓初學者能一眼明白描述詞的要點。
但很快使用者們漸漸發(fā)現(xiàn),正確的語法語序并不能很好表達出畫面的邏輯,甚至適當?shù)钠罘炊艿玫礁玫慕Y(jié)果。畢竟從原理上來說,AI只是根據(jù)關(guān)鍵詞對應(yīng)的圖片信息“算”出了這樣一幅畫。
利用這一特性,也就不必拘泥于人類語言中的對錯,只要某個詞匯能對應(yīng)一類圖像的特征和風格,它就能成為一種畫風,圖片網(wǎng)站、游戲引擎名稱或者鏡頭型號都可以。
對于DD來說,參數(shù)也是調(diào)整圖片的重要方式。但如果嫌麻煩,僅靠描述詞也可以達到類似的效果。
例如在描述詞后加上不同的數(shù)字調(diào)整權(quán)重,如“雷云5:,火焰:5”,畫面中它們呈現(xiàn)的比例就會有所對應(yīng);加上“景深:-2”關(guān)鍵詞,會減弱畫面的景深效果;輸入“4K”則會在分辨率不變的情況下提升銳化值,模擬出更清晰的畫面。
“一棵由雷云和火焰組成的樹”
到了這時候,不少人的描述詞里已經(jīng)沒有了最初還算嚴謹?shù)恼Z法,變成了詞組和數(shù)字的神奇組合。為了讓AI更好理解自己,這些賽博煉丹師反而讓自己被訓練出了一套怪異的語言,和AI完成了奇妙的角色互換。
可也正因如此,擅長捕捉詞匯特征的DD才會犯下只有AI會鬧出的笑話。
當我為了模擬次世代游戲畫面,嘗試加入“RTX ON”詞綴渲染上圖中的樹時,圖片角落總會出現(xiàn)類似于作者簽名的神秘符號。但我的描述里并沒提到任何一個作者,這讓我百思不得其解。
直到我細想之下越發(fā)覺得這東西很像幾個字母的變形,到搜索引擎里一看“光追”的圖片結(jié)果,立馬明白了怎么回事:光追畫面的演示圖片里確實都有一個常被我們忽視的“簽名”。
不只圖片的角標會干擾結(jié)果,當一個人名不僅對應(yīng)他的作品,還能搜出作者本人的肖像照時,類似的情況也會出現(xiàn)。
當你想著用宮崎駿電影的風格來一張畫時,宮崎駿老爺子的頭像可能會突然出現(xiàn)的云端?;蛘邽榱四M《異形》風格加上設(shè)計師H. R. Giger 的名字時,他也可能不請自來為個人風格濃郁的骨頭宮殿打上水印。
作者:ZhaoKin
從結(jié)果來看,已經(jīng)能畫出很多驚艷作品的DD,距離理解人類語言還有很大一段距離。但它做不到并不意味著所有AI都做不到,這幾天它風頭更盛的另一個同僚DALLE-E2,就明顯更接近美好暢想中的“用嘴畫圖”
3
在DALL-E2官網(wǎng)的演示里,靠著不同物體概念、屬性和樣式的組合,我們能輕易得到一個區(qū)別于DD寫意風格的具象圖片。例如一個騎著馬的宇航員或一個和貓打籃球的宇航員。
改變風格詞條,還能在寫實、波普藝術(shù)、童書和水彩風格中任意切換畫風,同樣保持了描述中邏輯關(guān)系的正確,完全沒出現(xiàn)不可名狀的畫面。
更神奇的是,這個AI還能在保證陰影、反射和紋理正確的情況下,在圖片中毫無破綻地加入想添加的元素。例如想在一張美術(shù)館的圖片中加入一只柯基,不管想讓它和左畫中的老人來一張合影,鉆進右畫還是趴在前景的軟凳上,DALL-E2都可以算出它正確的樣子。
除此之外,它還能選定畫面里的指定元素刪除或修改,或是讓AI按照原圖風格再繪制一幅類似的作品。
由于DALL-E2目前還處于內(nèi)測階段,很多慕名而來的人都無法實際上手操作,不免懷疑實際應(yīng)用中是否能還原案例中的效果,這些展示案例中預調(diào)試的成分又有多少。
但從推特上部分拿到測試資格的用戶的發(fā)出的成果來看,人們對DALL-E2的擔憂并沒有成真。他依然保持著超強的“理解力”,即使是很多現(xiàn)有圖庫中很難找到現(xiàn)成答案的描述,它畫出的作品依然沒有讓人失望。
并且在一些參考圖片更少、可變動性不大的虛擬形象上,我們也很難一眼看出DALL-E2作品里留下的AI痕跡。
作者:Trent Kuhn(左),Cybertroniss(右)
作為知名人工智能研究組織OpenAI推出的產(chǎn)品,DALL-E2其實在去年就有了初代版本DALL-E,只不過當時它的清晰度和識別性都還很差,雖然也能實現(xiàn)用文字生產(chǎn)畫面的效果,但并沒引起什么關(guān)注。
對比前后兩代產(chǎn)品在相同描述下的作品,我們能直觀感受到它的進化,而這僅僅過去了8個月。
正是在AI這種快到令人有些心驚的速度里,一片“哇塞”的贊嘆聲中還混雜著另一個詞匯:“失業(yè)”。不少相關(guān)從業(yè)者在感嘆技術(shù)進步的同時,也逐漸產(chǎn)生了被AI取代的危機感,一如19世紀攝影術(shù)發(fā)明之初的畫家前輩們。
4
“從今天開始,繪畫已經(jīng)死了?!?/strong>
這是19世紀40年代法國畫家保羅·德拉羅什首次看到攝影印刷品后說出的話。但就算不看歷史我們也都知道,繪畫還活得好好的。
“用嘴畫圖”聽上去非常美好,只需要形容心中所想就能得到一幅畫面,也難免苦練手頭功夫的美術(shù)工作者對此產(chǎn)生焦慮。但在混跡DD社區(qū)的這一周里,我還是明顯感受到了我和其他人作品的“嘴上差距”。
社區(qū)里很多人都有著豐富的軟件輔助作圖經(jīng)驗和繪畫功底,對于不同派別、不同網(wǎng)站的畫作特點他們可以信手拈來,不同參數(shù)的微調(diào)也不在話下,想獲得固定構(gòu)圖和配色時,他們還能靠導入草圖幫助AI更好理解描述語,通過后期修改補繪調(diào)整細節(jié)。這才有了那些我難以企及的作品。
作者:Binx.ly
DD訓練著用戶不停實驗描述詞的效果差異,同時反過來這也是他們對它探究學習的過程,就像學習使用一支新畫筆的過程。看上去效果更好的DALL-E2,也不過是風格更內(nèi)斂和具象的另一支。
nin_artificial用同一詞條得到的作品風格對比
文字描述確實給了創(chuàng)作更大的空間,但這過程中的想象、調(diào)試、修改和補充等步驟,仍然需要創(chuàng)作者全程的參與和把控,就像買了相機并不等于學會了攝像。
更何況攝像的發(fā)明當初不僅沒有殺死繪畫,反而在古典繪畫的基礎(chǔ)上讓人們學會了以更多元的觀察和思考方式,才有了后來印象派、立體主義和超現(xiàn)實主義等新風格的誕生。
薩爾瓦多·達利的《記憶的永恒》
據(jù)OpenAI介紹,他們之所以要把這個AI命名為DALL-E,主要參考了超現(xiàn)實主義畫家薩爾瓦多·達利(Dali)和動畫電影《機器人總動員》主角瓦力(WALL-E)這兩個名字。他們悄悄鑲在這臺機器中的展望也就不言而喻了——
在一片荒蕪的新大陸上,瓦力仍將幫助人類開墾出新的樂土,即使這次它是位畫家。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學您好!