發(fā)布時間:2024-08-07 16:40:27 瀏覽量:125次
機器之心報道
編輯:蛋醬、梓文
Stable Diffusion XL 1.0閃亮登場,給你不一樣的色彩體驗。
在大模型開啟的AIGC時代,由明星AI初創(chuàng)公司Stability AI打造的文本到圖像生成模型Stable Diffusion可謂風靡全球。
雖然從文本到圖像的生成模型并不少,但Stable Diffusion是最受歡迎的開源模型。各路開發(fā)者也基于Stable Diffusion模型進行二創(chuàng),推出各種花式繁多的AIGC應用。
剛剛,Stability AI正式推出了Stable Diffusion XL(SDXL)1.0。文本到圖像生成模型,又完成了進化過程中的一次重要迭代。
這是Stability AI最新的旗艦圖像模型,也是當前圖像生成領域最好的開源模型。
在SDXL 1.0版本發(fā)布之前,Stability AI在六月份推出的SDXL 0.9僅作研究用途。但從今天起,SDXL 1.0將通過Stability AI的API開源開放給開發(fā)者,普通人也可以通過消費級應用Clipdrop和DreamStudio訪問。
如何馬上體驗到SDXL 1.0?目前有幾種渠道:
Clipdrop:點擊咨詢
DreamStudio:點擊咨詢
Stability AI Platform:點擊咨詢
Github:點擊咨詢
此外,鑒于與亞馬遜的密切合作關系,SDXL 1.0已經(jīng)登陸亞馬遜云科技的基礎模型托管服務Amazon Bedrock,而且還會登陸Amazon SageMaker JumpStart。
SDXL 1.0,什么進化了?
1. 生成概念與風格更具挑戰(zhàn)的作品
SDXL 1.0幾乎能夠生成任何藝術風格的高質量圖像,并且是實現(xiàn)逼真效果的最佳開源模型。用戶可以在沒有任何特定的「靈感」的情況下進行提示,確保風格的絕對自由,生成各具特色的圖像。SDXL 1.0在色彩的鮮艷度和準確度方面做了很好的調(diào)整,對比度、光線和陰影都比上一代更好,并全部采用原生1024x1024分辨率。
除此之外,SDXL 1.0可以生成圖像模型難以渲染的概念,例如手、文本以及空間的排列。
圖源:Stability AI官網(wǎng)
圖源:Stability AI官網(wǎng)
2. 語言更簡潔、更智能
SDXL 1.0只需幾句話就能創(chuàng)建復雜、細致、美觀的圖像。用戶不再需要用華麗的辭藻進行修飾就能夠獲得想要的高質量圖像。
它甚至能夠區(qū)分「The Red Square」(紅場,一個著名景點)和「red square」(紅色正方形)。
3. 微調(diào)和高級控制
有了SDXL 1.0,根據(jù)自定義數(shù)據(jù)對模型進行微調(diào)比以往任何時候都要容易??缮勺远xLoRA或檢查點,減少數(shù)據(jù)處理的需要。Stability AI正在利用專門用于SDXL的T2I / ControlNet構建下一代任務特定結構、樣式和組成控制。這些功能目前處于測試預覽階段,可以隨時關注微調(diào)的更新。SDXL 1.0上的圖像控制也即將推出。
自4月13日發(fā)布SDXL beta版本以來,ClipDrop用戶已經(jīng)使用該模型生成超過3500萬張圖片,而Stability AI的Discord社區(qū)平均每天生成2萬張圖片。
看看用戶使用SDXL 1.0的效果吧。
從網(wǎng)友的圖片生成效果來看,SDXL 1.0在光線上把握更加精準,光線效果、色彩對比更加真實。
可以看到,在色彩的運用上,SDXL 1.0更加大膽,飽和度較高的情況下光線與陰影的細節(jié)依然在線。
在這張圖片中可以看到,景深較為合適,主體突出,色彩之間的過渡,甚至真實度都十分優(yōu)秀。
網(wǎng)友制作了SDXL 0.9與SDXL 1.0的對比圖,左邊為SDXL 0.9生成圖像,右邊為SDXL 1.0生成圖像??梢悦黠@看出二者對于色彩運用的差距。SDXL 1.0的色彩更加豐富且真實,光效表現(xiàn)也更加出色。
也有網(wǎng)友在SDXL 1.0中使用Midjourney中的舊prompt,評論中紛紛感嘆,它的效果不比Midjourney差,甚至有些出乎意料的優(yōu)秀。
SDXL 1.0細節(jié):Base和Refiner模型
Stability AI將SDXL 1.0與各種模型進行了對比測試:與Stable Diffusion1.5/2.1、SDXL 0.9等模型相比,人們更喜歡由SDXL 1.0生成的圖像。
SDXL 1.0也是所有開放式圖像模型中參數(shù)量最多的模型之一,它建立在一個創(chuàng)新的新架構上,由一個35億參數(shù)的基礎模型和一個66億參數(shù)的細化模型組成。
完整模型包括一個用于潛在擴散的專家混合管道:第一步,基礎模型生成(噪聲)潛在變量,然后用專門用于最終去噪步驟的細化模型對其進行進一步處理。
基礎模型也可以作為獨立模塊使用。細化模型為基礎模型的輸出添加更精確的顏色、更高的對比度和更精細的細節(jié)。
這種兩階段架構可確保圖像生成的穩(wěn)健性,而且不會影響速度或需要過多的計算資源。SDXL 1.0可在配備8GB VRAM的消費級GPU或隨時可用的云實例上有效運行。
論文地址:
https://arxiv.org/pdf/2307.01952.pdf
代碼地址:
https://github.com/Stability-AI/generative-models
參考鏈接:
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement
點擊咨詢報名Stability AI的數(shù)字藝術培訓課程,了解更多關于數(shù)字藝術的技能和知識。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
同學您好!