發(fā)布時間:2024-07-31 18:29:17 瀏覽量:145次
機(jī)器之心報道
編輯:陳萍
如果你想,SD 2.0 能生成分辨率為 2048x2048 甚至更高的圖像。
今日,Stability AI 官方宣布,那個爆紅 AI 圈的 Stable Diffusion 來到了 2.0 版本(SD 2.0)!上線短短幾個小時,點贊量已經(jīng)很可觀了。
項目地址:點擊咨詢
可以說,這波更新速度夠快的,就像網(wǎng)友說的,我從未見過任何技術(shù)發(fā)展如此之快。V1 還沒整透徹,V2 就來了。
V1亮相之初,在Github 排行榜,Stable Diffusion 為所有軟件中攀升至 10K star 最快的其中之一,在不到兩個月的時間內(nèi)飆升至 33K star。按照這個速度,2.0 版本很快就會趕上。
Stability AI 的產(chǎn)品副總裁興奮的表示:Stable Diffusion 2.0 是有史以來發(fā)布的最強(qiáng)大的開源項目之一。這是邁向創(chuàng)造力、表達(dá)能力和溝通民主化的又一大步。
還有網(wǎng)友表示:「離完美不遠(yuǎn)了??赡苁?V5 或 V6 版本」。
「新版本是改變游戲規(guī)則的更新?!?/p>
與最初的 V1 版本相比,Stable Diffusion 2.0 提供了許多重大改進(jìn)和特性,具體表現(xiàn)在:
Stable Diffusion 2.0 版本包含一個具有魯棒性的文本 - 圖像模型,在全新的文本編碼器 (OpenCLIP) 上訓(xùn)練而成,與早期的 V1 版本相比,文本 - 圖像模型大大提高了圖像生成質(zhì)量,可以生成默認(rèn)分辨率為 512x512 像素和 768x768 像素的圖像。
此外,文本 - 圖像模型是在 LAION-5B 數(shù)據(jù)集上訓(xùn)練的,然后使用 NSFW filter 過濾掉一些不可描述的內(nèi)容。
使用 Stable Diffusion 2.0 生成的圖像示例,圖像分辨率為 768x768
Stable Diffusion 2.0 還包括一個 Upscaler Diffusion 模型,該模型將生成圖像的分辨率提高了 4 倍。具體效果如何呢?例如下圖展示的是 Upscaler 將低分辨率生成的圖像 (128x128) 升級(upscaling)為更高分辨率的圖像(512x512)。現(xiàn)在的圖像已經(jīng)夠清晰了,然后在結(jié)合上述提到的文本 - 圖像模型, 比如將 512x512 像素的圖像提高 4 倍,Stable Diffusion 2.0 現(xiàn)在可以將圖像升級為分辨率為 2048x2048 甚至更高的圖像。
左:128x128 低分辨率圖像。右:由 Upscaler 生成的 512x512 分辨率圖像
Stable Diffusion 2.0 更新還包括 Depth2img(depth-guided stable diffusion)模型,它擴(kuò)展了 V1 版本中圖像 - 圖像的特性,為創(chuàng)意應(yīng)用提供了全新的可能性。Depth2img 用來推理輸入圖像的深度,然后使用文本和深度信息生成新圖像。
左邊為輸入圖像,右邊為新生成的圖像,相同的動作,面貌各異。該新模型可用于圖像 - 圖像結(jié)構(gòu)的保持和形狀的合成。
Depth2img 提供了不同創(chuàng)新性應(yīng)用,雖然生成的圖像與原始圖像有很大的不同,但仍然保持了圖像的連貫性和深度:
Stable Diffusion 2.0 生成的深度 - 圖像保持一致性。
最后,Stable Diffusion 2.0 還引入了一個新的 text-guided 修復(fù)模型,用戶可以非常智能、快遞的切換圖像部分內(nèi)容,如下圖中豹子的嘴巴和鼻子是不變的,其他部分可以隨意改變。
研究者表示,他們正在努力優(yōu)化模型以在單個 GPU 上運行,讓盡可能多的人可以使用。
參考鏈接:點擊咨詢
火星時代教育是一家專注數(shù)字藝術(shù)教育的培訓(xùn)機(jī)構(gòu),已成立30年,開設(shè)課程有游戲設(shè)計培訓(xùn)、游戲程序培訓(xùn)、動畫培訓(xùn)、原畫培訓(xùn)、AI繪畫培訓(xùn)、AI音樂創(chuàng)作培訓(xùn)、影視后期培訓(xùn)、短視頻制作、室內(nèi)設(shè)計培訓(xùn)、UI設(shè)計培訓(xùn)、插畫培訓(xùn)等。歡迎訪問我們的官網(wǎng):點擊咨詢
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
最新文章
同學(xué)您好!