發(fā)布時間:2024-04-03 13:08:26 瀏覽量:287次
本文主要介紹了 StableDiffusion在圖片生成上的內(nèi)容,然后詳細說明了StableDiffusion 的主要術語和參數(shù),并探討了如何使用 prompt 和高級技巧(如圖像修復、訓練自定義模型和圖像編輯)來生成高質(zhì)量的圖片。
介紹StableDiffusion
Stable Diffusion是一種潛在的文本到圖像擴散模型,能夠生成逼真的圖像,只需任何文本輸入,就可以自主自由創(chuàng)造漂亮的圖像,使眾多不會拍照的人在幾秒鐘內(nèi)創(chuàng)造出驚人的圖片。StableDiffusion可以生成不同的圖片風格,比如:Anime 動畫,realistic 寫實,Landscape 風景,F(xiàn)antasy 奇幻,Artistic 藝術。 還有很多其他的風格,都可以在網(wǎng)上看到。
有一些圖示來直觀理解StableDiffusion,比較深奧,不過多解釋:
https://zhuanlan.zhihu.com/p/599887666
https://stable-diffusion-art.com/models/
網(wǎng)上可以下載到的StableDiffusion模型非常多。只需要記得這些都是SD模型的微調(diào)版本即可,這些不同版本的StableDiffusion模型都是基于相同的算法和原理,并且都可以用于生成高質(zhì)量的圖像、音頻、視頻等數(shù)據(jù)。具體選擇哪個版本取決于應用場景和具體需求。
以下是常見模型,以及說明:
也可以自己做模型的合并,在StableDiffusion的GUI界面如下操作即可:
ControlNet是一種穩(wěn)定的擴散模型,可以復制作品和人體姿勢。想要使用的話再擴展中安裝sd-webui-controlnet擴展即可。
正常情況下我們想要控制人物的姿勢是十分困難的,并且姿勢隨機,而ControlNet解決了這個問題。它強大而多功能,可以與任何擴散模型一起使用。
主要作用:
可用的模型以及說明:
不同抽樣算法的生成時間對比:
使用不同的抽樣算法生成的圖片:
a busy city street in a modern city
https://stable-diffusion-art.com/know-these-important-parameters-for-stunning-ai-images/#Sampling_methods
如何生成高質(zhì)量的圖片
在StableDiffusion中,"prompt"是指為GPT模型提供輸入的文本段落或句子。它是用來引導模型生成有意義、準確的響應的關鍵因素之一。
同時可以考慮滿足以下的條件:
如果不確定要用什么風格,可以去下面的兩個地址搜一下對應的風格
使用()增加權重,使用[]降低權重;
a (word) - 將對單詞的權重增加1.1倍
a ((word)) - 將對單詞的權重增加1.21倍(= 1.1 * 1.1)
a [word] - 將對單詞的權重減少1.1倍
a (word:1.5) - 將對單詞的權重增加1.5倍
a (word:0.25) - 將對單詞的權重減少4倍(= 1 / 0.25)
a \(word\) - 在提示中使用字面上的()字符,轉(zhuǎn)義,不使用權重
prompt也可以從某個點位開始考慮生成指定的內(nèi)容:
[from:to:when]
示例:
a [fantasy:cyberpunk:16] landscape
另外一種語法:
[cow|horse] in a field
第1步,提示是“cow”。第2步是“horse”。第3步是“cow”,以此類推。
negtive提示符:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
((((ugly)))), (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck)))
https://stable-diffusion-art.com/inpainting-remove-extra-limbs/
其中的一些參數(shù):
模型記得選擇SDv1.5修復模型(sd-v1-5-inpainting.ckpt)。
可以直接在Colab云端訓練,本地也不用配置環(huán)境,訓練也很快:
https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/kohya-LoRA-dreambooth.ipynb#scrollTo=WNn0g1pnHfk5
想在本地訓練:
按照colab正常操作就行;最終會輸出一份訓練的模型到你的Google Driver中。然后自己在本地測試:
prompt:a woman, hitokomoru , with a cat on her head <lora:hito_komoru_test:1>
negtive: (worst quality:2), (low quality:2),disfigured, ugly, old, wrong finger
使用自己的Lora VS 不使用Lora
還有一次可以訓練多個概念,把文件件組織好就行了
編輯配置文件
configs/instruct-pix2pix.yaml,改為如下內(nèi)容:
use_ema: true // 默認為false
load_ema: true
denoising 改為1.0, 抽樣使用Euler a算法;
常用參數(shù):
下面是一些常用的指令模板:
有時候重新表達指令可以改善結(jié)果(例如,“turn him into a dog”與“make him a dog”與“as a dog”)。
增加steps的值有時可以改善結(jié)果。
人臉看起來奇怪?Stable Diffusion自編碼器在圖像中人臉較小的情況下會有問題。嘗試:裁剪圖像,使人臉在畫面中占據(jù)更大的部分。
資料地址:
Stable Diffusion的webUI中默認有一些腳本,可以方便我們嘗試一些不同的生成方式。
水下攝影肖像,iu1,裙子,美麗的詳細女孩,極其詳細的眼睛和臉,美麗的詳細眼睛,閉著嘴,黑色的頭發(fā),鎖骨,裸露的肩膀,長睫毛,飄逸的頭發(fā),氣泡,陽光穿過水面,逼真,照片般的真實感,由泰德·格蘭博拍攝,最高品質(zhì)。
正面提示:underwater photography portrait, iu1, dress, beautiful detailed girl, extremely detailed eyes and face, beautiful detailed eyes, closed mouth, black hair, collarbone, bare shoulders, longeyelashes, floating hair, bubbles, sun light breaking through water surface, realistic, photorealistic, by ted grambeau, best quality
<lora:iu_V35:0.8>
反面提示:(worst quality:2), (low quality:2), (normal quality:2) , goggles, sun glasses, hand, extra fingers, fewer fingers, strange fingers, bad hand
參數(shù) | 值 | 參數(shù)說明 |
CFG scale | 8 | 值越大,越符合你的prompt,范圍為1~30;默認為7. 個人測試: 5以下看起來不好看 |
Sampling steps | 20 | 理論上越大,圖片質(zhì)量越高,但是可能會帶來模糊 |
Image size | 512×512 | |
Seed | -1 | |
Face restoration | Codeformer | 勾選面部修復 |
Sampling method | DPM++ 2M Karas | |
Model | F222 | 默認是SD模型,可以下載這個模型,F(xiàn)222主要用在女性身材生成上比較擅長: https://huggingface.co/acheong08/f222/blob/main/f222.ckpt |
微調(diào)模型 | Lora iu https://civitai.com/models/11722/iu | 默認是SD模型,可以下載這個模型,F(xiàn)222主要用在女性身材生成上比較擅長: https://huggingface.co/acheong08/f222/blob/main/f222.ckt |
我做的事情:
原始照片:
生成prompt:
第一張prompt: ((Sunset)) , (Lake Gold) , Boat Center, Mountain, Tree in left, realistic, photorealistic, , 8K,Wide-angle, (expansive:1.5) , a combination of red, orange, pink, and purple.
negtive: (worst quality:2), (low quality:2)
第二張:a sunset over a body of water with a tree branch hanging over it and the sun reflecting in the water, a photo, Arthur Pan, dau-al-set, tranquil
第三張:two ducks swimming in a pond with fish in the water and a fish in the water behind them,, an impressionist painting, Emperor Huizong of Song, cloisonnism, tone mapping
第四張:a field of colorful flowers with green stems and yellow and red flowers in the middle of the field,, a jigsaw puzzle, Bob Thompson, color field, rich vivid colors
prompt:a young man holding a durian fruit in his hand , portrait ,detailed eyes, hyperrealistic
negtive prompt: (worst quality:2), (low quality:2),disfigured, ugly, old
模型:AnythingV3;
Denoising strength從0.1依次升高,第一張為原圖;
Denoising strength: 0.4~0.7(可以看到從0.5的噪聲強度開始,AI已經(jīng)開始自由發(fā)揮了,雖然也會參考原圖)
Denoising strength: 0.8~0.9 (基本完全自由發(fā)揮)
依舊是上個原圖,換為midjourney v4模型,Denoising strength測試0.2, 0.4, 0.6, 0.8
相同的提示詞,換個模型之后整體風格大變;
TextCFG固定:7.5,調(diào)整ImageCFG;
Put him in beach
提示:A girl, showing her muscles, detailed face , realistic ,8k <
lora:chilloutmixss30_v30:1>
negtive prompht: (worst quality:2), (low quality:2),disfigured, ugly, old,nsfw
除了控制姿勢,還可以控制人物的表情,這里我們只是控制人物的姿勢;
給“模特”戴項鏈:
A girl, (necklace:1.5), showing her muscles, detailed face , realistic ,8k <lora:chilloutmixss30_v30:1>
給“模特”戴墨鏡:
A girl, (sunglasses:1.5), showing her muscles, detailed face , realistic ,8k <lora:chilloutmixss30_v30:1>
StableDiffusion在實際應用中的案例
探討StableDiffusion與AIGC未來的發(fā)展趨勢
將概念擴大不僅是生成圖片,而是人工智能生成內(nèi)容的話,參開ChaGPT的回答,在未來人工智能技術可能的發(fā)展方向和影響;
人工智能內(nèi)容生成技術可以用于新聞、報道、評論等方面,幫助媒體機構更快速、高效地生成內(nèi)容。同時,它也可以用于廣告創(chuàng)意、廣告文案等方面,幫助廣告公司更好地推廣產(chǎn)品和服務。
人工智能內(nèi)容生成技術可以用于游戲角色、游戲關卡等方面,幫助游戲公司更好地設計和開發(fā)游戲。此外,它還可以用于教學資源的生成和個性化教學,例如生成教材、課件、試題等。
人工智能內(nèi)容生成技術可以用于金融報告、分析和預測,例如生成金融新聞報道、投資報告等。在醫(yī)療行業(yè)中,它可以用于醫(yī)療報告和病歷記錄,例如生成病歷記錄、醫(yī)學報告等。
人工智能內(nèi)容生成技術可以用于法律文件和合同的生成,例如生成合同、法律文書等。在建筑行業(yè)中,它可以用于建筑設計和規(guī)劃,例如生成建筑設計圖紙、規(guī)劃方案等。
人工智能內(nèi)容生成技術在IT行業(yè)中的應用非常廣泛,可以將其分為以下幾個子類別:
人工智能內(nèi)容生成技術可以用于互聯(lián)網(wǎng)內(nèi)容的自動化生成,例如自動化生成新聞報道、博客文章、社交媒體內(nèi)容等,從而提高效率和質(zhì)量。
人工智能內(nèi)容生成技術可以用于搜索引擎的優(yōu)化和改進,例如生成更好的搜索結(jié)果、提高搜索的準確性和速度等。
人工智能內(nèi)容生成技術可以用于個性化推薦系統(tǒng)的優(yōu)化和改進,例如生成更符合用戶興趣和需求的推薦內(nèi)容。
人工智能內(nèi)容生成技術可以用于聊天機器人的開發(fā)和優(yōu)化,例如生成更自然、流暢的對話內(nèi)容,提升用戶體驗。
人工智能內(nèi)容生成技術可以用于大數(shù)據(jù)分析和處理,例如自動生成數(shù)據(jù)報告、分析結(jié)果等。
人工智能內(nèi)容生成技術可以用于自動生成代碼、文檔、測試用例等,從而提高軟件開發(fā)的效率和質(zhì)量。
人工智能內(nèi)容生成技術可以用于網(wǎng)絡安全和數(shù)據(jù)安全領域,例如自動生成安全報告、分析網(wǎng)絡攻擊等。
人工智能內(nèi)容生成技術可以用于改善人機交互體驗,例如自動生成UI界面、語音交互內(nèi)容等。
人工智能內(nèi)容生成技術可以用于優(yōu)化云計算服務,例如自動生成云計算資源規(guī)劃、監(jiān)控報告等。
總結(jié)
這里主要介紹了 StableDiffusion在圖片生成上的內(nèi)容,然后詳細說明了StableDiffusion 的主要術語和參數(shù),并探討了如何使用 prompt 和高級技巧(如圖像修復、訓練自定義模型和圖像編輯)來生成高質(zhì)量的圖片。最后設想了一些 StableDiffusion 在個人和商業(yè)領域的實際應用案例,討論了它在媒體、游戲、金融、法律、IT 等行業(yè)的未來發(fā)展趨勢。
最后,我們正處于 AIGC的時代,這些新技術正在改變我們的生活和工作方式,為我們帶來前所未有的機遇和挑戰(zhàn)。積極擁抱這些新技術,抓住時代的機遇,不斷學習和適應新的變化。不管以后什么行業(yè),AIGC 技術都將發(fā)揮越來越重要的作用。盡早探索未知的領域,開創(chuàng)更好的未來!
相關資源
作者:艾賀(致問)
來源:微信公眾號:大淘寶技術
出處
:https://mp.weixin.qq.com/s/NkdPkEq_GMO6FRCLc_ZSow
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
同學您好!