激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2
當(dāng)前位置:首頁 >人工智能 >

Stable Diffusion vs Midjourney vs DALL.E2橫向?qū)Ρ确治?

發(fā)布時(shí)間:2024-03-26 15:08:15 瀏覽量:214次

參考自
https://analyticsindiamag.com/stable-diffusion-vs-midjourney-vs-dall-e2/

自今年以來,文生圖的AI繪圖軟件越來越流行。從一開始的DALL.E 2,到現(xiàn)在的midjourney和stable diffusion,甚至后續(xù)出現(xiàn)了更多類似的軟件。那么現(xiàn)在主流的三款程序里,他們的區(qū)別究竟是什么?Midjourney, DALL.E-2 或 Stable Diffusion, 誰是最好的文生圖軟件呢?


DALL.E 2是DALL.E的第二代模型,是由openAI開發(fā)創(chuàng)作的。盡管它比第一代模型更小,但它的生成表現(xiàn)卻更好。DALL.E 2可以創(chuàng)建幾乎任何東西,它使用一種稱為unCLIP的方法,是一種足夠精密復(fù)雜算法,它甚至可以創(chuàng)建我們?nèi)祟愲y以表達(dá)的圖像。雖然它有很多優(yōu)點(diǎn),但它仍然有其局限性。

(credit: AI Network)

因?yàn)樵撃P筒⒉幌蚬婇_放。盡管OpenAI可能有其自己的原因,但市場(chǎng)現(xiàn)在已經(jīng)看到了文-圖像生成器開源模型的崛起(例如Stable Diffusion)。就像當(dāng)初在GPT-3的情況下,開源支持者推出GPT-Neo時(shí)一樣。然而,目前AI繪圖程序火爆的背后也是由于OpenAI開源了CLIP算法,CLIP是DALL.E 2的基礎(chǔ)之一,這也是Midjourney和Stable Diffusion等平臺(tái)今天存在的根本原因之一。

由于DALL.E 2是訓(xùn)練是基于數(shù)百萬張庫存圖像上的,所以它所創(chuàng)造的輸出更加復(fù)雜,最適合企業(yè)使用。根據(jù)Stable Diffusion的創(chuàng)始人Emad Mostaque的說法,DALL.E 2的修復(fù)功能是其最佳特性,使其與其他圖像生成器區(qū)分開來。此外,與Midjourney或Stable Diffusion相比,DALL.E 2在有超過2個(gè)角色的情況下生成的圖像要好得多。

(credit: Fabians)

另一方面,Midjourney 是一種以其藝術(shù)風(fēng)格而聞名的工具。它生成的圖像幾乎從不像照片,而是更是像畫作。一些藝術(shù)家認(rèn)為它是一名藝術(shù)學(xué)生。“我覺得 Midjourney 是一位有自己風(fēng)格的藝術(shù)學(xué)生。當(dāng)你用我的名字來創(chuàng)造一張圖片時(shí),就像是請(qǐng)一位藝術(shù)學(xué)生來創(chuàng)作受到我的藝術(shù)風(fēng)格而啟發(fā)的作品,”一位藝術(shù)家說道。當(dāng)然,現(xiàn)在的Midjourney已經(jīng)可以完美的生成照片一樣的圖片了。

Midjourney使用一個(gè)Discord機(jī)器人來發(fā)送和接收對(duì)AI服務(wù)器的遠(yuǎn)程呼叫,幾乎所有的事情都可以在Discord上進(jìn)行。Midjourney還擁有約100萬活躍社區(qū),您可以在其中看到每個(gè)人都創(chuàng)造出神奇的藝術(shù)作品。

Midjourney的創(chuàng)始人David Holz表示,他不希望這些圖像看起來像照片。他認(rèn)為他可能會(huì)在某個(gè)時(shí)候制作逼真的版本,但公司不希望這成為默認(rèn)設(shè)置?!巴昝赖恼掌F(xiàn)在讓我有點(diǎn)不舒服,盡管我確實(shí)看到了你想要更真實(shí)的東西的合理理由。”

(credit: Fabians)

雖然DALL.E 2和Midjourney都不愿意完全開源,但Stable Diffusion聲稱自己是一個(gè)開源模型,每個(gè)人都可以使用。這也是stable diffusion目前最為火爆的原因,webUI的出現(xiàn),似使得每一個(gè)人都可以快速、方便、免費(fèi)的使用AI繪圖工具。

Stable Diffusion同樣對(duì)現(xiàn)代藝術(shù)插圖有相當(dāng)好的理解,并可以制作非常詳細(xì)的藝術(shù)作品。然而,它缺乏對(duì)復(fù)雜的prompt的理解,也就是說復(fù)雜繁復(fù)的tag可能使Stable Diffusion迷惑,并且無法了解到每個(gè)tag對(duì)于程序的影響。另外,stable diffusion在復(fù)雜的藝術(shù)插圖方面表現(xiàn)出色,但在生成標(biāo)志或者文字等一般圖像方面則表現(xiàn)較差。

(credit: Fabians)

當(dāng)然,還有一些人指出,Stable Diffusion本身是不受限制的,因此,它會(huì)生成一些裸露、血腥暴力的圖片,甚至還會(huì)生成在不恰當(dāng)場(chǎng)景下的政治和宗教人物。


(image of Barack Obama created by Stable Diffusion, credit: stability)

(Boris Johnson wielding various weapons, generated by Stable Diffusion. Image Credits: Stability AI)

然而,即便是這樣,Stable Diffusion也將成為文本到圖像生成市場(chǎng)的里程碑。由于它是開源的,越來越多的開發(fā)人員可以基于源代碼而創(chuàng)建更多、更復(fù)雜的工具或者插件。至于哪個(gè)是最好的,Midjourney的藝術(shù)能力,DALL E2的逼真圖像和Stable Diffusion的不受限制的使用使得所有AI模型在某種程度上都更好。最終,這取決于用戶的要求。

熱門課程推薦

熱門資訊

請(qǐng)綁定手機(jī)號(hào)

x

同學(xué)您好!

您已成功報(bào)名0元試學(xué)活動(dòng),老師會(huì)在第一時(shí)間與您取得聯(lián)系,請(qǐng)保持電話暢通!
確定