激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

Stable Diffusion壓縮圖像技術(shù)探析,效果驚人還未達(dá)極致

發(fā)布時(shí)間:2024-08-16 09:22:05 瀏覽量:212次

近期有一項(xiàng)名為Stable Diffusion的圖像壓縮技術(shù)備受矚目,可能還有更多潛力等待挖掘。一位名叫Matthias Bühlmann的博主對(duì)這一技術(shù)進(jìn)行了深入實(shí)驗(yàn)研究,發(fā)現(xiàn)Stable Diffusion作為一種圖像壓縮編解碼器表現(xiàn)出色。在實(shí)驗(yàn)過程中,與JPG和WebP相比,Stable Diffusion在小文件大小下保留了更出色的圖像質(zhì)量。

實(shí)驗(yàn)分析結(jié)果

根據(jù)Matthias Bühlmann的分析,Stable Diffusion使用三個(gè)串聯(lián)的訓(xùn)練好的人工神經(jīng)網(wǎng)絡(luò),分別是變分自編碼器(VAE)、U-Net和文本編碼器。其中,VAE對(duì)圖像進(jìn)行編碼和解碼,并將潛在表征轉(zhuǎn)換為更低分辨率、更高精度的形式。

VAE的潛在表征經(jīng)過壓縮后發(fā)現(xiàn)重構(gòu)圖像質(zhì)量并不會(huì)明顯下降,而對(duì)潛在表征進(jìn)行采樣或應(yīng)用其他有損壓縮方法則會(huì)影響重構(gòu)質(zhì)量。Matthias Bühlmann的實(shí)驗(yàn)還發(fā)現(xiàn)了一些意外之處,通過特定算法的進(jìn)一步量化結(jié)果十分出色。

動(dòng)物照片壓縮效果

動(dòng)物照片,從左至右:JPG (5.66kB), WebP (6.74kB), Stable Diffusion (4.97kB)。

實(shí)驗(yàn)討論

盡管Stable Diffusion在壓縮圖像方面效果明顯好于JPG和WebP,但在某些指標(biāo)上并沒有明顯優(yōu)勢。特別是在保留細(xì)節(jié)方面,Stable Diffusion表現(xiàn)更佳,但受到壓縮偽影的影響,一些特征可能會(huì)發(fā)生變化。

對(duì)于小字體文本和人臉特征的保留方面,Stable Diffusion v1.4不夠理想,但在人臉生成方面,v1.5模型擁有更好表現(xiàn)。

潛在特征解碼結(jié)果

左:Ground Truth;中:經(jīng)過VAE roundtrip (32-bit潛在特征);右:從palettized去噪8-bit潛在特征解碼的結(jié)果。

結(jié)論

實(shí)驗(yàn)結(jié)果表明Stable Diffusion在圖像壓縮方面展現(xiàn)出令人驚艷的效果,但仍有改進(jìn)空間。Stable Diffusion的未來版本可能會(huì)進(jìn)一步優(yōu)化圖像壓縮特性。

想了解更多數(shù)字藝術(shù)教育課程?趕緊點(diǎn)擊咨詢,了解火星時(shí)代教育的專業(yè)培訓(xùn)課程!

熱門課程推薦

熱門資訊

請(qǐng)綁定手機(jī)號(hào)

x

同學(xué)您好!

您已成功報(bào)名0元試學(xué)活動(dòng),老師會(huì)在第一時(shí)間與您取得聯(lián)系,請(qǐng)保持電話暢通!
確定