激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

AI畫畫模型Composer驚艷亮相!圖像拆分再靈活重組,創(chuàng)造力飛升

發(fā)布時間:2024-09-25 13:33:20 瀏覽量:148次

AI畫畫通用模型,新增一員大將!

阿里達(dá)摩院副院長周靖人等人打造的可控擴(kuò)散模型Composer,一經(jīng)發(fā)布就引起了軒然大波。

這個模型由50億參數(shù)訓(xùn)練而來,與Stable Diffusion原理有所不同。

它更進(jìn)一步把訓(xùn)練圖像拆解成了多個元素,然后基于這些元素訓(xùn)練擴(kuò)散模型,讓它們能夠靈活組合。

模型的創(chuàng)造能力因此大幅提升,創(chuàng)作的可能性倍增。

網(wǎng)友們看了紛紛表示,AI畫畫發(fā)展速度也太快了!

團(tuán)隊表示,模型的訓(xùn)練和推理代碼都在路上了。

有限手段的無限使用

該框架的核心思想是組合性(compositionality),模型名字就叫做Composer。

觀察到現(xiàn)下很多AI畫畫模型,在細(xì)節(jié)的可控性上還有待提高,Composer的出現(xiàn)填補(bǔ)了這一空白。

研究團(tuán)隊認(rèn)為,想要實現(xiàn)圖像的可控生成,重點應(yīng)該放在組合性上,這種方式可以將圖像的創(chuàng)造力提升到指數(shù)級。

具體來看,該模型將每個訓(xùn)練圖像拆解成一系列基礎(chǔ)元素,如蒙版圖、草稿圖、文字描述等,用它們來訓(xùn)練一個擴(kuò)散模型。

然后讓這些被拆分的元素,在推理階段靈活組合,生成大量新的圖像輸出。

它可以支持多種形式作為輸入。比如文字描述作為全局信息,深度圖和草圖作為局部引導(dǎo),顏色直方圖為低級細(xì)節(jié)等。

在保證生成圖像可控的基礎(chǔ)上,作為一個通用框架,該模型還能不用再訓(xùn)練就可以完成大量經(jīng)典生成任務(wù)。

團(tuán)隊表示,現(xiàn)有成果還在繼續(xù)優(yōu)化,以應(yīng)對AI畫畫模型面臨的挑戰(zhàn)和風(fēng)險。

達(dá)摩院副院長帶隊

該研究由火星時代教育及螞蟻團(tuán)隊完成,成果斐然。

通訊作者為周靖人。

他現(xiàn)任火星時代教育副院長、智能計算CTO,是IEEE Fellow。

了解更多數(shù)字藝術(shù)教育培訓(xùn)課程,請點擊咨詢

熱門課程推薦

熱門資訊

請綁定手機(jī)號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定