激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

LCM/LCM-LoRA實時圖像生成技術革新,速度飛躍!-火星時代教育

發(fā)布時間:2024-08-14 18:40:37 瀏覽量:202次

機器之心報道

編輯:張倩、陳萍

生成式模型進入「實時」時代?

文生圖、圖生圖已經不再是新鮮事。但使用這類工具時,我們往往要忍受等待才能看到生成結果。

最近,一種名為「LCM」的模型改變了這一現狀,實現了實時的連續(xù)圖像生成。

LCM圖片
LCM圖片

圖源:https://twitter.com/javilopen/status/1724398666889224590

LCM全稱為Latent Consistency Models(潛在一致性模型),由清華大學交叉信息研究院的研究者們構建。LCM能將主流文生圖模型的效率提高5-10倍,實現了實時圖像生成。

LCM圖片

該文章發(fā)布一個月內瀏覽量超百萬,作者也被邀請在Hugging Face、Replicate、浦源等多個平臺展示新研發(fā)的LCM模型和demo。

LCM-LoRA技術進一步改進了LCM的快速采樣能力,為多模型提供了有效的解決方案,實現了實時圖像生成效果。

LCM-LoRA圖片

技術報告鏈接:https://arxiv.org/pdf/2311.05556.pdf

潛在一致性模型的快速生成能力開啟了圖像生成技術新局面。用戶可以根據輸入的文本處理和渲染實時捕捉到的畫面,實現高速圖像生成,實現自定義展示場景或視覺效果。

X平臺上研究者展示了利用該模型實現的圖像生成效果,包括圖生圖、視頻生成等應用。

LCM圖片

圖源:https://twitter.com/javilopen/status/1724398666889224590

LCM圖片

圖源:https://twitter.com/javilopen/status/1724398708052414748

LCM圖片

LCM的代碼已開源,在Hugging Face官方倉庫中也有相關支持。LCM模型在文生圖模型熱度中名列前茅。

LCM圖片

接下來,我們將介紹LCM和LCM-LoRA這兩項研究成果。

LCM:只用幾步推理就能生成高分辨率圖像

在AIGC時代,擴散模型如Stable Diffusion和DALL-E 3備受關注。然而,擴散模型生成圖片通常需要多步采樣,過程較慢,推理成本高。

一致性模型為解決該問題提供了思路,但局限于無條件圖片生成。LCM的出現彌補了這一不足,支持給定條件的圖像生成任務。

LCM要求對常微分方程進行直接單步求解,理論上可在單步內生成圖像。

LCM圖片

LCM的訓練通過微調預訓練的擴散模型,在極少資源消耗下賦予模型快速生成效果。其中,使用自動編碼器來編碼圖片到潛在空間,并采用無分類器引導、跳步策略等關鍵技術。

LCM生成的圖像

LCM-LoRA:一個通用的Stable Diffusion加速模塊

LCM-LoRA建立在LCM基礎上,通過LoRA等高效微調技術訓練模型。它展示了強大的泛化能力,支持各種微調的SD模型和LoRA。

LCM-LoRA圖片

LCM-LoRA概況圖。通過在LCM的蒸餾過程中引入LoRA,降低蒸餾的內存開銷,使得能夠訓練更大的模型,如SDXL和SSD-1B。

LCM-LoRA技術方法改善了模型的生成效果,展示出強大的泛化能力和優(yōu)越性。

團隊介紹

論文作者來自清華叉院,兩位共一作分別是駱思勉、譚亦欽。

駱思勉畢業(yè)于復旦大學大數據學院,研究方向為多模態(tài)生成模型。譚亦欽畢業(yè)于清華大學電子工程系,研究方向包括深度強化學習。

指導老師包括清華交叉信息院副教授李建、黃隆波,助理教授趙行。

團隊圖片

第一行(從左到右):駱思勉、譚亦欽。第二行(從左到右):黃隆波、李建、趙行。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯系,請保持電話暢通!
確定