發(fā)布時間:2024-08-14 18:40:37 瀏覽量:202次
機器之心報道
編輯:張倩、陳萍
生成式模型進入「實時」時代?
文生圖、圖生圖已經不再是新鮮事。但使用這類工具時,我們往往要忍受等待才能看到生成結果。
最近,一種名為「LCM」的模型改變了這一現狀,實現了實時的連續(xù)圖像生成。
圖源:https://twitter.com/javilopen/status/1724398666889224590
LCM全稱為Latent Consistency Models(潛在一致性模型),由清華大學交叉信息研究院的研究者們構建。LCM能將主流文生圖模型的效率提高5-10倍,實現了實時圖像生成。
該文章發(fā)布一個月內瀏覽量超百萬,作者也被邀請在Hugging Face、Replicate、浦源等多個平臺展示新研發(fā)的LCM模型和demo。
LCM-LoRA技術進一步改進了LCM的快速采樣能力,為多模型提供了有效的解決方案,實現了實時圖像生成效果。
技術報告鏈接:https://arxiv.org/pdf/2311.05556.pdf
潛在一致性模型的快速生成能力開啟了圖像生成技術新局面。用戶可以根據輸入的文本處理和渲染實時捕捉到的畫面,實現高速圖像生成,實現自定義展示場景或視覺效果。
X平臺上研究者展示了利用該模型實現的圖像生成效果,包括圖生圖、視頻生成等應用。
圖源:https://twitter.com/javilopen/status/1724398666889224590
圖源:https://twitter.com/javilopen/status/1724398708052414748
LCM的代碼已開源,在Hugging Face官方倉庫中也有相關支持。LCM模型在文生圖模型熱度中名列前茅。
接下來,我們將介紹LCM和LCM-LoRA這兩項研究成果。
LCM:只用幾步推理就能生成高分辨率圖像
在AIGC時代,擴散模型如Stable Diffusion和DALL-E 3備受關注。然而,擴散模型生成圖片通常需要多步采樣,過程較慢,推理成本高。
一致性模型為解決該問題提供了思路,但局限于無條件圖片生成。LCM的出現彌補了這一不足,支持給定條件的圖像生成任務。
LCM要求對常微分方程進行直接單步求解,理論上可在單步內生成圖像。
LCM的訓練通過微調預訓練的擴散模型,在極少資源消耗下賦予模型快速生成效果。其中,使用自動編碼器來編碼圖片到潛在空間,并采用無分類器引導、跳步策略等關鍵技術。
LCM生成的圖像
LCM-LoRA:一個通用的Stable Diffusion加速模塊
LCM-LoRA建立在LCM基礎上,通過LoRA等高效微調技術訓練模型。它展示了強大的泛化能力,支持各種微調的SD模型和LoRA。
LCM-LoRA概況圖。通過在LCM的蒸餾過程中引入LoRA,降低蒸餾的內存開銷,使得能夠訓練更大的模型,如SDXL和SSD-1B。
LCM-LoRA技術方法改善了模型的生成效果,展示出強大的泛化能力和優(yōu)越性。
團隊介紹
論文作者來自清華叉院,兩位共一作分別是駱思勉、譚亦欽。
駱思勉畢業(yè)于復旦大學大數據學院,研究方向為多模態(tài)生成模型。譚亦欽畢業(yè)于清華大學電子工程系,研究方向包括深度強化學習。
指導老師包括清華交叉信息院副教授李建、黃隆波,助理教授趙行。
第一行(從左到右):駱思勉、譚亦欽。第二行(從左到右):黃隆波、李建、趙行。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現,快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現,以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
就能快速生成一幅極具藝術效果的作品,讓現實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
同學您好!