激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

爆火!最強Text-to-3D開源方案LucidDreamer:毛發(fā)都給你合成出來

發(fā)布時間:2024-03-24 19:39:10 瀏覽量:184次

作者:泡椒味的口香糖 | 來源:3D視覺工坊

在公眾號「3D視覺工坊」后臺,回復「原論文」可獲取論文pdf、代碼鏈接

添加微信:dddvisiona,備注:NeRF,拉你入群。文末附行業(yè)細分群

0. 筆者個人體會

最近單圖像合成3D、文本合成3D等等工作可謂大火,不停的看見"10秒/45秒/1分鐘內合成高保真3D模型"的標題,大多數(shù)都是基于擴散模型和NeRF二次開發(fā)的,官方主頁展示的交互式demo也確實效果拔群。

但是大多數(shù)方案合成的3D模型還是太過于平滑了,對于毛發(fā)、皮膚紋理、金屬質感這種高頻細節(jié)處理的不太好,很難說達到了照片級渲染。今天筆者將為大家分享香港科技大學、之江實驗室、浙江大學最新開源的工作LucidDreamer,合成的模型非常精細!

下面一起來閱讀一下這項工作,文末附論文和代碼鏈接~

1. 效果展示

給定文本提示,LucidDreamer可以合成高保真的3D模型,可以發(fā)現(xiàn)合成的模型真的是很精細了,保留了非常多的高頻細節(jié)。3D建模師又要睡不著覺了~這里也推薦工坊推出的新課程零基礎入門四旋翼建模與控制(MATLAB仿真)[理論+實戰(zhàn)]》

2. 具體原理是什么?

現(xiàn)有Text-to-3D方案在渲染3D模型的高頻細節(jié)上處理效果不太好,這是因為現(xiàn)有方案大多基于SDS(Score Distillation Sampling)進行,造成了模型的過度平滑。

因此,作者換了一個技術路線:提出一種區(qū)間得分匹配(Interval Score Matching,ISM)的新方法。ISM采用確定性的擴散軌跡,并利用基于區(qū)間的得分匹配來抵消過度平滑。此外,還將3D高斯splatting(ACM SIGGRAPH 2023會議最佳論文)融入到文本到3D中來提高渲染速度。

具體的框架是,首先通過預訓練的text-to-3D生成器初始化3D表示θ(實際操作用的是高斯splatting),結合預訓練的2D去噪擴散概率模型,使用DDIM反演將隨機視圖擾動為無條件噪聲的潛在軌跡,最后使用作者提出的ISM來更新θ。

3. 再來看看和同類方法的對比

看一下和同類text-to-3D的效果對比,其他方案要么出現(xiàn)了語義歧義,要么渲染速度過慢。

作者提出的ISM和同類SDS策略的對比,可以發(fā)現(xiàn)ISM很大程度上預測了3D物體的高頻細節(jié),使得模型更貼近照片級渲染!

作者還展示了ISM的應用價值,包括2D/3D編輯、3D虛擬任務生成、個性化3D生成,進一步擴展了這項工作的意義。這里也推薦工坊推出的新課程零基礎入門四旋翼建模與控制(MATLAB仿真)[理論+實戰(zhàn)]》

對更多實驗結果和文章細節(jié)感興趣的讀者,可以閱讀一下論文原文~


熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定