激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

谷歌DeepMind推出全新V2A技術(shù),讓視頻秒變音頻神器

發(fā)布時(shí)間:2024-07-29 20:40:58 瀏覽量:106次

谷歌DeepMind最新推出的V2A技術(shù),讓視頻生成音頻變得輕而易舉。這項(xiàng)技術(shù)可以讀取視頻內(nèi)容,并實(shí)時(shí)合成配樂、對(duì)話甚至音效,為無聲視頻帶來全新的體驗(yàn)。

視頻生成音頻,創(chuàng)意無限可能

Google DeepMind的V2A技術(shù)將視頻像素與自然語言指令完美結(jié)合,為無聲視頻加入詳細(xì)的音軌。用戶可以使用這一工具創(chuàng)建包括戲劇配樂、逼真音效甚至角色對(duì)話的場(chǎng)景,讓視頻更具感染力。

除了視頻生成模型如Google的Veo、OpenAI的Sora、以及KLING和Gen 3等能夠生成視頻外,V2A技術(shù)的加入讓音頻制作更加便捷。谷歌表示,V2A可以為這些視頻生成模型增加戲劇性音樂、逼真音效以及與視頻情節(jié)匹配的臺(tái)詞。此外,它還可以為傳統(tǒng)素材(如存檔素材和無聲電影)增添聲音元素。

AI分析視頻時(shí),文本提示可以指導(dǎo)重新創(chuàng)作所需聲音,刪除或更改不需要的聲音,提升整體音頻質(zhì)量,讓創(chuàng)作更加自由。

DeepMind的V2A技術(shù)基于Diffusion技術(shù),為同步視頻和音頻提供真實(shí)、令人信服的呈現(xiàn)效果。系統(tǒng)先將視頻編碼為壓縮表示,再在擴(kuò)散模型的指導(dǎo)下,從隨機(jī)噪聲中細(xì)化音頻,最終將音頻波形與視頻數(shù)據(jù)結(jié)合呈現(xiàn)。

(來源:谷歌)

為了提高音頻質(zhì)量,DeepMind在訓(xùn)練過程中添加了人工智能生成的聲音描述和口語對(duì)話轉(zhuǎn)錄。通過學(xué)習(xí)特定視覺內(nèi)容的音頻事件,V2A可以精準(zhǔn)響應(yīng)描述和轉(zhuǎn)錄中包含的信息,讓聲音更加傳神。

然而,V2A也存在一些局限性。例如,音頻質(zhì)量受視頻輸入質(zhì)量影響,偽影或失真會(huì)降低音頻質(zhì)量。同時(shí),口語視頻的口型同步依然具有挑戰(zhàn)性。

目前,V2A技術(shù)尚未普及,DeepMind正在積極收集創(chuàng)作者和電影制作人的反饋,確保技術(shù)能夠?yàn)閯?chuàng)意社區(qū)帶來積極影響。在V2A廣泛應(yīng)用之前,該公司將進(jìn)行嚴(yán)格的安全評(píng)估和測(cè)試。

想了解更多關(guān)于創(chuàng)意技術(shù)的內(nèi)容?點(diǎn)擊咨詢了解火星時(shí)代教育的數(shù)字藝術(shù)培訓(xùn)課程吧!

熱門課程推薦

熱門資訊

請(qǐng)綁定手機(jī)號(hào)

x

同學(xué)您好!

您已成功報(bào)名0元試學(xué)活動(dòng),老師會(huì)在第一時(shí)間與您取得聯(lián)系,請(qǐng)保持電話暢通!
確定