激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

全新AI聲音模仿機(jī)VALL·E,讓你聲音不出口也能表達(dá)!

發(fā)布時(shí)間:2024-08-01 16:52:29 瀏覽量:116次

2022年屬實(shí)是AI大年。

從年初年中的AI繪畫,到年尾的AI作者,好像這個(gè)AI已經(jīng)實(shí)實(shí)在在的刷了一整年的存在感了。

先是畫圖——畫好圖——畫黃圖,再到寫文——寫好文——寫黃文,我不知道AI的制作者們抱著什么樣的偉大信念制作出來這些新穎的好東西,但只要落到網(wǎng)友們的手里,這些數(shù)據(jù)模型肯定會(huì)被灌滿奇怪的東西。

就拿我群里最近瘋狂轉(zhuǎn)發(fā)的AI繪畫最新訓(xùn)練成果來說,在我不知不覺間,這小機(jī)器人已經(jīng)可以精準(zhǔn)的拿捏我的XP了。

不過今天要介紹的并不是這兩個(gè)已經(jīng)被玩壞的AI,而是微軟最新出品的AI成果——語音合成模型VALL·E

它可不是那些影視劇講解里的那些“注意看,這個(gè)男人叫小帥”的固定語氣語調(diào)的AI念稿人,而是號(hào)稱“3秒鐘”就可以復(fù)制你的聲音的賽博卡卡西。

根據(jù)我查來的說法,VALL·E相比傳統(tǒng)的AI語音模型采用“梅爾頻譜”提取特征,它轉(zhuǎn)換了思路與賽道,將語音合成這個(gè)步驟改為“語言模型”的任務(wù)。

以前走音素→梅爾頻譜(mel-spectrogram)→波形的流程,被VALL·E改變成了音素→離散音頻編碼→波形。

——當(dāng)然,盡管這些東西是我寫出來的,但我完全看不懂官方說的是什么,我放張圖也只是顯得文章沒有那么空而已。

在我能看懂的介紹里,讓我覺得最值得發(fā)出來給大家講講的,就是這個(gè)VALL·E,不只是能用過數(shù)據(jù)模仿出采樣人的音色,它連語氣語速都模仿的非常到位。

也就是說,你錄個(gè)幾句話給這個(gè)AI聽一聽,他就能通過這些數(shù)據(jù)來識(shí)別你的語氣語速,并可以在接下來你制作的“作品”中使用這套數(shù)據(jù)——約等于,你不張嘴就把話說了。

除此之外,包括采樣者的背景音和話語中的情緒,VALL·E都能通過學(xué)習(xí)慢慢掌握。

一個(gè)音色、語氣、語調(diào)、語速、情緒甚至是背景里的環(huán)境音被訓(xùn)練到極致的語音AI,說出的話可能真的和本人差別不大了。

搭配上“AI作者”和“AI繪畫”,好家伙,已經(jīng)可以組織起一個(gè)公司會(huì)議上的賽博PPT了,等哪天“AI動(dòng)畫”出來了,我們沒準(zhǔn)還能看見機(jī)器人自己拍的電影。

不少網(wǎng)友也評(píng)論,繼畫家和作者失業(yè)后,這股??怂箍癯苯K于輪到配音演員身上了。

像其他 AI 新技術(shù)一樣,這個(gè)尚未開源的VALL-E在安全、倫理等方面也引發(fā)不少人的擔(dān)憂,盡管微軟發(fā)布了關(guān)于使用 VALL-E 的道德聲明,但未來的事兒誰又說得準(zhǔn)呢。

怎么樣各位,這么看下來,你覺得這個(gè)VALL-E會(huì)不會(huì)是新的一年里的AI藍(lán)海?

熱門課程推薦

熱門資訊

請(qǐng)綁定手機(jī)號(hào)

x

同學(xué)您好!

您已成功報(bào)名0元試學(xué)活動(dòng),老師會(huì)在第一時(shí)間與您取得聯(lián)系,請(qǐng)保持電話暢通!
確定