發(fā)布時間:2024-07-08 15:09:49 瀏覽量:186次
繼生成式文本大模型 Chatgpt、生成式圖片Stablediffusion之后,生成式語音Text To Speech領(lǐng)域有了一匹黑馬GPT-Sovits。這個黑馬在語音效果克隆領(lǐng)域做得十分突出,利用小樣本聲音數(shù)據(jù)即可實現(xiàn)高度相似的聲音仿真,因此備受矚目。GitHub上的star數(shù)迅速飆升,目前已達27.2K。
無論是C端的內(nèi)容生產(chǎn)者,還是B端用戶,想要使用GPT-Sovits進行內(nèi)容生產(chǎn)都會面臨一些技術(shù)挑戰(zhàn)。下面將介紹如何通過阿里云函數(shù)計算快速托管GPT-Sovits來解決這些挑戰(zhàn)。
在GPT-Sovits的實踐中,為了進一步探討其價值,先聊聊生成式語音的應用場景:
以上的場景與TTS息息相關(guān),TTS作為核心基礎能力被廣泛應用。要構(gòu)建完整效果還需更多工程化實現(xiàn)和其他基礎模型。
通過函數(shù)計算部署GPT-Sovits模型有兩大好處:
1. 無需擔心GPU服務器維護和環(huán)境配置,即可快速部署和體驗模型。
2. 可充分利用函數(shù)計算按量付費、彈性伸縮等優(yōu)勢,為用戶高效提供基于GPT-Sovits模型的文本到語音生成服務。
本方案的技術(shù)架構(gòu)包括函數(shù)計算、文件存儲NAS和專有網(wǎng)絡VPC。
重要:
1. 阿里云不對第三方模型的合法性、安全性、準確性承擔責任。
2. 用戶需自覺遵守第三方模型的用戶協(xié)議、使用規(guī)范和相關(guān)法律法規(guī),使用模型需符合相關(guān)責任。
1. 登錄函數(shù)計算3.0控制臺。
2. 在左側(cè)導航欄選擇應用。
3. 在應用頁面選擇人工智能>語音克隆生成 GPT-SoVITS,點擊立即創(chuàng)建。
4. 在創(chuàng)建應用頁面,選擇直接部署,確保所需權(quán)限已獲取,服務狀態(tài)已開通,其他配置保持默認,然后點擊創(chuàng)建應用。
5. 在活動應用創(chuàng)建提醒對話框中,選中函數(shù)計算FC和文件存儲NAS,同意并進行部署。
6. 等待約1分鐘,部署狀態(tài)變?yōu)椴渴鸪晒?,即可開始體驗應用。
部署完成后,使用DEMO聲音樣例,進行聲音合成體驗。嘗試合成童年經(jīng)典動畫片臺詞:
合成操作步驟:
1. 選擇默認語音模板,輸入文本,點擊合成語音。
2. 合成完成后,點擊播放。
聲音訓練:
通過微調(diào)GPT-Sovits大模型,生成理想的聲音。訓練過程中的中間產(chǎn)物存儲在NAS的output文件夾下。需使用默認的UVR5和ASR模型。
1. 數(shù)據(jù)預處理,上傳原始聲音文件進行處理。
2. 微調(diào)文本,調(diào)整原始文本內(nèi)容。
3. 開始訓練,開啟SoVITS和GPT訓練,模型存儲在NAS下的對應文件夾。
4. 訓練完成后,在語音克隆&推流頁簽刷新頁面,選擇訓練模型,再體驗合成語音。
若需了解更多,請使用釘釘進入“阿里函數(shù)計算官網(wǎng)客戶2群”(群號:64970014484)。
相關(guān)鏈接:
[1] GPT-Sovits:https://github.com/RVC-Boss/GPT-SoVITS
[2] 函數(shù)計算3.0控制臺:https://fcnext.console.aliyun.com/
[3] 官方README:https://github.com/RVC-Boss/GPT-SoVITS/blob/main/docs/cn/README.md
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
同學您好!