激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

ai數(shù)字人是什么?怎么做?數(shù)字人相關(guān)行業(yè)公司介紹!

發(fā)布時間:2024-01-11 20:20:33 瀏覽量:250次

2023 年,數(shù)字人直播徹底火了。根據(jù)艾媒咨詢的統(tǒng)計,2022 年一年虛擬主播(數(shù)字人)企業(yè)注冊增加數(shù)就高達(dá) 948 家,增速達(dá) 68 %。

數(shù)字人即虛擬數(shù)字人,指存在于非物理世界中,由計算機(jī)圖形學(xué)、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等計算機(jī)手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物,也被稱為虛擬形象、虛擬人等。

數(shù)字人

數(shù)字人分類

(1) 從驅(qū)動方式劃分虛擬數(shù)字人的分類,可以分為真人驅(qū)動型和智能驅(qū)動型。

真人驅(qū)動型虛擬數(shù)字人:這種類型的虛擬數(shù)字人主要基于真實人物,通過視頻監(jiān)控系統(tǒng)捕捉用戶的視頻,實時與用戶進(jìn)行語音互動,并借助動作捕捉采集系統(tǒng)將真人的表情和動作呈現(xiàn)在虛擬數(shù)字人形象上,從而實現(xiàn)與用戶的互動。

智能驅(qū)動型虛擬數(shù)字人:這種類型的虛擬數(shù)字人通過智能系統(tǒng)自動讀取和解析外部輸入信息,根據(jù)解析結(jié)果做出決策,生成數(shù)字人后續(xù)的輸出文本,然后通過驅(qū)動人物模型產(chǎn)生相應(yīng)的語音和動作,與用戶進(jìn)行互動。這些人物模型是通過AI技術(shù)預(yù)先訓(xùn)練而得,能夠通過文本生成語音和對應(yīng)的動畫。隨著人工成本逐漸攀升以及人工智能技術(shù)的不斷進(jìn)步,智能驅(qū)動型虛擬數(shù)字人有望成為未來的行業(yè)發(fā)展趨勢。

(2) 從商業(yè)化和應(yīng)用場景來區(qū)分,虛擬數(shù)字人可分為內(nèi)容/IP型、功能服務(wù)型和虛擬分身型。

內(nèi)容/IP型虛擬數(shù)字人:主要應(yīng)用于影視、文娛和市場營銷等領(lǐng)域。功能服務(wù)型虛擬數(shù)字人則更多地應(yīng)用于行業(yè)服務(wù)場景,如電商、金融、教育、醫(yī)療、文旅等。這兩種類型的虛擬數(shù)字人主要面向B端市場。

虛擬分身型虛擬數(shù)字人:除了服務(wù)于B端市場外,這種類型的虛擬數(shù)字人還滿足C端用戶的需求,用于虛擬空間中的形象分身和代理,例如在虛擬社交平臺中的應(yīng)用。

數(shù)字人怎么制作?

傳統(tǒng)的虛擬人的實現(xiàn)主要由形象設(shè)計、建模、驅(qū)動、渲染4大環(huán)節(jié)組成。其中形象設(shè)計、建模、驅(qū)動、渲染環(huán)節(jié)主要依靠影視CG、VFX技術(shù)與游戲引擎等實現(xiàn)。

建模環(huán)節(jié)通過3D建模技術(shù),將虛擬人形象進(jìn)行細(xì)節(jié)精細(xì)還原。驅(qū)動環(huán)節(jié)則依賴于動作捕捉技術(shù),將真實人類的動作遷移到虛擬人上,包括形體、表情、眼神和手勢等方面的關(guān)鍵點變化。而渲染技術(shù)則通過實時渲染技術(shù),提升虛擬人的逼真程度。

然而,隨著技術(shù)的不斷進(jìn)步,制作虛擬數(shù)字人的過程變得更加便捷和高效。

現(xiàn)在,想要制作一個數(shù)字人分身,只需要提供一段3-5分鐘的真人出鏡口播視頻,就可以提交克隆的需求。一般情況下,完成整個數(shù)字人的制作只需要3-5天的時間。這得益于精準(zhǔn)控制數(shù)字人的嘴唇和肢體動作等關(guān)鍵要素,使得數(shù)字人的擬真度可以達(dá)到極高水平,甚至接近99%,其外表與真人基本無異。

數(shù)字人行業(yè)相關(guān)公司

騰訊智影

“騰訊智影”是一款集成了AI創(chuàng)作能力的智能創(chuàng)作工具,提供虛擬數(shù)字人、文本配音、文章轉(zhuǎn)視頻、模板創(chuàng)作、在線視頻剪輯等功能,“智影數(shù)字人”是其中的核心功能,可提供數(shù)字人播報解決方案等相關(guān)解決方案。

小冰公司(前身是微軟小冰團(tuán)隊)

小冰提供“人工智能數(shù)字員工”解決方案,在內(nèi)容生成方面,依托小冰框架的人工智能創(chuàng)造能力(AIGC),數(shù)字員工可以快速學(xué)習(xí)業(yè)務(wù)數(shù)據(jù),獲取相應(yīng)技能,穩(wěn)定輸出文本、圖片、音頻、視頻等內(nèi)容;而在交互能力方面,數(shù)字員工具備情感對話和多模態(tài)交互的特點,可進(jìn)行人聲定制,同時支持多語種和多方言交流。

硅基智能

硅基智能數(shù)字人匯集了多項領(lǐng)先技術(shù),包括人物形象模擬、智能語音交互、NLP(自然語言處理)、無穿戴表情動作捕捉以及openGPT大語言模型等,將這些技術(shù)有機(jī)融合,從而迅速構(gòu)建出外貌與真人接近,智力也接近真人水平的AI數(shù)字人。

借助人物形象模擬技術(shù),硅基智能數(shù)字人能夠模仿各種外貌特征,從肢體動作到面部表情,細(xì)致地還原真人的各種細(xì)微動作。

風(fēng)平智能

風(fēng)平智能借助先進(jìn)的AIGC、NLP(自然語言處理)、AI驅(qū)動等技術(shù),能夠生成五官比例和人臉特征細(xì)節(jié)都逼真還原的超仿真數(shù)字人,同時接入類Chat GPT以及上百種語音模型,進(jìn)一步讓數(shù)字人擁有媲美人類的語言能力。

風(fēng)平智能傾向于做好技術(shù)和產(chǎn)品,尤其注重數(shù)字人+大模型的AI數(shù)字人解決方案,已經(jīng)涵蓋了銀行保險、基金證券、醫(yī)療、新東方、萬達(dá)等一系列的大客戶。也是目前唯一一個可以支持本地高達(dá)20G的高清視頻作為背景的,這對有高質(zhì)量要求的大企業(yè)幫助很大,可以做各種大屏幕的演示展覽。

在數(shù)字人領(lǐng)域,許多公司都在不斷探索創(chuàng)新。例如,騰訊智影提供了集成了AI創(chuàng)作能力的智能創(chuàng)作工具,小冰公司則專注于“人工智能數(shù)字員工”的解決方案,硅基智能則匯集了多項領(lǐng)先技術(shù),風(fēng)平智能則專注于數(shù)字人與大模型的綜合解決方案。這些公司的努力和創(chuàng)新,正推動著數(shù)字人直播行業(yè)不斷向前發(fā)展,為未來帶來了更多可能性。

熱門課程推薦

熱門資訊

請綁定手機(jī)號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定