當(dāng)前位置：首頁 >人工智能 >「硬核實操」如何擁有一個自己的數(shù)字人模型

「硬核實操」如何擁有一個自己的數(shù)字人模型

發(fā)布時間：2024-01-11 16:49:07 瀏覽量：245次

作者：京東健康陳剛

一、前言

近年來，隨著人工智能技術(shù)，VR，元宇宙等技術(shù)的發(fā)展（可以閱讀從Chat-GPT看技術(shù)概念及醫(yī)療領(lǐng)域科技與應(yīng)用場景），數(shù)字人（Digital Human）逐漸成為研究的熱點之一，數(shù)字人是指通過計算機技術(shù)模擬出的具有人類外表，動作和語言能力的虛擬人物，具體可以應(yīng)用到電影、游戲、虛擬現(xiàn)實、智能客服、帶貨主播等多個領(lǐng)域。

本文大致分為三個章節(jié)：

1.第一部分會介紹常用技術(shù)以及簡介，以及自己用到構(gòu)建一個自己虛擬數(shù)字人用到的3D引擎和三維軟件

2.第二部分會詳細(xì)描述生成細(xì)節(jié)，通過照片建模，創(chuàng)建模型，添加細(xì)節(jié)，添加表情，優(yōu)化效果，接入場景，最終效果

3.第三部分總結(jié)本篇內(nèi)容

從預(yù)見未來到遇見未來，讓我們開始，向上吧技術(shù)人?。?！

二、虛擬數(shù)字人技術(shù)

要聊需要那些技術(shù)，先聊需要那些步驟？

?收集數(shù)據(jù)：首先需要收集自己的數(shù)據(jù)，包括照片、視頻、聲音等，這些數(shù)據(jù)將成為數(shù)字人的基礎(chǔ)。

?人臉檢測：利用計算機視覺技術(shù)對照片進行處理，檢測出其中的人臉?？梢允褂靡延械娜四槞z測算法，例如OpenCV、Dlib等。

?人臉識別：對于檢測出來的人臉，需要利用人臉識別技術(shù)對其進行識別和分析，從而獲取人臉的各種特征和信息?？梢允褂靡延械娜四樧R別算法，例如FaceNet、VGGFace等。

?3D建模技術(shù)：數(shù)字人是一種三維模型，因此需要掌握3D建模技術(shù)。這包括了掌握3D建模軟件的使用，如Blender、Maya、ZBrush等。

?優(yōu)化細(xì)節(jié)：優(yōu)化數(shù)字人的各種細(xì)節(jié)，包括皮膚紋理、發(fā)型、服裝等，讓數(shù)字人更加真實、生動。

?材質(zhì)和紋理制作技術(shù)：數(shù)字人需要具有逼真的材質(zhì)和紋理，因此需要掌握材質(zhì)和紋理制作技術(shù)。這包括了掌握材質(zhì)和紋理制作軟件的使用，如Substance Painter、Photoshop等。

?動畫制作技術(shù)：數(shù)字人需要具有動態(tài)的動作和表情，因此需要掌握動畫制作技術(shù)。這包括了掌握動畫制作軟件的使用，如Unity、Unreal Engine等。

以下文字內(nèi)容較多，先放一個自己建好的模型

1、收集數(shù)據(jù)或者生成圖片

?Photoshop、相機：這部分忽略一下，哈哈哈

?Stable Diffusion：AI圖像生成工具，一個基于Latent Diffusion Models（潛在擴散模型，LDMs）的文圖生成（text-to-image）模型，生成圖片的原理是通過模擬穩(wěn)定擴散過程并生成相應(yīng)的數(shù)據(jù)，然后將數(shù)據(jù)可視化展示為圖片，以幫助用戶更好地理解實驗結(jié)果和數(shù)據(jù)特征

?ChatGPT：OpenAI團隊ChatGPT-4O開發(fā)了一種新的技術(shù)，使ChatGPT也可以生成圖片。這種技術(shù)被稱為DALL·E（即“Drawing Artificially with a Learned Language Model and a Encoder”），它結(jié)合了語言模型和圖像編碼器的能力，能夠根據(jù)給定的文本描述生成對應(yīng)的圖片。

2、人臉檢測和識別

?OpenCV：是一個用于計算機視覺的開源庫，它提供了許多常用的計算機視覺算法和工具，如圖像處理、特征提取、物體檢測、人臉識別、跟蹤等。OpenCV支持多種編程語言，包括C++、Python等。

?Dlib：是一個C++庫，它提供了用于機器學(xué)習(xí)、圖像處理、計算機視覺等領(lǐng)域的算法和工具。其中最知名的功能是人臉識別，它基于深度學(xué)習(xí)和傳統(tǒng)的計算機視覺技術(shù)，并提供了人臉對齊、人臉特征提取等功能。

?FaceNet：是由Google開發(fā)的一個深度學(xué)習(xí)算法，用于將人臉圖像轉(zhuǎn)換為高維向量表示，從而實現(xiàn)人臉識別。FaceNet使用了三個主要組件：卷積神經(jīng)網(wǎng)絡(luò)、三元組損失函數(shù)和在線學(xué)習(xí)方法，這些組件使得FaceNet能夠在大規(guī)模人臉識別任務(wù)中達到很高的準(zhǔn)確率。

?VGGFace：是由牛津大學(xué)的研究團隊開發(fā)的人臉識別算法，它基于深度卷積神經(jīng)網(wǎng)絡(luò)，并使用了許多卷積層和池化層來提取人臉圖像的特征。VGGFace包含了兩個模型：VGGFace和VGGFace2，其中VGGFace是一個較早的模型，而VGGFace2是一個新的模型，它在大規(guī)模人臉識別任務(wù)中具有更好的性能。

3、3D建模技術(shù)

?Blender：是一個用于三維建模、動畫、渲染和交互式應(yīng)用程序開發(fā)的開源軟件。它支持多種三維對象的創(chuàng)建和編輯，包括多邊形網(wǎng)格、NURBS曲線、體積網(wǎng)格等，并提供了豐富的材質(zhì)和紋理編輯器，可以幫助用戶創(chuàng)建出逼真的場景和角色。

?Metashape：前身為PhotoScan）是一個用于三維重建和地形建模的商業(yè)軟件。它可以根據(jù)照片生成高精度的數(shù)字模型，并提供了多種渲染選項和工具，如紋理映射、貼圖、相機校準(zhǔn)等。Metashape還可以將生成的模型導(dǎo)出到其他軟件中進行后續(xù)處理和應(yīng)用。

?Maya：是一款專業(yè)級的三維建模和動畫軟件，廣泛用于電影、電視、游戲等領(lǐng)域。它提供了豐富的建模和動畫工具，包括多邊形網(wǎng)格、NURBS曲線、動力學(xué)仿真、粒子系統(tǒng)等，并支持多種渲染引擎，如Arnold、V-Ray等。

?ZBrush：是一款專業(yè)級的數(shù)字雕刻軟件，用于創(chuàng)建高精度的三維模型和角色。它提供了多種繪畫和雕刻工具，包括多邊形建模、紋理映射、雕刻筆刷等，并支持實時預(yù)覽和交互式渲染。

?LayaAir：是一個用于Web、移動和小游戲開發(fā)的HTML5引擎。它提供了多種功能和工具，如3D渲染、物理引擎、GUI編輯器等，可以幫助用戶創(chuàng)建出高效、高質(zhì)量的Web應(yīng)用和游戲。LayaAir還支持多種開發(fā)語言，包括JavaScript、TypeScript等。

4、動畫制作技術(shù)

?Unity3D：Unity3D是一款實時3D互動內(nèi)容創(chuàng)作和運營平臺，支持多種平臺和設(shè)備，包括PC、移動設(shè)備、虛擬現(xiàn)實和增強現(xiàn)實等。Unity3D提供了強大的編輯器和工具，支持C#和UnityScript等多種編程語言，可用于游戲開發(fā)、AR/VR應(yīng)用開發(fā)等。

?Unreal Engine: Unreal Engine是一款由Epic Games開發(fā)的3D游戲引擎，同樣支持多種平臺和設(shè)備，包括PC、主機、移動設(shè)備、VR和AR等。Unreal Engine提供了強大的編輯器和工具，支持C++和藍圖等多種編程方式，可用于游戲開發(fā)、建筑可視化、虛擬展覽等。

?CryEngine：CryEngine是一款由Crytek開發(fā)的3D游戲引擎，同樣支持多種平臺和設(shè)備，包括PC、主機、移動設(shè)備、VR和AR等。CryEngine提供了強大的編輯器和工具，支持C++和Lua等多種編程方式，可用于游戲開發(fā)、建筑可視化、虛擬展覽等。

?Godot：Godot是一款免費、開源的3D游戲引擎，支持多種平臺和設(shè)備，包括PC、移動設(shè)備、Web和VR等。Godot提供了強大的編輯器和工具，支持GDScript和C#等多種編程語言，可用于游戲開發(fā)、AR/VR應(yīng)用開發(fā)等。

部分軟件圖標(biāo)

除了以上技術(shù)應(yīng)該還有很多技術(shù)，歡迎大家熱烈討論和在評論區(qū)補充

三、構(gòu)建一個自己的數(shù)字人—小陳

第一步用自己的照片生成自己的頭像模型

有以下三種辦法

1、使用 https://avatarsdk.com/ 在線制作，這個H5是基于WebGL的OpenCV技術(shù)構(gòu)建，可以傳一張照片（高p的）生成頭的模型，也可以生成頭和身體模型。

為了不影響建模，一般選擇禿頭，導(dǎo)出數(shù)字人頭部模型

2、使用Polycam軟件應(yīng)用上傳生成導(dǎo)出

拍照時自己站著不要動，我們做數(shù)字人需要頭就可以，拍照的仰角和俯角傾斜，拍40張左右即可

導(dǎo)入Blender進行對點云部分刪除部分，分析建模，然后導(dǎo)出數(shù)字人頭部模型

3、通過照片,格式工廠，在Metashape構(gòu)建模型對點云進行處理導(dǎo)出數(shù)字人頭部模型，原理是一樣的

以上方式根據(jù)具體的需求來，第二三種方式更逼真。

第二步導(dǎo)入模型到UE5中，并安裝插件

安裝 MetaHuman插件（數(shù)字人）、 Bridge插件（建模）、LiveLink插件（交互動作）。插件都裝好后，重啟虛幻引擎

1、導(dǎo)入我們第一步的模型，創(chuàng)建MetaHuman實體，并給實體命名，注意這個名字就是你數(shù)字人的名字

2、雙擊進入，面部選擇網(wǎng)格體也就是我們第一步生成的頭像模型，并給小人選擇合適身體

繼續(xù)點擊提升幀，追蹤活動幀，效果如下圖

繼續(xù)點擊MetaHuman本體解算、網(wǎng)格體轉(zhuǎn)MetaHuman。

3、在UE5中打開Bridge，登陸一下賬號，只有l(wèi)ogo的就是我們的小人了。忽略我設(shè)計的禿頂和爆炸頭小陳

選中l(wèi)ogo模型，點擊START MHC進入MetaHuman Creator網(wǎng)頁，
https://metahuman.unrealengine.com/ 進一步加工我們的MetaHuman吧

第三步調(diào)整你的數(shù)字人

對骨骼，膚色，頭發(fā)，牙齒，身體，表情動作等進行調(diào)整，內(nèi)容太豐富，建議自己嘗試，放一個眼影小陳，和大胡子小陳

第四步下載數(shù)字人并加載到虛幻引擎中

1、打開Bridge點擊Down

2、添加小人到項目中后項目中多了一個MetaHuman的文件夾，移動到你的場景吧

3、最終效果圖，只下載好了（網(wǎng)速不好）禿頭小陳實在不好放大，下次做個好看的在更新下文章吧。

四、總結(jié)和暢想

本文介紹了如何打造一個數(shù)字人，描述業(yè)內(nèi)常用的一些軟件和技術(shù)棧，并實戰(zhàn)打造一個以自己為模型構(gòu)建的虛擬數(shù)字人，并詳細(xì)描述了全過程?？偟膩碚f數(shù)字人具備了逼真的人類外貌、身體動作和語言能力的虛擬人物，不同的制作方法和技術(shù)可以實現(xiàn)不同的效果和應(yīng)用，選擇合適的方法和技術(shù)需要根據(jù)具體需求和項目情況來確定。

大家將就看完了，模型還是丑丑的，下一步持續(xù)提升，讓數(shù)字人擁有智慧，擁有交互，擁有顏值（畢竟顏值才是正義）。

關(guān)于數(shù)字人如何創(chuàng)建和相關(guān)技術(shù)就介紹到這里啦，我也是剛?cè)腴T，有不對的地方和需要補充的，歡迎大家指正，希望對大家所有幫助，也歡迎多多點贊收藏。

最后關(guān)于數(shù)字人的應(yīng)用場景和結(jié)合實際的落地效果，大家有好的idea也可以一起討論。

五、團隊介紹

我們是互聯(lián)網(wǎng)醫(yī)療服務(wù)團隊，主要是在醫(yī)藥閉環(huán)流程中，承接醫(yī)患兩端服務(wù)平臺，包括派單、問診、處方等垂直領(lǐng)域業(yè)務(wù)，團隊一直致力于在醫(yī)療行業(yè)中探索和應(yīng)用各種新興的科技手段。目前主要在醫(yī)學(xué)對話，遠(yuǎn)程醫(yī)療、醫(yī)學(xué)影像診斷等方面進行探索和嘗試，相信可以為醫(yī)生和患者帶來更好的醫(yī)療服務(wù)體驗。

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇虛擬人是如何制作的?企業(yè)專屬虛擬形象如何定制打造成虛擬代言?

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
2. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念，最具性價比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
9. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
10. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

「硬核實操」如何擁有一個自己的數(shù)字人模型

一、前言

二、虛擬數(shù)字人技術(shù)

1、收集數(shù)據(jù)或者生成圖片

2、人臉檢測和識別

3、3D建模技術(shù)

4、動畫制作技術(shù)

三、構(gòu)建一個自己的數(shù)字人—小陳

第一步用自己的照片生成自己的頭像模型

第二步導(dǎo)入模型到UE5中，并安裝插件

第三步調(diào)整你的數(shù)字人

第四步下載數(shù)字人并加載到虛幻引擎中

四、總結(jié)和暢想

五、團隊介紹

請綁定手機號

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

「硬核實操」如何擁有一個自己的數(shù)字人模型

一、前言

二、虛擬數(shù)字人技術(shù)

1、收集數(shù)據(jù)或者生成圖片

2、人臉檢測和識別

3、3D建模技術(shù)

4、動畫制作技術(shù)

三、構(gòu)建一個自己的數(shù)字人—小陳

第一步 用自己的照片生成自己的頭像模型

第二步 導(dǎo)入模型到UE5中，并安裝插件

第三步 調(diào)整你的數(shù)字人

第四步 下載數(shù)字人并加載到虛幻引擎中

四、總結(jié)和暢想

五、團隊介紹

請綁定手機號

一、前言

1、收集數(shù)據(jù)或者生成圖片

2、人臉檢測和識別

3、3D建模技術(shù)

4、動畫制作技術(shù)

三、構(gòu)建一個自己的數(shù)字人—小陳

第一步用自己的照片生成自己的頭像模型

第二步導(dǎo)入模型到UE5中，并安裝插件

第三步調(diào)整你的數(shù)字人

第四步下載數(shù)字人并加載到虛幻引擎中

四、總結(jié)和暢想

五、團隊介紹