當前位置：首頁 >人工智能 >谷歌AI動畫接龍:只用頭尾兩幀圖像，片刻生成完整視頻!

谷歌AI動畫接龍:只用頭尾兩幀圖像，片刻生成完整視頻!

發(fā)布時間：2024-04-12 17:33:11 瀏覽量：227次

【新智元導讀】谷歌研究人員利用3D卷積網(wǎng)絡打造視頻生成新系統(tǒng)，只需要視頻的第一幀和最后一幀，就能生成完整合理的整段視頻，是不是很神奇？

漫畫書秒變動畫片了解一下？

想象一下，現(xiàn)在你的手中有一段視頻的第一幀和最后一幀圖像，讓你負責把中間的圖像填進去，生成完整的視頻，從現(xiàn)有的有限信息中推斷出整個視頻。你能做到嗎？

這可能聽起來像是一項不可能完成的任務，但谷歌人工智能研究部門的研究人員已經(jīng)開發(fā)出一種新系統(tǒng)，可以由視頻第一幀和最后一幀生成“似是而非的”視頻序列，這個過程被稱為“inbetween”。

“想象一下，如果我們能夠教一個智能系統(tǒng)來將漫畫自動變成動畫，會是什么樣子？如果真實現(xiàn)了這一點，無疑將徹底改變動畫產(chǎn)業(yè)?！霸撜撐牡墓餐髡邔懙??！半m然這種極其節(jié)省勞動力的能力仍然超出目前最先進的水平，但計算機視覺和機器學習技術的進步正在使這個目標的實現(xiàn)越來越接近。”

原理與模型結構

這套AI系統(tǒng)包括一個完全卷積模型，這是是受動物視覺皮層啟發(fā)打造的深度神經(jīng)網(wǎng)絡，最常用于分析視覺圖像。它由三個部分組成：2D卷積圖像解碼器，3D卷積潛在表示生成器，以及視頻生成器。

圖1：視頻生成模型示意圖

圖像解碼器將來自目標視頻的幀映射到潛在空間，潛在表示生成器學習對包含在輸入幀中的信息進行合并。最后，視頻生成器將潛在表示解碼為視頻中的幀。

研究人員表示，將潛在表示生成與視頻解碼分離對于成功實現(xiàn)中間視頻至關重要，直接用開始幀和結束幀的編碼表示生成視頻的結果很差。為了解決這個問題，研究人員設計了潛在表示生成器，對幀的表示進行融合，并逐步增加生成視頻的分辨率。

圖2：模型生成的視頻幀序列圖，對于每個數(shù)據(jù)集上方的圖表示模型生成的序列，下方為原視頻，其中首幀和尾幀用于生成模型的采樣。

實驗結果

為了驗證該方法，研究人員從三個數(shù)據(jù)集中獲取視頻 - BAIR機器人推送，KTH動作數(shù)據(jù)庫和UCF101動作識別數(shù)據(jù)集 - 并將這些數(shù)據(jù)下采樣至64 x 64像素的分辨率。每個樣本總共包含16幀，其中的14幀由AI系統(tǒng)負責生成。

研究人員為每對視頻幀運行100次模型，并對每個模型變量和數(shù)據(jù)集重復10次，在英偉達Tesla V100顯卡平臺上的訓練時間約為5天。結果如下表所示：

表1：我們報告了完整模型和兩個基線的平均FVD，對每個模型和數(shù)據(jù)集重復10次，每次運行100個epoch，表中FVD值越低，表示對應生成視頻的質量越高。

表2：使用直接3D卷積和基于的替代方法的模型的平均SSIM

RNN（SDVI）或光流（SepConv和SuperSloMo），數(shù)值越高越好。

研究人員表示，AI生成的視頻幀序列在風格上與給定的起始幀和結束幀保持一致，而且看上去說得通。“令人驚喜的是，這種方法可以在如此長的時間段內實現(xiàn)視頻生成，”該團隊表示，“這可能給未來的視頻生成技術研究提供了一個有用的替代視角?！?/p>

參考鏈接：

https://venturebeat.com/2019/05/28/googles-ai-can-create-videos-from-start-and-end-frames-alone/

論文鏈接：

https://arxiv.org/pdf/1905.10240.pdf

上一篇北師大未來設計學院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇用ai畫人物具體操作教程，有AI配音軟件嗎

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
2. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。用戶可以使...
8. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫排行榜:4090無懸念，最具性價比出人意料

在AI繪圖領域，Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
10. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

谷歌AI動畫接龍:只用頭尾兩幀圖像，片刻生成完整視頻!

原理與模型結構

實驗結果

請綁定手機號

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

谷歌AI動畫接龍:只用頭尾兩幀圖像，片刻生成完整視頻!

原理與模型結構

實驗結果

請綁定手機號

谷歌AI動畫接龍:只用頭尾兩幀圖像，片刻生成完整視頻!