當前位置：首頁 >人工智能 >文字直接生成視頻!爆火的Sora，是怎么做到的?

文字直接生成視頻!爆火的Sora，是怎么做到的?

發(fā)布時間：2024-03-05 13:16:11 瀏覽量：290次

2024年2月16日，又一逆天AI模型殺入人類江湖。

有人驚呼“炸裂”“史詩級”，有人嚷嚷“行業(yè)變天，人類下崗”，還有人期待是不是輸入《三體》就能出片了……這個新文本轉(zhuǎn)視頻模型就叫：Sora。

這段場景逼真、氛圍濃厚的多機位短視頻

由新文本轉(zhuǎn)視頻模型Sora生成

這款由美國開放人工智能研究中心Open AI發(fā)布的模型，炸裂到啥程度呢？

就你隨意編輯一串文字，就能生成一個以假亂真的純AI原創(chuàng)視頻。在一些樣片里，視頻中的物體運動軌跡自然，畫面清晰、順暢，它還能夠自己切換鏡頭，甚至給出特寫……

這個像不像你用GoPro手持拍攝的？

嗯，Sora是如何生成這樣的視頻的呢？它真的無所不能嗎，它會搶走人類的飯碗嗎？

01.

屬于AI圖、AI視頻的時間線

先來理一把，把我們驚暈的AI生成圖片模型、AI生成視頻模型的時間線。

2022年下半年，Midjourney、Stable Diffusion之類的應(yīng)用，已經(jīng)可以根據(jù)文本提示詞生成對應(yīng)的圖片。

2023年9月，GPT4.0讓我們能夠用聊天化的方式生成、修改圖片。

至于AI生成視頻模型，Sora發(fā)布之前的主流AI生成視頻時長只能做到4-16秒，還“卡成PPT”，而Sora直接順暢到了60秒。

02.

Sora的視頻創(chuàng)作能力有多強大？

首先，按照官方口徑，Sora能夠根據(jù)提示詞生成出高質(zhì)量的圖片和視頻，并且能夠?qū)σ曨l進行向前或者向后的拓展。

這三個視頻開頭最終都會走向同一個結(jié)尾

圖片截取自：Open AI官網(wǎng)

Sora不僅可以根據(jù)文本生成視頻，也可以直接輸入圖片或者視頻，對圖片和視頻進行編輯調(diào)整。

圖片截取自：Open AI官網(wǎng)

除了第一眼好之外，它還有一些驚人本領(lǐng)。

比如，它可以跟隨著對象移動鏡頭，并且在移動鏡頭轉(zhuǎn)換角度的時候，依然能保持周圍的景象的合理、完整。

比如，多機位。

比如，自然融合兩種完全不相干的場景：

Sora生成，圖源果殼

甚至還可以將圖片轉(zhuǎn)成動態(tài)視頻，而且還不是目前流行的“小動物跳舞”呈現(xiàn)的粗糙效果：

Sora生成，圖源果殼

03.

如此逆天，Sora是如何做到的？

Open AI發(fā)布了一份Sora的技術(shù)報告，在報告中提到“Sora是一個擴散模型”。

擴散模型本身很復(fù)雜，怎么理解呢？舉個例子，假如你現(xiàn)在有一張狗狗的照片，通過一步步給這張照片增加噪點，就能讓它變得越來越模糊，最終會變成一堆噪點。

添加噪聲與去除噪聲，圖源科普中國

反過來，一步步去除噪點，也能把它還原成目標圖片——擴散模型的關(guān)鍵就是學(xué)會逆向去除噪點。

Sora對視頻數(shù)據(jù)進行轉(zhuǎn)換處理

圖片來源：Open AI官網(wǎng)

此外，在以往技術(shù)范式之上，Sora還做出了新東西，比如，不僅可以理解用戶在提示中提出的要求，還能理解它們在物理世界中的存在方式。

這么強！那它的視頻模型的訓(xùn)練應(yīng)該很燒算力吧？

沒錯，大概一周前，Open AI宣布啟動“造芯”計劃，因為目前Open AI每天生成約1000億個單詞，需要大量的GPU芯片進行訓(xùn)練計算。

他們希望籌得7萬億美元！

相當于全球GDP的10%，等同于2.5個微軟、3.75個谷歌、4個英偉達、7個Meta，以及11.5個特斯拉的市值。

04.

Sora安全嗎?它真的沒有缺陷嗎？

這樣的技術(shù)會不會被用來偽造視頻，甚至被用來在法庭上作偽證？

很多人考慮到了安全問題。Open AI也考慮到了。所以，在確保它不會被用來做壞事之前，Sora不會向大眾開放。

另外，雖然Sora展現(xiàn)出了強大的能力，但現(xiàn)階段它還不夠完美。除了專業(yè)人士的評價，Sora的技術(shù)報告也承認，現(xiàn)階段Sora生成的視頻存在一些缺陷。比如下面，它讓考古工作者挖出了一個現(xiàn)代工業(yè)文明才有的塑料椅：

下面這個玻璃杯破碎的過程也不那么“科學(xué)”，杯子還沒裂，液體就流出來了……

再比如下面這個Sara生成的視頻，不需要人類，別的人工智能就能看出它是個“假視頻”，判別理由是：

① 櫻花一般在春天開放，那時不下雪；

② 雪下得太均勻了；

③ 雖然是下雪天，但人穿得很單薄。

至于，把整本《三體》輸進去，能出片嗎？

嗯，目前的Sora雖然有多機位效果，但都是單一情節(jié)、單一鏡頭。

而《三體》有多人視角，敘事復(fù)雜，靠AI生成一條龍搞定并不現(xiàn)實。據(jù)影視行業(yè)從業(yè)者的觀點，目前AI生成雖然高效，但可控性不夠，目前它們主要用在 demo制作、概念設(shè)計、分鏡編排等環(huán)節(jié)。

05.

Sora是否會代替人類視頻工作者？

可以肯定的是，Sora的出現(xiàn)可能會威脅一些動畫素材的制作者。

今年1月，《好萊塢報道》進行了一項針對300名娛樂行業(yè)領(lǐng)導(dǎo)者的調(diào)查，有3/4受訪者表示AI會減少未來的工作崗位，未來3年內(nèi)大約會有20多萬個職位受到影響。而Sora可能會加重這一影響。

不少人高呼影視行業(yè)變天了

有人甚至把好萊塢改成了上面這樣

但是，Sora們帶給我們的真的只有壓力嗎？

其實，每次新興技術(shù)的出現(xiàn)在帶來威脅的同時，不也是帶來了新機會嘛。包括Sora在內(nèi)的視頻生成AI畢竟只是工具，視頻創(chuàng)意來源還是需要人類提供噠。

而且這或許還是讓普通人開掛的利器呢——還要啥視頻團隊呀，1個人加1只模型搞定。

編輯：潮歌

本文編輯自：科普中國

果殼、新聞聯(lián)播

科普蘇州

ID: kepusuzhou

任何疑惑的，需要科學(xué)解答的問題

科普蘇州Q2：700538949

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇 OpenAI又放大招，文字直接生成視頻!網(wǎng)友:我要失業(yè)了

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
2. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念，最具性價比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

文字直接生成視頻!爆火的Sora，是怎么做到的?

請綁定手機號

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

文字直接生成視頻!爆火的Sora，是怎么做到的?

請綁定手機號

文字直接生成視頻!爆火的Sora，是怎么做到的?