當(dāng)前位置：首頁 >人工智能 >真實到令人顫栗:Sora開辟AI生成視頻新紀(jì)元

真實到令人顫栗:Sora開辟AI生成視頻新紀(jì)元

發(fā)布時間：2024-03-05 17:59:27 瀏覽量：142次

2月16日，Open AI公司發(fā)布了一款能夠根據(jù)文字提示生成視頻的人工智能工具——Sora。

暫停

00:09 / 01:05

00:00

進(jìn)入全屏

點擊按住可拖動視頻

這段時長60秒左右的視頻展示了小狗雪地嬉戲直視鏡頭、無人機(jī)視角下東京的雪景和海浪沖擊大蘇爾懸崖、笑容滿面的老奶奶享受生日派對等多個場景畫面。

Sora視頻生成技術(shù)不僅能夠復(fù)制現(xiàn)實中的場景，還能夠創(chuàng)造出我們現(xiàn)實中并不存在但在感覺上又非常真實的畫面。

其實，在過去一年中人工智能生成的圖像、音頻和視頻的質(zhì)量已經(jīng)得到迅速提高。OpenAI、谷歌、Meta、Stable Diffusion等眾多公司競相開發(fā)更先進(jìn)、更容易使用的工具，目前大多數(shù)模型生成視頻只有幾秒鐘的時長。

但是，Sora顯然更為出眾。它不僅能夠生成長達(dá)60秒的高清視頻，而且能更好地組合三維世界物體。這種技術(shù)不僅能夠復(fù)制現(xiàn)有的場景，還能夠創(chuàng)造出我們從未見過的、但感覺上又非常真實的畫面。用OpenAI自己的話來說：“Sora能夠生成具有多個角色、特定類型的動作、準(zhǔn)確主題和豐富背景細(xì)節(jié)的復(fù)雜場景?！?/p>

Sora 生成圖片 20歲少年坐在云朵上閱讀

專家稱這是一項具有顛覆性的技術(shù)。

目前，OpenAI 尚未發(fā)布有關(guān) Sora 的詳細(xì)技術(shù)報告，也未解釋或證明該模型如何有效。

據(jù)《麻省理工科技評論》人工智能欄目高級編輯威爾·道格拉斯·海文的文章介紹，Sora 結(jié)合了擴(kuò)散模型與 Transformer 神經(jīng)網(wǎng)絡(luò)技術(shù)。

擴(kuò)散模型背后的直覺來源于物理學(xué)。在物理學(xué)中氣體分子從高濃度區(qū)域擴(kuò)散到低濃度區(qū)域，這與由于噪聲的干擾而導(dǎo)致的信息丟失是相似的。所以通過引入噪聲，然后嘗試通過去噪來生成圖像。在一段時間內(nèi)通過多次迭代，模型每次在給定一些噪聲輸入的情況下學(xué)習(xí)生成新圖像。

Transformer 是 OpenAI GPT-4和谷歌 Gemini 等大型語言模型中的靈魂。它非常擅長處理長序列的數(shù)據(jù)，比如單詞，但是視頻不是由文字構(gòu)成的。因此，研究人員想到辦法在空間和時間上將視頻分割成數(shù)據(jù)塊，然后讓 Transformer 像處理文本塊中的單詞那樣處理這些視頻數(shù)據(jù)塊。采用這種方式使得用來訓(xùn)練 Sora 的視頻類型更為豐富。

盡管如此，OpenAI表示Sora仍存在明顯的“弱點”，特別是在空間細(xì)節(jié)方面，如分不清左右方向以及因果關(guān)系。舉一個例子，生成的一個視頻中有人咬了一口餅干，但之后并沒有咬痕。

Sora技術(shù)的未來發(fā)展充滿了無限的可能性。

在娛樂產(chǎn)業(yè)，它可以用于創(chuàng)造更加逼真的電影、游戲和虛擬現(xiàn)實體驗。在教育領(lǐng)域，Sora技術(shù)可以用來模擬復(fù)雜的科學(xué)實驗或歷史事件，幫助學(xué)生更好地理解和學(xué)習(xí)。此外，它在醫(yī)療、軍事等領(lǐng)域也有著廣泛的應(yīng)用前景。

但短期內(nèi)，預(yù)計配音演員、游戲、教育、廣告制作、短視頻制作領(lǐng)域?qū)艿阶畲蟮臎_擊。

人工智能技術(shù)角逐背后最大的贏家

英偉達(dá)顯然已成為人工智能計算芯片領(lǐng)域的領(lǐng)袖。在過去的12個月里，這家總部位于加州的公司股價上漲了246%。上周，英偉達(dá)股價一度收于每股781.28美元，市值達(dá)到1.78萬億美元。比亞馬遜的1.75萬億美元市值還要高。

據(jù)報道，這是自2002年以來，英偉達(dá)的市值首次在收盤后超過亞馬遜。

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇最強(qiáng)Ai文字成片大模型:Sora，橫空出世，可惜國內(nèi)用不了

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
2. 華為手機(jī)神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念，最具性價比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
10. 10個建筑AI工具，從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的

講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

真實到令人顫栗:Sora開辟AI生成視頻新紀(jì)元

請綁定手機(jī)號