激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

OpenAI推出視頻生成模型Sora,一句文本描述即可生成17秒櫻花視頻

發(fā)布時間:2024-03-28 15:50:49 瀏覽量:210次

當(dāng)?shù)貢r間 2 月 15 日,OpenAI 發(fā)布了一個名為 Sora 的新型視頻生成模型。它可以根據(jù)簡短的文字提示(prompt),將其轉(zhuǎn)化為長達一分鐘的高清視頻,鏡頭感堪比電影。



圖 | Sora 所生成視頻的截圖(來源:Sora)


在新聞公布之前,OpenAI 給《麻省理工科技評論》發(fā)送了四份樣片。這家總部位于舊金山的公司已然再次定義了“文本到視頻生成”的可能性:這是一個熱門的研究方向,《麻省理工科技評論》將其視為 2024 年值得關(guān)注的科技發(fā)展趨勢之一。


OpenAI 的科學(xué)家蒂姆·布魯克斯(Tim Brooks)說:“我們認為,建立能夠理解視頻的模型,并理解我們世界中所有這些非常復(fù)雜的交互,對于未來所有的人工智能系統(tǒng)而言,是非常重要的一步。”


但 OpenAI 給我們分享的視頻附加了嚴(yán)格的保密條件。如果我們想提前看到有關(guān) Sora(日語蒼穹的意思)的信息,就必須等到該模型的消息公開發(fā)表之后,才能咨詢和征求外部專家的意見。


OpenAI 尚未發(fā)布有關(guān) Sora 的詳細技術(shù)報告,也未解釋或證明該模型如何有效。它還表示不會很快向公眾發(fā)布 Sora。以下是我們收到的視頻片段:


第一個可以從文本中生成視頻的生成式人工智能模型出現(xiàn)在 2022 年末。但 Meta、谷歌和一家名為 Runway 的初創(chuàng)公司的早期成果充滿了各種小問題,看起來也比較粗糙。


自那以后,這項技術(shù)發(fā)展得很快。Runway 在 2023 年發(fā)布的 Gen-2 模型可以制作質(zhì)量接近大型工作室動畫的短片。但大多數(shù)成果仍然只有幾秒鐘長。


而 OpenAI Sora 的演示視頻是高清的,充滿了豐富的細節(jié)。OpenAI 還表示,它可以生成長達一分鐘的視頻。


一段東京街頭場景的視頻顯示,Sora 已經(jīng)學(xué)會了三維世界中的物體是如何組合在一起的:當(dāng)一對夫婦路過一排商店時,攝像機會切入這個場景并跟隨他們。


OpenAI 還表示 Sora 能夠很好地處理遮擋?,F(xiàn)有模型的一個問題是,當(dāng)一些物體從視線中消失后,它們可能無法繼續(xù)跟蹤這些物體。例如,如果一輛卡車從路牌前面經(jīng)過,路牌可能就徹底消失了。


在一段紙制水下場景的視頻中,Sora 在不同鏡頭之間進行了無縫轉(zhuǎn)換,模型在它們之間保持了一致的風(fēng)格。


當(dāng)然,Sora 生成的視頻還不完美。在東京的視頻中,左邊的汽車看起來比旁邊的人還小。它們也會在樹枝之間進進出出。


布魯克斯說:“在長期一致性方面,肯定還有一些工作要做。例如,如果有人長時間離開視線,他們就不會再出現(xiàn)了。模型有點忘記了他們應(yīng)該出現(xiàn)在那里?!?/span>


盡管我們看到的視頻片段很驚艷,但這些展示視頻無疑是經(jīng)過精心挑選的,以展示 Sora 的最佳表現(xiàn)。


如果沒有更多詳細信息,我們很難知道它們在多大程度上代表了模型的平均水平。


我們可能還需要一段時間才能清楚地知道 Sora 的水平。OpenAI 今天宣布的有關(guān) Sora 的消息,更像是一次科技圈的造勢。


該公司表示,目前沒有向公眾發(fā)布 Sora 的計劃,但它將首次開始與第三方安全測試人員共享該模型。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定