激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

人工智能技術再次迎來重大突破!OpenAI發(fā)布文本生成視頻模型Sora,可生成60秒高清流暢視頻

發(fā)布時間:2024-03-05 15:34:30 瀏覽量:129次

深圳商報·讀創(chuàng)客戶端記者 張郗郡

北京時間2月16日凌晨,OpenAI發(fā)布了旗下首個文本生成視頻模型Sora。據(jù)介紹,該模型可以根據(jù)輸入的文字指令直接生成60秒左右的視頻,視頻分辨率最高可達1080P,其中還包括了細致的背景、多角度的鏡頭以及多種類型的角色。

打開OpenAI的官網(wǎng),目前官方已經(jīng)公布了48條由Sora生成并且沒有進行任何編輯的視頻。

當輸入一段如下所示的文字:

“一個時髦的女人走在東京的街道上,到處都是溫暖的霓虹燈和生動的城市標志。她穿著黑色皮夾克、紅色長裙、黑色靴子,拿著一個黑色錢包。她戴著太陽鏡,涂著紅色的口紅。她走起路來自信而隨意。街道是潮濕和反光的,營造出了彩色燈光的鏡子效果。一旁還有許多行人走來走去。”

Sora便生成了一則如文字內(nèi)容所示,長達59秒的連貫視頻。視頻中,“鏡頭”隨著女人的行走而移動,并且擁有全身、臉部特寫多種景別,不管是皮膚的質(zhì)感、衣服上的褶皺,還是背景中的行人和街頭景色,都做到了幾乎能夠以假亂真的程度。

來源:OpenAI官網(wǎng)

此外,官網(wǎng)公布的視頻案例還包括了自然風光、動物世界、宇宙探索等多個場景,就連生成3D效果的動畫也不在話下。在官網(wǎng)展示的視頻中,Sora根據(jù)指令生成了3D動畫風格的“毛絨怪獸”和海底景觀。視頻中,一只長著獨角的毛絨小怪獸面朝著一支正在燃燒的蠟燭,臉上是如文字指示一般“驚奇和好奇”的表情,且“張開嘴巴凝視著火焰”,就制作的細膩程度而言,怪獸身上的絨毛、蠟燭火焰的光線,都已經(jīng)能夠和現(xiàn)在市場中一些簡單的3D動畫制作水平相媲美。

來源:OpenAI官網(wǎng)

Sora的問世,無疑是人工智能發(fā)展過程中的又一道重要里程碑。在此之前,行業(yè)內(nèi)的AI視頻生成模型主要包括Runway在2023年6月發(fā)布的Gen-2、PIKA Labs在2023年11月發(fā)布的Pika1.0等,但所生成視頻的長度均停留在幾秒至十幾秒,視頻的真實度也有待提高。而Sora不管是在視頻的長度、復雜程度還是內(nèi)容準確度方面,均展現(xiàn)出了目前業(yè)內(nèi)最佳的水平。這也引發(fā)了影視和動畫行業(yè)從業(yè)者的恐慌,許多業(yè)內(nèi)人士表示,Sora 的問世意味著以前需要花費大量金錢和人工的特效畫面可以輕松生成,一旦真正應用到影視工業(yè)中,整個行業(yè)將面臨一場巨大的“工業(yè)革命”。

誠然,目前Sora的視頻生成能力并沒能達到十全十美的地步,官網(wǎng)公布的視頻中也包含了一些錯誤案例,比如倒著跑步的人和憑空出現(xiàn)的動物。OpenAI同時也表示,目前正在教AI理解和模擬運動中的物理世界,以訓練模型來幫助人們解決需要現(xiàn)實世界交互的問題。但比起視頻的真實程度,Sora的問世在OpenAI看來,更是一種理解和模擬現(xiàn)實世界的模型的基礎,而這一能力,將是實現(xiàn)AGI(通用人工智能)的重要里程碑。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學您好!

您已成功報名0元試學活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定