激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

OpenAI又放大招,文字直接生成視頻!網(wǎng)友:我要失業(yè)了

發(fā)布時間:2024-03-05 16:08:29 瀏覽量:180次

2月16日凌晨

OpenAI再次扔出一枚“深水炸彈

發(fā)布了首個文生視頻模型Sora


Sora可以直接輸出長達(dá)60秒的視頻

并且包含高度細(xì)致的背景

復(fù)雜的多角度鏡頭

以及富有情感的多個角色



目前官網(wǎng)上已經(jīng)更新了48個視頻展示,在這些視頻中,Sora不僅能準(zhǔn)確呈現(xiàn)細(xì)節(jié),還能理解物體在物理世界中的存在,并生成具有豐富情感的角色。該模型還可以根據(jù)提示、靜止圖像甚至填補現(xiàn)有視頻中的缺失幀來生成視頻。


讓我們看看Sora的效果

???

例如一個Prompt(大語言模型中的提示詞)的描述是:在東京街頭,一位時髦的女士穿梭在充滿溫暖霓虹燈光和動感城市標(biāo)志的街道上。



在Sora生成的視頻里,女士身著黑色皮衣、紅色裙子在霓虹街頭行走,不僅主體連貫穩(wěn)定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮濕的街道地面反射霓虹燈的光影效果。


AI想象中的龍年春節(jié),紅旗招展人山人海。有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。



行駛中的列車窗外偶遇遮擋,車內(nèi)人物倒影短暫出現(xiàn)非常驚艷。



豎屏超近景視角下,一只蜥蜴細(xì)節(jié)拉滿。



在一杯咖啡中,兩艘海盜船展開了激烈的戰(zhàn)斗,近景視頻非常寫實。



OpenAI表示,他們正在教AI理解和模擬運動中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實世界交互的問題。


隨后OpenAI解釋了Sora的工作原理,Sora是一個擴散模型,它從類似于靜態(tài)噪聲的視頻開始,通過多個步驟逐漸去除噪聲,視頻也從最初的隨機像素轉(zhuǎn)化為清晰的圖像場景。Sora使用了Transformer架構(gòu),有極強的擴展性。

視頻和圖像是被稱為“補丁”的較小數(shù)據(jù)單位集合,每個“補丁”都類似于GPT中的一個標(biāo)記(Token),通過統(tǒng)一的數(shù)據(jù)表達(dá)方式,可以在更廣泛的視覺數(shù)據(jù)上訓(xùn)練和擴散變化,包括不同的時間、分辨率和縱橫比。

Sora是基于過去對DALL·E和GPT的研究基礎(chǔ)構(gòu)建,利用DALL·E 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好地遵循文本指令。


一位YouTube博主發(fā)表了對Sora的感想,他表示內(nèi)容創(chuàng)作行業(yè)已經(jīng)永遠(yuǎn)地改變了,并且毫不夸張?!拔疫M(jìn)入YouTube世界已經(jīng)15年時間,但OpenAI剛剛的展示讓我無言……動畫師/3D藝術(shù)家們有麻煩了,素材網(wǎng)站將變得無關(guān)緊要,任何人都可以無壁壘獲得難以置信的產(chǎn)品,內(nèi)容背后的‘想法’和故事將變得更加重要?!?/span>


但Sora模型當(dāng)前也存在弱點

???

OpenAI稱它可能難以準(zhǔn)確模擬復(fù)雜場景的物理原理,并且可能無法理解因果關(guān)系。例如,一個人咬了一口餅干后,餅干可能會沒有咬痕,玻璃破碎的物理過程可能也無法被準(zhǔn)確呈現(xiàn)。

例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”的視頻,狼的數(shù)量會變化,一些狼憑空出現(xiàn)或消失。


網(wǎng)友評論:

這效果也太真了吧

???


也有網(wǎng)友直呼:

工作要丟了

???


對此,你怎么看?


來源:南方日報綜合界面新聞、每日經(jīng)濟新聞

熱門課程推薦

熱門資訊

請綁定手機號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定