激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

OpenAi Sora AI生成視頻技術(shù)文檔解讀

發(fā)布時間:2024-03-28 14:33:09 瀏覽量:219次

2月15日,OpenAi公司發(fā)布了新一代的文本生成視頻的AI大模型Sora。技術(shù)文檔同時也發(fā)布在了他的官網(wǎng)上。技術(shù)文檔中主要粗略概括了Sora的技術(shù)實現(xiàn)路徑和應(yīng)用場景。

大語言模型的基礎(chǔ)是語言是由一個個的詞塊(text token)組成,有了詞塊我們才可以訓(xùn)練機器已更好的方式組織這些詞塊。相比較而言,Sora作為一個視頻生成模型,他的基礎(chǔ)是視覺塊(visual patches)。她的主要原理是將訓(xùn)練視頻轉(zhuǎn)換成視覺塊,然后將解析好的視覺塊再進行轉(zhuǎn)換。


在生成視頻的時候,Sora主要采用的是Diffusion Model。這個model在語言識別,機器視覺以及圖片生成有重要的作用。在視頻生成方面,Diffusion Model也很有用處


Sora除了通過文本生成視頻,也可以通過上傳圖片生成視頻。下圖是用圖片生成的一個視頻



原圖

重播
播放
00:00 / 00:00 直播
00:00
進入全屏
50
    點擊按住可拖動視頻

    Prompt:Monster Illustration in flat design style of a diverse family of monsters. The group includes a furry brown monster, a sleek black monster with antennas, a spotted green monster, and a tiny polka-dotted monster, all interacting in a playful environment.

    同樣的使用國內(nèi)的生成視頻工具也生成了視頻(
    https://makepixelsdance.github.io/),效果如下

    重播
    播放
    00:00 / 00:00 直播
    00:00
    進入全屏
    50
      點擊按住可拖動視頻

      生成效果也挺好,不過這些怪物不如OpenAi里面那些怪物的動作幅度大。OpenAi生成的視頻里面的怪物更加有喜感一些。

      其它的Sora也可以進行視頻的拼接以及增加特效等。

      當(dāng)然,在技術(shù)文檔中OpenAI也說到了Sora的局限性,在模擬物理世界的一些現(xiàn)象的時候仍然不如人意,比如玻璃被摔碎的現(xiàn)象等。

      總的說來,對于這個領(lǐng)域的專家,筆者感覺,這次的發(fā)布并沒有很驚艷的感覺。AI生成視頻的工作還有很多的工作要做。

      熱門課程推薦

      熱門資訊

      請綁定手機號

      x

      同學(xué)您好!

      您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
      確定