發(fā)布時間:2024-04-09 12:38:07 瀏覽量:185次
OpenAI確實是一個很好的領(lǐng)先者,但它不可能壟斷整個市場。
文|《中國企業(yè)家》記者 孔月昕
編輯|馬吉英
頭圖來源|視覺中國
作為九合創(chuàng)投創(chuàng)始人,王嘯曾預(yù)判到視頻的多模態(tài)生成在今年有可能出現(xiàn),但他沒想到會這么快。
2月16日凌晨,他刷到了Sora提供的長達1分鐘的視頻,發(fā)現(xiàn)視頻的細節(jié)、光影處理非常逼真,給他留下了非常深刻的印象。
事實上,文生視頻大模型或應(yīng)用并不新奇,去年就已經(jīng)有不少相關(guān)產(chǎn)品或模型出現(xiàn)。Meta、Runway、Pika、Adobe等公司都發(fā)布過視頻生成工具,國內(nèi)大廠及部分創(chuàng)業(yè)公司也在該領(lǐng)域進行研究,且部分公司也取得了一定突破。
不過,此前AI生成的短視頻大多數(shù)還停留在10秒以內(nèi),視頻的“真實性”也大打折扣,遠遠達不到Sora呈現(xiàn)的長達1分鐘的穩(wěn)定效果。
因此,Sora的出現(xiàn),意味著生成式AI迎來了新的機會。行者AI創(chuàng)始人、CEO尹學(xué)淵透露,整個團隊都非常興奮,干勁十足?!拔覀兠刻於荚谘芯空垓v?!痹谒挠∠罄?,上一次這么興奮,還是ChatGPT發(fā)布的時候。
Sora很大程度上推動了生成視頻應(yīng)用加速發(fā)展的趨勢。王嘯也認為,OpenAI再次明確了視頻模型的技術(shù)發(fā)展路徑,最快6個月后,可能就有開源的“Sora”出現(xiàn)了。
“我相信今年就是AIGC視頻超級應(yīng)用的元年?!本⒖萍紕?chuàng)始人、CEO朱江表示。
Sora的到來究竟會如何影響行業(yè)發(fā)展?投資人從中又發(fā)現(xiàn)了哪些新機會和新趨勢?圍繞相關(guān)話題,《中國企業(yè)家》近期采訪了九合創(chuàng)投創(chuàng)始人王嘯、行者AI創(chuàng)始人、CEO尹學(xué)淵、井英科技創(chuàng)始人、CEO朱江,以下為采訪整理。
九合創(chuàng)投創(chuàng)始人王嘯:
不用擔心Sora或OpenAI能通吃
其實Sora目前的發(fā)展路徑在ChatGPT出來之后基本就可以預(yù)判了。
Sora是通過Transformer加上過去大模型帶來的知識庫,再加Diffusion做出來的。我們在以前就有預(yù)判,Transformer加上部分原有算法有可能突破多模態(tài)生成的瓶頸,但(它的到來)確實是比我們想象中要快。
王嘯 攝影:鄧攀
另一方面,Transformer+專業(yè)場景數(shù)據(jù),可能會在其他場景出現(xiàn)類似突破,比如說機器人領(lǐng)域的具身智能、生物領(lǐng)域中的DNA和蛋白生成相關(guān)領(lǐng)域,都可能通過這種算法模型將隱藏的規(guī)律和信息計算模擬出來。
通過這個理解再進行推演,我們認為其他領(lǐng)域也存在大模型重新改寫其中底層技術(shù)的可能性。一旦能成功改寫,在應(yīng)用層就會取得巨大突破。
基于此,我覺得OpenAI是新時代結(jié)構(gòu)性能力的提供者,它提供了一種大模型通用智能架構(gòu)和能力的輸出。但這個能力要想運用在我們?nèi)粘9ぷ骰蛏a(chǎn)中,就需要針對場景進行各種各樣的整體解決方案的打造。就相當于一輛車,如果只有發(fā)動機也沒法跑,還需要輪子、座艙。
OpenAI提供了新時代人工智能的“發(fā)動機”,這一點非常有價值。就好像有了蘋果這樣的硬件公司,基于移動網(wǎng)絡(luò),產(chǎn)生了抖音、快手、微信等應(yīng)用,這是一層一層互相依存發(fā)展的。但做移動網(wǎng)絡(luò)或者5G的公司,不一定能夠把手機做出來,做手機的公司還能把APP也做好,它們需要的能力不是完全一樣的。
GPT解決了基座問題,而且也給到了行業(yè)范例,很多開源模型如Llama 2,以及國內(nèi)的一些開源軟件,我覺得也可以用?,F(xiàn)在Sora出來了,最快再過6個月我覺得開源的“Sora”可能也做得出來。因為技術(shù)路線基本確定之后,有一些團隊是可以做出來相當能力的產(chǎn)品,所以我覺得Sora不太容易形成技術(shù)上的獨占性。
因此,我覺得未來是分工合作的機會,OpenAI確實是一個很好的領(lǐng)先者,但它不可能壟斷整個市場。
Sora相關(guān)的視頻模型的能力,我覺得未來在to C和to B都有機會,因為它是一種結(jié)構(gòu)性的能力。無論對于家庭、個人,還是企業(yè)、機器人等,它都能延伸到各個方面,只不過載體不同。比如進入工廠制造領(lǐng)域,它需要跟機器人、加工機床的軟件結(jié)合;如果延伸到to C就一定要跟手機、筆記本電腦、Vision Pro等新型終端結(jié)合起來。
目前大模型生成內(nèi)容并不完全可控,它有時有幻想、有時會瞎說,生成的視頻里面偶爾還存在問題,這都需要應(yīng)用層的創(chuàng)業(yè)者去把它按照場景進行規(guī)劃、生成和使用。
因此,(即使Sora出現(xiàn))我覺得還存在大量創(chuàng)業(yè)機會,不用擔心Sora或OpenAI能通吃。
不過,在部分大模型通用能力領(lǐng)域中,(創(chuàng)業(yè)公司)如果想跟大廠競爭,這對資源的要求非常高。但在垂直領(lǐng)域或行業(yè)領(lǐng)域里解決一些具體問題,我覺得大廠能夠覆蓋的不一定多,也不一定有垂直領(lǐng)域的創(chuàng)業(yè)公司專業(yè)。
對于大家談到的算力緊缺問題,從整體上講,大模型的確是利用大量的數(shù)據(jù)和算力形成的模型能力,進而去解決某些特定問題,比如視頻生成、語言生成等。簡單來說,我覺得它是一個用“大力出奇跡”的拆解模式去模擬世界或視頻生成中的一部分。當模型的數(shù)據(jù)量越大,它的效果就越好。
但我也認為,到一定程度后,它可能就不需要更多算力、模型和數(shù)據(jù)了,在某個程度上它可能存在收斂的部分。盡管算力在里面起到了關(guān)鍵性作用,但我不認為它是決定性部分。
此外,我覺得未來可能會產(chǎn)出針對性的算力芯片。新架構(gòu)算力硬件或芯片出現(xiàn)后,算力的瓶頸可能會取得突破性的進展。我覺得可能需要一年時間驗證我們面向未來的推測。
井英科技創(chuàng)始人、CEO朱江:
超級應(yīng)用有機會在中國誕生
我覺得Sora出來之后,對我們最有啟發(fā)的還是技術(shù)角度。我們覺得基于Diffusion Transformer的技術(shù)路線,接下來還會成為行業(yè)研發(fā)的熱點;此外,Scaling Law在整個視頻生成領(lǐng)域也存在很大作用。
盡管從業(yè)內(nèi)來看,我們認為(Sora的技術(shù)路線)不是一個新的東西,但OpenAI在整個實踐過程中令人非常敬佩,而且比我們預(yù)想的快了3~6個月的時間。
朱江 來源:受訪者
這對整個視頻生成相關(guān)行業(yè)都是一件好事,我們可以向投資人或者一些圈外的朋友回答一個問題,就是AI生成的視頻,用戶是否愿意看,或者未來能否成為用戶視頻消費的主流內(nèi)容。
我們認為AI加上內(nèi)容后,可能會給整個內(nèi)容的生產(chǎn)關(guān)系和創(chuàng)作者帶來變革,進而會出現(xiàn)新一代的內(nèi)容平臺。比如抖音或TikTok的出現(xiàn),這就是基于手機的普及以及手機攝像頭作為生產(chǎn)力工具的載體變化;其次是短視頻這種形態(tài)的出現(xiàn),用戶在手機上可以全屏沉浸式地觀看視頻;配合30~60秒快節(jié)奏,手指滑動就可以去閱讀視頻的體驗;以及圍繞著短視頻出現(xiàn)的表演型的創(chuàng)作者。得益于這幾個條件,市場上出現(xiàn)了新一代短視頻超級內(nèi)容平臺。
總結(jié)超級內(nèi)容平臺出現(xiàn)的條件:首先是生產(chǎn)力工具的變革;其次是圍繞著生產(chǎn)力工具出現(xiàn)了新的創(chuàng)作者;第三是有一種非常適合創(chuàng)作的內(nèi)容形式;最后形成了一個新的內(nèi)容平臺,內(nèi)容平臺是個結(jié)果。
那么,AIGC時代為什么一定會出現(xiàn)新的超級內(nèi)容平臺?第一是生產(chǎn)力工具發(fā)生了變革,我覺得以Diffusion Transformer為基礎(chǔ)的視頻生成模型,在今天讓所有人看到了AI生成的視頻。從質(zhì)量角度來說,一定能達到用戶可接受的程度。
第二,我覺得更重要的一點是出現(xiàn)了一群新的創(chuàng)作者,這群創(chuàng)作者既不是像YouTube平臺的知識型創(chuàng)作者,也不是像抖音上的表演型創(chuàng)作者,而是出現(xiàn)了一群以創(chuàng)意為最核心競爭力的創(chuàng)作者。換句話說,就是只要創(chuàng)作者的腦海里有一個很好的故事,或者是有一個非常優(yōu)美打動人心的情節(jié),就可以用AIGC的工具把它生成出來。
第三,我們理解的短劇不單單是現(xiàn)在大家看到的一個個劇情很爽、節(jié)奏很快的內(nèi)容,我們認為短劇其實是一種新的內(nèi)容形式。它是一種長短視頻結(jié)合的方式,單看每一集,其實它是一個短視頻,有30~60秒,但把它連在一起100集時,它又表達了一個很長很有深度的故事,就像原來的電影,但換了新的方式去表達。
因此,我認為圍繞新工具的創(chuàng)作者以及新內(nèi)容形式的出現(xiàn),最終會催生出一個新的內(nèi)容平臺,這也是我們一直非??春玫臋C會。去年年底,我們也面向美國地區(qū)發(fā)布了第一款短劇的APP Reel.AI,我們現(xiàn)在生成的內(nèi)容其實在海外也取得了不錯的成績:單集內(nèi)容已經(jīng)有了上百萬的播放量;生成的內(nèi)容也在美國地區(qū)獲得了一定的用戶付費。
因此,我們認為AIGC時代有很多機會,OpenAI這樣的模型基座公司可能是新一代的“水電煤”,在此之上一定也會有AIGC時代的超級應(yīng)用型公司。
我也更相信中國公司能做出世界級的AIGC的超級內(nèi)容平臺。因為過去這幾年,我覺得中國人對整個內(nèi)容的理解,包括技術(shù)的結(jié)合其實更加深入,我們也一直在這條道路上。我們希望能夠隨著視頻技術(shù)的進步快速達到臨界點,加速去實現(xiàn)我們自己的愿景。
行者AI創(chuàng)始人、CEO尹學(xué)淵:
人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI
去年,部分公司已經(jīng)發(fā)布了一些(視頻)模型,但目前的效果都不盡如人意。而Sora的出現(xiàn),在速度和質(zhì)量上大大超出了我們的預(yù)期。且Sora采用的Transformer和Diffusion模型融合的技術(shù)路線,是非常別出心裁的,也給我們團隊包括創(chuàng)業(yè)者帶來了很多啟發(fā)和思路。
同時,文生視頻模型出現(xiàn)的時間點提前了,各行各業(yè)可能都會衍生出更多新機會,也能刺激更多人來擁抱整個AI行業(yè),包括更多研究者投入AI領(lǐng)域共同推進技術(shù)進步。
尹學(xué)淵 來源:受訪者
與此同時,底層工具的更新迭代讓AI工具唾手可得后,未來行業(yè)競爭主要會面向應(yīng)用場景的理解、產(chǎn)品的交付上,像游戲、文旅、教育、營銷等場景,要將AI真正落地應(yīng)用,這也對創(chuàng)業(yè)者提出了更高要求。過去,創(chuàng)業(yè)者可能靠一個模型、算法,再做一個BP(融資商業(yè)計劃書),就可以融資;但現(xiàn)在底層技術(shù)已經(jīng)卷到這個高度了,必然就要求創(chuàng)業(yè)者能夠通過對場景的理解,以及產(chǎn)品的交付,真正實現(xiàn)在市場上掙到錢,再進一步去融資,實現(xiàn)正循環(huán)。
至于OpenAI是否會取代其他創(chuàng)業(yè)公司,我覺得不太可能。ChatGPT和GPT-4已經(jīng)出現(xiàn)一年多了,但在細分領(lǐng)域大家運用的也不完全是GPT的能力,更多的還是在使用創(chuàng)業(yè)公司的自研模型以及微調(diào)后的模型解決具體問題。
找準賽道、真正持續(xù)為用戶產(chǎn)生價值才是最重要的。除極少數(shù)的底層研究以外,通用大模型的落地同樣要考慮“最后一公里”的問題。創(chuàng)業(yè)團隊需要通過數(shù)據(jù)、算法、模型、應(yīng)用,在場景落地獲得經(jīng)濟收益,實現(xiàn)正循環(huán),進一步獲取數(shù)據(jù)調(diào)用模型,掙到錢后把人才留住,再調(diào)優(yōu)算法,吸引更多用戶使用產(chǎn)生更多的數(shù)據(jù),整個項目就跑起來了,創(chuàng)業(yè)公司或產(chǎn)品也很難會被替代掉。
因此,AI時代的創(chuàng)業(yè)公司被OpenAI替代并不是一件非常簡單的事情,并不是說OpenAI搞定了一件事,其他人就都要失業(yè)了。
相反,我覺得人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI。如果沒有OpenAI開啟的這兩次浪潮,沒有人關(guān)注AI目前是怎么回事兒。國內(nèi)基本上使用的是國產(chǎn)大模型,也給中國的創(chuàng)業(yè)者帶來了更多機會。
新聞熱線&投稿郵箱:tougao@iceo.com.cn
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
最新文章
同學(xué)您好!