發(fā)布時(shí)間:2024-04-09 13:19:02 瀏覽量:210次
封面新聞?dòng)浾?楊鑫 溫彥博 尚志
Sora引發(fā)的人工智能行業(yè)震動(dòng)還在席卷世界。這個(gè)在2月16日凌晨,由OpenAI發(fā)布的首個(gè)文生視頻模型,可以用文字指令生成長達(dá)60秒的高清流暢視頻,在生成視頻長度、連貫性、多鏡頭切換方面具備顯著優(yōu)勢,能力幾乎“碾壓”目前其他類似模型。
過去幾天時(shí)間里,國內(nèi)外科技、影視、社會(huì)等各界知名人士紛紛發(fā)表觀點(diǎn),驚嘆技術(shù)的飛躍。驚訝之余,更多AI相關(guān)企業(yè)從業(yè)者開始尋找行業(yè)機(jī)會(huì)。封面新聞對(duì)話亞馬遜云科技、考拉悠然、阿加犀科技、諦達(dá)諾科技、超有范兒科技、車包包、iFUN.COM等企業(yè)相關(guān)人士,他們?cè)趺纯创齋ora,又將怎么辦?
怎么看?“重要里程碑事件”
“從目前Sora展現(xiàn)出來的能力來看,它可以成為理解和模擬現(xiàn)實(shí)世界的基礎(chǔ),而這一能力必將是實(shí)現(xiàn)通用人工智能的重要里程碑。”成都阿加犀智能科技有限公司CEO孫曉剛?cè)缡钦f。
成都考拉悠然科技有限公司CTO謝延認(rèn)為,Sora模型提供了一種更加高效高質(zhì)量的從自然語言到視頻的生產(chǎn)方式,OpenAI也許希望通過生成的視頻來模擬真實(shí)的世界,相比于之前的模型(GPT-4V,google gemini)在視覺生成方向大大地邁進(jìn)了一步,持續(xù)為 AGI 的普及提供動(dòng)力。但是這一切也只能算是一個(gè)新的開始,用模型理解真實(shí)的物理世界的工作才算剛剛起步。
孫曉剛也表示,在驚嘆Sora展現(xiàn)出的能力的同時(shí),也應(yīng)該看到背后巨大的成本:據(jù)業(yè)內(nèi)信息,OpenAI 每天生成約 1000 億個(gè)單詞,需要大量的 GPU進(jìn)行訓(xùn)練計(jì)算。高昂成本使得絕大多數(shù)企業(yè)難以與之競爭,但Sora所帶來的市場機(jī)會(huì)卻是異常龐大的。
成都超有范兒科技有限公司CEO范明從技術(shù)方面進(jìn)行觀察,在他看來,單純從這項(xiàng)技術(shù)來說未來內(nèi)容生產(chǎn)的成本將極大降低,目前國內(nèi)的各大模型廠家也會(huì)不斷跟進(jìn)這樣的技術(shù)棧的突破,這些都會(huì)對(duì)于視頻內(nèi)容生成行業(yè)、數(shù)字孿生行業(yè)帶來較大的沖擊。
iFUN.COM 是一家 AI 算法公司,發(fā)行了多款游戲產(chǎn)品。 iFUN.COM 大中華區(qū)CEO王瑜認(rèn)為,Sora的出現(xiàn)對(duì)游戲行業(yè)是極大利好,能降低人力成本、加速游戲生產(chǎn),例如未來在CG畫面制作方面效率將大幅提高。不過她堅(jiān)信人是不可替代的,“AI要具備游戲?qū)а菟季S還有很長的路要走?!比绾巫孲ora這類工具在游戲行業(yè)垂直應(yīng)用,是該企業(yè)的AI 研究院正在與國內(nèi)外相關(guān)高校持續(xù)研究的課題。
亞馬遜云科技人工智能產(chǎn)品架構(gòu)師李雪晴認(rèn)為,Sora解決了目前主流模型常見的一些難以商業(yè)化的技術(shù)點(diǎn),比如一致性,時(shí)序性等等,但也仍然有一些不足,比如對(duì)于真實(shí)物理作用的理解和生成。由此Sora的發(fā)布得到了各行各業(yè)的廣泛關(guān)注,也帶來了機(jī)會(huì)。
在李雪晴看來,Sora背后的機(jī)會(huì)有四,一是提供了一條在文生視頻領(lǐng)域新的技術(shù)路徑;二是Sora給予了用戶在更多行業(yè)場景的想象空間;三是相關(guān)模態(tài)的想象空間也隨之?dāng)U大,例如語音,3D等;四是人才,數(shù)據(jù),算力三位一體打造了多模態(tài)領(lǐng)域的涌現(xiàn)能力,三者缺一不可。
怎么辦?“積極擁抱變化”
謝延認(rèn)為,Sora模型的誕生,毋庸置疑會(huì)進(jìn)一步加速大模型技術(shù)的應(yīng)用落地,在原有的場景下進(jìn)一步提升想象空間,特別是結(jié)合場景的多模態(tài)能力應(yīng)用,利用大模型技術(shù)重塑原有的使用場景、使用體驗(yàn),重塑產(chǎn)業(yè)鏈上下游。從技術(shù)發(fā)展的角度來說,今年會(huì)加強(qiáng)對(duì)物理世界的感知,做好現(xiàn)實(shí)世界到虛擬世界的連接。
據(jù)介紹,考拉悠然一直專注于多模態(tài)領(lǐng)域的技術(shù)研究,2023 年 11 月就正式發(fā)布了悠然多模態(tài)產(chǎn)業(yè)通用大模型,除了支持常見的NLP能力以外,在圖片、視頻理解方面提供業(yè)界領(lǐng)先的多模態(tài)理解能力。2024 年第一季度開始DT(diffusion transformer)模型的研究,目前已經(jīng)具備初步的多模態(tài)生成能力,比如個(gè)性化圖片,tts 等。Sora 模型的誕生,也更加堅(jiān)定了公司的戰(zhàn)略方向,預(yù)計(jì)在2024年第二季度推出真正的多模態(tài)理解和生成一體的產(chǎn)業(yè)模型,為企業(yè)客戶持續(xù)賦能,加速AI普惠化。
阿加犀是AI產(chǎn)業(yè)鏈上聚焦智能物聯(lián)網(wǎng)邊緣計(jì)算的人工智能企業(yè),也扮演著大模型搬運(yùn)工的角色。孫曉剛說,阿加犀提供的大模型邊緣端部署方案,一方面讓大模型推理擺脫了對(duì)云端算力的依賴,不僅降低帶寬、算力和能耗成本,并且也進(jìn)一步保障了用戶的隱私安全;另一方面,AI要真正實(shí)現(xiàn)無處不在,它必將是邊緣端與云端計(jì)算協(xié)同共存的。讓數(shù)據(jù)在更靠近終端用戶的邊緣端完成處理并輸出結(jié)果,是提升生產(chǎn)效率和生活體驗(yàn)的有效手段和必由之路。
范明坦言,目前短期來看國內(nèi)很難有廠家能夠超越Sora這樣大模型技術(shù)能力,“所以超有范兒這樣的技術(shù)研發(fā)和應(yīng)用公司,更重要的是首先了解和熟悉一線大廠的大模型技術(shù)邏輯,然后在自己的領(lǐng)域中深挖應(yīng)用落腳點(diǎn),才能有機(jī)會(huì)突破和趕超?!?/p>
車包包(北京)聚合技術(shù)有限責(zé)任公司創(chuàng)始人王茂認(rèn)為,“基于大模型開發(fā)商業(yè)應(yīng)用才是效益最大的,而且日后最占據(jù)話語權(quán)的,也是這些有能力把AI 商業(yè)化落地應(yīng)用的人?!苯Y(jié)合車包包所從事的行業(yè)數(shù)智化能力,AI還是一種數(shù)字智能化工具,可以理解為相應(yīng)的行業(yè)有了一種“標(biāo)準(zhǔn)”。他表示,熱愛自己職業(yè)和工作的、有創(chuàng)造力的專業(yè)人士們反而更輕松了,不必把有限的精力用在其他所謂資源的競爭消耗上。
無獨(dú)有偶,李雪晴也認(rèn)為,就像大語言模型一樣,不可能有一個(gè)模型做所有的事,事實(shí)上垂直領(lǐng)域的大模型和應(yīng)用更具備商業(yè)價(jià)值。因此這實(shí)際上是對(duì)GenAI創(chuàng)業(yè)者的利好,亞馬遜云科技也準(zhǔn)備好與客戶一起探索并提供堅(jiān)實(shí)的算力支持和豐富的合作資源。
此外,智能硬件企業(yè)也在積極擁抱大模型。四川諦達(dá)諾科技有限公司是一家將人工智能、大數(shù)據(jù)分析等技術(shù)應(yīng)用于幼兒園“管、教、保”場景的高新技術(shù)企業(yè),其自主研發(fā)的兒童健康智能機(jī)器人目前已落地全國65個(gè)城市,服務(wù)超過2000家幼兒園。“積極擁抱變化,今年計(jì)劃讓機(jī)器人接入大模型?!敝B達(dá)諾科技科技CEO許波表示,將接入一些比較細(xì)分的大模型,推出更聰明的智能機(jī)器人,緊緊抓住教育和康養(yǎng)這“一小一老”場景,開發(fā)具象機(jī)器人/數(shù)字虛擬人等智能硬件+大模型產(chǎn)品。
【如果您有新聞線索,歡迎向我們報(bào)料,一經(jīng)采納有費(fèi)用酬謝。報(bào)料微信關(guān)注:ihxdsb,報(bào)料QQ:3386405712】
熱門資訊
1. 照片變漫畫效果,這4個(gè)方法操作簡單有效,快來試試吧!
想將照片變成漫畫效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實(shí)現(xiàn),快來嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價(jià)比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
最新文章
同學(xué)您好!