發(fā)布時(shí)間:2024-08-01 18:06:47 瀏覽量:132次
自動(dòng)駕駛、圖像生成、2D轉(zhuǎn)3D……
2024年,哪些AI論文最火?又是哪些論文最具突破性?
最近一位研究生、YouTube博主總結(jié)了今年AI最新突破列表,視頻、文章和代碼一應(yīng)俱全。
我們從中梳理出八大類,就跟大家一起來康康~
從中梳理最多的,當(dāng)屬一些利好視頻博主的技術(shù)了。
比如,這個(gè)TimeLens,它可以制作慢動(dòng)作視頻,最大范圍可從原有的30幀擴(kuò)展成900幀。
再比如,這個(gè)編輯神器VGPNN——單個(gè)視頻幾秒內(nèi)多樣化生成。
像刪除或添加某人、改變背景、時(shí)間拉長(zhǎng)、改變長(zhǎng)寬比、分辨率等功能在它面前,都是基本操作。
還有像在不影響背景或其他對(duì)象情況下,移動(dòng)圖像中的對(duì)象;使用AI分離真實(shí)世界中的聲音,語音、音樂和音效之類……
具體在畫質(zhì)處理上,今年英特爾就用英偉達(dá)顯卡做了畫質(zhì)增強(qiáng)補(bǔ)丁。今年6月,這個(gè)Demo在全網(wǎng)火了一把。
為了在GTA上效果更真實(shí),研究人員改變了視頻中3點(diǎn)特征:增加汽車的光澤、改善植被的整體外觀、讓瀝青路面看起來更光滑。
對(duì)此,有網(wǎng)友表示,這比路徑追蹤便宜多了。
如果說肆掠的疫情讓視頻會(huì)議火了一把,那么視頻會(huì)議軟件讓背景替換技術(shù)搬到了臺(tái)前。
谷歌研究員就提出了一種重新光照的方法Total Relighting,來給人像做背景替換。
它能根據(jù)新添加的場(chǎng)景光線,重新點(diǎn)亮任何肖像,以此看起來更加真實(shí)。
這一方法還可進(jìn)一步延伸至電影、專業(yè)視頻制作中,up主可以用起來。
此外,除了背景替換,還有文字替換,風(fēng)格還保留的那種。
今年,F(xiàn)acebook提出了一種AI模型,它可以直接翻譯或編輯圖像中的文本,并且遵照同樣的風(fēng)格。
類似這樣~
圖像生成領(lǐng)域,最具突破性的當(dāng)屬DALL·E——OpenAI在新年推出的“AI設(shè)計(jì)師”,吳恩達(dá)點(diǎn)贊的那種。
簡(jiǎn)單來說就是,提出你的文本需求, 它來生成圖像。從原理上看,類似于GPT-3在文本合成圖像方向上的擴(kuò)展版。
比如輸入“OpenAI公司門面”,它就能給出十幾張?jiān)O(shè)計(jì)圖供你選擇。
還有像根據(jù)手繪草圖來生成圖像、使用隨機(jī)微分方程進(jìn)行圖像合成和編輯等進(jìn)展。
這是除圖像生成外,另一個(gè)2024 AI領(lǐng)域熱度極高的研究方向。
試想一下,如果只在現(xiàn)實(shí)生活中拍攝一張對(duì)象照片,就可創(chuàng)建3D格式將其插入視頻或者游戲中,會(huì)有多酷。
谷歌研究院提出的ShaRF就可以做到,比如隨意拍的一個(gè)椅子。
英偉達(dá)也提出了類似的解決方案GANverse3D,只需一張圖像,就可創(chuàng)建可自定義的3D動(dòng)畫。
還有前段時(shí)間火爆外網(wǎng)的假3D場(chǎng)景,也是通過一組照片渲染出來的。
以及LASR模型——從短視頻中單拎出一個(gè)對(duì)象來,創(chuàng)建人類或動(dòng)物的3D模型……類似的方法還有很多。
你是否想過把CNN與Transformer結(jié)合起來?
2024年,“跨界輸出”在AI領(lǐng)域掀起潮流。
基于CNN效率和Transformer的表達(dá)能力,德國(guó)海德堡大學(xué)的研究人員提出一種高分辨率圖像生成的方法——Tl;DR。
還不只是CNN和Transformer。
斯坦福和Facebook的研究人員提出GANsformers——基于StyleGAN2架構(gòu)中Transformer的注意力機(jī)制,來生成場(chǎng)景圖片。
除此之外,還有原有模型基礎(chǔ)上應(yīng)用層面的延伸。
就如谷歌提出了基于StyleGAN2架構(gòu)的改進(jìn)版,創(chuàng)建了一個(gè)AI在線試衣間。
只需要提供一張你的圖像,就能自動(dòng)試穿任何衣服。
還有像巴塞羅那大學(xué)的研究人員開發(fā)了一種基于深度學(xué)習(xí),能從航拍圖像中自動(dòng)檢測(cè)漂浮的垃圾,并計(jì)算數(shù)量。
為此,他們還制作了一個(gè)APP,用戶可在海面圖像中識(shí)別這些垃圾。
還有Apple提出應(yīng)用在相冊(cè)的ML算法,在iOS 15上自動(dòng)識(shí)別私人照片中的人;DeepMind提出了一個(gè)使用雷達(dá)深度生成模型,來更準(zhǔn)確的預(yù)報(bào)天氣。
明尼蘇達(dá)大學(xué)的研究人員打造了一款賽博朋克手臂——AI驅(qū)動(dòng)的神經(jīng)接口。
據(jù)介紹,截肢者可以像尋常人一樣靈巧的控制手臂。
對(duì)于開發(fā)者而言,今年最具突破性的進(jìn)展莫過于編程神器——GitHub Copilot,由GitHub與openAI聯(lián)合開發(fā)。
只需描述出你想要執(zhí)行的命令,就能生成相應(yīng)的代碼。
甚至程序員只要寫下一段注釋,Github Copilot就可以補(bǔ)全剩下的代碼、提出改進(jìn)的建議,為程序員省去大量查找的時(shí)間。
值得一提的是,這次還有特斯拉的自動(dòng)駕駛?cè)脒x。
在特斯拉的AI day上,人工智能總監(jiān)展示了特斯拉如何通過8個(gè)攝像頭來獲取圖像到道路導(dǎo)航的過程。
這當(dāng)中包括壓縮數(shù)據(jù)、二維轉(zhuǎn)變?yōu)槿S輸出等操作。
……
除此之外,還有像面對(duì)第三次人工智能浪潮,研究人員對(duì)AI中快與慢思考;AI偽造類似“探探”個(gè)人檔案,來探討人類會(huì)不會(huì)向右滑動(dòng);Transformer是如何在CV領(lǐng)域取代CNN的?
感興趣的旁友,可戳下方鏈接了解更多詳情哦~
目前仍在更新當(dāng)中。
GitHub鏈接:
https://github.com/louisfb01/best_AI_papers_2024
熱門資訊
1. 照片變漫畫效果,這4個(gè)方法操作簡(jiǎn)單有效,快來試試吧!
想將照片變成漫畫效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡(jiǎn)單操作就能實(shí)現(xiàn),快來嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來,創(chuàng)意無限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來,快來了解Viggle AI的功能和優(yōu)勢(shì)吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價(jià)比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費(fèi)無限制的AI視頻生成工具火了!國(guó)內(nèi)無障礙訪問!附教程
人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...
最新文章
同學(xué)您好!