發(fā)布時間:2023-11-15 15:34:58 瀏覽量:114次
首個“大模型+Agent”SaaS級產品ChatDev來了
金磊 發(fā)自 凹非寺
|
家人們,OpenAI前腳剛發(fā)布自定義GPT,讓人人都能搞開發(fā);后腳國內一家大模型初創(chuàng)公司也搞了個產品,堪稱重新定義開發(fā)——讓AI智能體們協(xié)作起來!
只需一句話,最快3分鐘不到,成本也只要2元多,“啪~”,一個軟件就開發(fā)完了。
例如開發(fā)一個紅包雨的小軟件,現在只需要說一句就好了:
“紅包雨”是一個點擊小游戲,紅包的外觀是紅色高瘦的圓角矩形,紅包緩慢地從上方掉落,每個紅包間距相等 ,沒有重疊,鼠標點擊任意一個紅包,紅包便隨著互動點擊而消失,同時顯示一個吉利的數字,表示搶到這個紅包得到了多少錢。
更重要的一點是,在開發(fā)的整個流程中,從產品經理到程序員,再到設計和測試等等,統(tǒng)統(tǒng)都是AI智能體!
沒錯,全程你只需要提需求,剩下的智能體們會自己討論、交流,甚至還伴隨著battle,最終確定方案并執(zhí)行。
要知道,常規(guī)軟件的開發(fā)周期是在2-3周,且成本在10000-50000美元之間(包括人力);如此對比起來,可真的是大寫的“降本增效”!
這款神器便是ChatDev,是由面壁智能最新推出的SaaS級智能軟件開發(fā)平臺。
其實早在兩個月前,“ChatDev智能體協(xié)作開發(fā)框架”就已經在GitHub上開源,并多次霸榜Trending排行,目前已經攬獲近17000顆star。
而此次面壁智能之所以推出產品版,就是為了把這種“一句話搞開發(fā)”的門檻再次“打下去”。
現在有了它,搞開發(fā)可以說拼得不再是技術了,拼得更多的反倒成了創(chuàng)意。
宛如身邊有一只哆啦A夢,只要你敢想,它就敢給你“造”出來。
那么產品版ChatDev正在帶來什么樣的改變?又是如何做到的?
在產品版ChatDev加持之下,開發(fā)的迭代,也變成了有想法就行的事。
例如你想把“紅包”替換成你想要的元素,同樣也是只需要一句話的那種。
然后AI智能體們就又開始了新一輪工作流程,這次,我們來具體看看它們之間到底是怎么展開工作的。
我們還是先以剛才紅包雨的demo為例。
首先,就像剛才提到的,我們需要做的就只有填寫好“項目名稱”和“Prompt”。
而且即便Prompt寫得不好,在ChatDev旁邊也有一個“一鍵潤色”的功能,自動幫你把需求補充完整。
然后我們就能看到AI智能體們就開始“搓搓小手”準備干活兒了。
CTO先發(fā)話,大概意思就是:
來活兒嘍!客戶要搞個“紅包雨”~
緊接著CTO詳細地拆解了這個需求,把項目要做的每一步都羅列了出來:
任務下達之后,就輪到程序員發(fā)力了。
只見他不費吹灰之力,立即給出了一段Python代碼:
代碼完成之后,還有會有一位AI Counselor,會對整個項目做個總結,并將邏輯、結果等等一并奉上:
整個對話過程可謂是非常絲滑,我們就像一位尊貴的客戶,靜靜地看著這些“AI員工”有條不紊地推進著項目。
不得不感慨,現在搞開發(fā),真的成了有想法就行的事兒了。
例如網絡爬蟲、數據庫讀寫、文件批處理、網頁設計這樣的編程助手;像五子棋、貪吃蛇這樣的休閑小游戲;再如數字時鐘、計算器、繪畫板、圖片編輯器這樣的效率管理和創(chuàng)作輔助工具。
統(tǒng)統(tǒng)都能hold得住~
從早期披露的消息和論文中可以看到,最初的ChatDev,是團隊設計了一套由群體智能串聯(lián)起的ChatChain(交流鏈)。
可視為由原子任務組成的“軟件生產線”,通過專業(yè)角色的智能體進行對話式信息交互和決策,驅動其進行自動化全流程軟件工程。
然而,應用的創(chuàng)新離不開基礎模型能力的提升,隨著面壁智能推出SaaS版ChatDev,我們發(fā)現其自研的基座模型也有了新的版本——
面壁智能自研的新一代千億參數大模型——CPM-Cricket(CPM全稱為Chinese Pretrained Model) 。
據了解,CPM-Cricket是面壁智能的第三代模型,前兩代分別為CPM-Ant、CPM-Bee。
(有意思的一點是,每一代模型的名字是按照英文字母的順序為首字母,并取一個昆蟲的英文單詞來命名。)
至于CPM-Cricket的能力幾何,一言蔽之,是在邏輯、代碼、知識、指令理解等方面有了大幅提升,且全面超越Llama 2的那種。
在經典的LLM評測集(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH等)中,CPM-Cricket表現如下:
或許這樣的一組數據并沒法帶來非常直觀的感受。
那么同樣是基于CPM-Cricket的類ChatGPT產品——Luca 3.0,把它“丟”進公考場景之后的表現,便可以讓CPM-Cricket的能力變得更一目了然了。
題目是這樣的:
選取2022-2023年的公考試題,包括常識判斷、數量關系、資料分析、判斷推理、語言理解與表達等多種題型的425道試題。
例如面對下面這道單選題,Luca 3.0不僅可以秒速作答,還能將每一步的解題步驟詳盡地列出來:
即使是面對話術彎彎繞繞、真人看了都需要反應一會兒的邏輯題目,Luca 3.0的回答也是游刃有余:
可以說,Luca 3.0在這套題上的表現是做到了“快”和“準”。
而與之同臺競技的選手,面壁智能所選取的也是業(yè)界相對標桿的大模型,GPT-4。
不難看出,在重要的常識判斷和判斷推理兩項能力中,Luca 3.0相比GPT-4已經能夠保持相對的優(yōu)勢了。
不僅如此,在英文測試環(huán)境中,Luca 3.0在GMAT官方模擬考試題中的表現,同樣也是GPT-4整體相當(其中閱讀達到GPT-4的97%水位)。
而Luca 3.0之所以能夠取得這般成績,除了背后CPM大模型升級這個因素之外,面壁智能在微調方面也做了相應的策略:
一是課程學習(Curriculum learning,CL)的訓練策略,模仿人類的由易到難的學習過程,先在預訓練中讓模型學習底層推理規(guī)律,然后在對齊階段學習人類的逐步推理思維。
二是思維鏈(Chain-of-thought,CoT)策略,對推理過程分解,讓模型的推理更加具有可解釋性。
(PS:目前Luca已經正式面向公眾開放服務,是可以免費體驗的那種哦~)
在底層基礎設施的其他方面,例如訓練、壓縮和推理,面壁智能也自研了自己的一套打法:
據說其大模型已集成超過16000多個真實API,可實現一鍵接入,調用工具解決更多復雜任務。
此外,面壁智能還部署了Int8量化模型,讓模型推理成本降低50%。
總結來說,面壁智能探索了出更為低成本、高效率的模型訓練方法,讓大模型不僅能“訓出來”,還能“訓得好”、“用得好”。
這可能就是這家創(chuàng)業(yè)公司推動“大模型+Agent”應用落地的實力和底氣。
不過除此之外,基于大模型底座的基礎能力,面壁智能還曾開源了兩項重磅的工作——AgentVerse和XAgent。
加上之前我們提到的ChatDev,三者共同形成了面壁智能的“三駕馬車”,圍繞的核心便是AI智能體。
AgentVerse是一個大模型驅動的智能體通用平臺,它的作用就是打造各式各樣的AI智能體,讓它們具備感知、思考、推理、理解、協(xié)作和執(zhí)行的能力,以便“組團打怪”。
XAgent是大模型驅動的AI智能體應用框架,它可以讓智能體們具備自主規(guī)劃和決策能力,能夠理解人類指令,制定復雜計劃并自主采取行動完成任務。
而ChatDev則更為聚焦,是大模型驅動的多智能體協(xié)作開發(fā)框架,采用軟件工程瀑布模型的思想,將軟件開發(fā)分為軟件設計、系統(tǒng)開發(fā)、集成測試、文檔編制四個主要環(huán)節(jié)。
但若是我們將此次發(fā)布的所有“單節(jié)點”聯(lián)系到一起,就能發(fā)現,面壁智能實則是在下一盤更大的棋——
左手大模型,右手AI智能體,要打造的是一個智能體網絡(Internet of Agents,IoA)。
因為在面壁智能看來,我們已經經歷了從互聯(lián)網到物聯(lián)網的過渡,而接下來的駛向便是智聯(lián)網。
如果說互聯(lián)網是二維信息的聯(lián)通、物聯(lián)網是三維空間的聯(lián)結,那么智聯(lián)網則是進入更高維度的智能體互聯(lián)。
而在智聯(lián)網中,AI智能體應當是最為關鍵的存在,它可以是擬人的原生智能體,也可以是現實中的人和物體的數字孿生智能體。
通過智能體的連接,可以讓AI真正為人類服務,提供價值(生產力的提升、交互方式的改變)。
以一個大膽的想象來比喻,可能在智聯(lián)網的將來,家中的哪怕是一張桌子、一臺冰箱,也會具備智能體的特性,可以與人和其它物體做智能交互。
而這,也正是面壁智能愿景的由來——智周萬物:
“智”即AI Agent智能體;“萬物”可以是人,可以是物。
AI Agent智能體網絡是連接現實世界與虛擬世界的橋梁,并使其真正交互和協(xié)作起來,創(chuàng)造價值。
不過有一說一,智聯(lián)網的理想雖好,但現實的情況是,即使是ChatDev和第三代大模型的發(fā)布,也只能視為邁向愿景的一步。
那么面壁智能是否有足夠的實力能夠在將來解鎖“智周萬物”呢?
對于這個問題,我們首先就要看一下面壁智能的團隊實力如何。
從官方披露的消息可知,面壁智能成立于2022年8月,CEO為李大海,首席科學家是劉知遠。
二人的學術、技術實力已然是不容小覷。
李大海畢業(yè)于北大數學系,后加入谷歌成為Google中國創(chuàng)始員工之一;再后來也有在眾多知名企業(yè)擔任技術負責人、CTO等職務的經歷,對技術體系的搭建和商業(yè)化落地有著豐富的經驗。
劉知遠是清華大學計算機系長聘副教授,主要研究方向為自然語言處理、知識圖譜和社會計算。在人工智能領域著名國際期刊和會議發(fā)表相關論文200余篇,Google Scholar統(tǒng)計引用超過3.7萬次,學術造詣可謂是十分深厚。
不僅如此,官方展示的“顧問”成員也是非常重量級,包括兩位清華大學計算機系教授——孫茂松和劉洋。
不難看出,面壁智能是妥妥一家“清華味”十足的大模型初創(chuàng)企業(yè)。
除此之外,其在產學研生態(tài)道路上也有自己獨特的打法,即“一體兩翼”。
“一體”指的正是面壁智能,而“兩翼”則是OpenBMB和清華NLP實驗室。
據了解,OpenBMB是面壁智能團隊在2021年與清華NLP實驗室共同成立的國內領先大模型研發(fā)與應用開源社區(qū),社區(qū)宗旨為“讓大模型飛入千家萬戶”。
目前除了Agent技術框架,OpenBMB還開源了CPM-Ant、CPM-Bee 10B基礎模型,BMTrain、BMCook、 BMInf 、OpenPrompt、OpenDelta等大模型全流程加速工具包,為中國大模型開源事業(yè)做出了獨樹一幟的貢獻。
清華NLP實驗室,則是國內最早系統(tǒng)開展深度學習與大模型研究的單位,團隊在國際頂級學術會議和國際權威期刊發(fā)表論文200余篇,引用近44000次,并獲得多項最佳論文獎。
由此可見,無論是自身實力,亦或是“一體兩翼”式的強強聯(lián)手,面壁智能在技術這一塊可以說是妥妥拿捏住了。
這也就不難理解,為何僅成立一年的面壁智能,便可將CPM大模型迭代三代,又能在國內率先亮出“大模型+Agent”群體智能模式的產品應用了。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現,快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現,以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
就能快速生成一幅極具藝術效果的作品,讓現實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設計、建筑方案設計、住宅設計、管道設計、出渲染圖、3D掃...
最新文章
同學您好!