當(dāng)前位置：首頁 >人工智能 >HuggingFace 聯(lián)創(chuàng)發(fā)推：高質(zhì)量微調(diào)數(shù)據(jù)集才是“卷”大模型的正確姿勢(shì)

HuggingFace 聯(lián)創(chuàng)發(fā)推：高質(zhì)量微調(diào)數(shù)據(jù)集才是“卷”大模型的正確姿勢(shì)

發(fā)布時(shí)間：2023-11-07 17:57:20 瀏覽量：122次

打造出一個(gè)新穎、高效且前沿的小型AI模型

最近，NLP大牛、HuggingFace聯(lián)合創(chuàng)始人Thomas Wolf 發(fā)了一條推特，內(nèi)容很長(zhǎng)，講了一個(gè) “全球三大洲的人們公開合作，共同打造出一個(gè)新穎、高效且前沿的小型AI模型” 的故事。

HuggingFace 聯(lián)創(chuàng)發(fā)推：高質(zhì)量微調(diào)數(shù)據(jù)集才是“卷”大模型的正確姿勢(shì)

故事是這樣開始的，在幾個(gè)月前，巴黎的一個(gè)新團(tuán)隊(duì)發(fā)布了他們首個(gè)模型：Mistral 7B，這個(gè)模型體積小巧但性能強(qiáng)勁，在基準(zhǔn)測(cè)試中的表現(xiàn)超過了所有同類模型。

這還是個(gè)開源項(xiàng)目，意味著大家都可以在此基礎(chǔ)上進(jìn)行開發(fā)。

另一個(gè)研究模型微調(diào)和對(duì)齊的H4團(tuán)隊(duì)的兩名成員，在Hugging Face舉辦的一次小聚中，他們邊喝咖啡邊討論用斯坦福大學(xué)新發(fā)表的DPO方法對(duì)Mistral 7B這個(gè)模型進(jìn)行微調(diào)的可能性，最后他們決定用已經(jīng)構(gòu)建好的代碼庫先來嘗試下。

之后，他們?cè)贖F hub上找到了一些公開的數(shù)據(jù)集，包括由面壁智能和清華大學(xué)NLP共同支持的OpenBMB新近開源的兩個(gè)大規(guī)模、高質(zhì)量的微調(diào)數(shù)據(jù)集：UltraFeedback和UltraChat。

UltraFeedback，一個(gè)大規(guī)模、多樣化、細(xì)粒度的偏好數(shù)據(jù)集，包括 25萬條對(duì)話數(shù)據(jù)以及相應(yīng)的偏好標(biāo)注數(shù)據(jù)。在非社區(qū)標(biāo)注的偏好數(shù)據(jù)集中，這一數(shù)據(jù)規(guī)模排在首位。并且，其中每條偏好標(biāo)注均包含四個(gè)方面的細(xì)粒度得分與的詳細(xì)文字說明。

UltraChat則是高質(zhì)量的對(duì)話數(shù)據(jù)集，包含了 150 余萬條多輪指令數(shù)據(jù)。調(diào)用多個(gè) ChatGPT API 相互對(duì)話，從而生成多輪對(duì)話數(shù)據(jù)。

經(jīng)過幾輪實(shí)驗(yàn)證明，使用OpenBMB兩個(gè)數(shù)據(jù)集訓(xùn)練出來的新模型非常強(qiáng)大，是H4團(tuán)隊(duì) 在伯克利和斯坦福的基準(zhǔn)測(cè)試中見過的最強(qiáng)模型。

不久，這個(gè)名為“Zephyr”的模型、研究論文以及所有細(xì)節(jié)都向世界公開了，此后全球各地的公司開始應(yīng)用這一模型。LlamaIndex，一個(gè)知名的數(shù)據(jù)框架和社區(qū)，分享了這個(gè)模型在實(shí)際用例基準(zhǔn)測(cè)試中超乎預(yù)期的表現(xiàn)，與此同時(shí)，研究者和實(shí)踐者們?cè)贖ugging Face hub上熱烈討論著這篇論文和相關(guān)工作。

Zephyr-7B性能超越參數(shù)十倍之大的 LLaMA2-70B-Chat。

短短幾周就創(chuàng)造了這個(gè) 開源神話。Thomas Wolf指出，這一切都得益于世界各地（歐洲、加利福尼亞、中國(guó)）對(duì)知識(shí)、模型、研究和數(shù)據(jù)集的開放獲取，以及人們?cè)贏I上相互建設(shè)、相互借鑒，共同創(chuàng)造出真正有價(jià)值的高效開放模型的理念。

開源精神以自由和合作為信條，讓人類再次聯(lián)合起來重建通天巴別塔。開源旨在打破人為壁壘，通過開放透明的方式促進(jìn)技術(shù)和知識(shí)的創(chuàng)新共享。對(duì)于個(gè)體或組織而言，擁抱開源則是一種強(qiáng)者心態(tài)。

值得一提的是，OpenBMB開源社區(qū)背后的國(guó)內(nèi)領(lǐng)先的人工智能公司 面壁智能，一直聯(lián)合清華大學(xué)NLP實(shí)驗(yàn)室為大模型事業(yè)做高質(zhì)量的開源貢獻(xiàn)的同時(shí)，一直深耕大模型底層的數(shù)據(jù)工作。

就拿此次被Zephyr-7B運(yùn)用的UltraFeedback為例，UltraFeedback 從多個(gè)社區(qū)開源的指令數(shù)據(jù)集中收集了約 6 萬條指令?；谶@些指令，UltraFeedback 從 17 種不同架構(gòu)、參數(shù)量、訓(xùn)練數(shù)據(jù)的模型中隨機(jī)選取 4 種不同模型，為每條指令生成4種有區(qū)分度的回復(fù)，極大地提升了指令和模型的多樣性。

基于 UltraFeedback，團(tuán)隊(duì)還訓(xùn)練了UltraRM、UltraCM兩個(gè)模型來進(jìn)一步輔助模型評(píng)測(cè)和模型反饋學(xué)習(xí)。

在大家都在卷模型參數(shù)時(shí)，一個(gè)基于高質(zhì)量數(shù)據(jù)集的7B模型就打敗了參數(shù)十倍之大的 LLaMA2-70B-Chat。這說明了什么？

說明，底層的數(shù)據(jù)工作才是最稀缺的和有時(shí)間價(jià)值的，這或許是各家各派大模型在百模大戰(zhàn)中的突破口之一。

上一篇北師大未來設(shè)計(jì)學(xué)院在第六屆中國(guó)教博會(huì)發(fā)布五項(xiàng)PBL大挑戰(zhàn)項(xiàng)目

下一篇 “數(shù)據(jù)共生智能未來”：2023全球數(shù)字大會(huì)在上海青浦正式啟動(dòng)

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個(gè)方法操作簡(jiǎn)單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個(gè)方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡(jiǎn)單操作就能實(shí)現(xiàn)，快來嘗試一下吧！
2. 華為手機(jī)神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點(diǎn)擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動(dòng)起來，創(chuàng)意無限！

Viggle AI是一款免費(fèi)制作視頻的AI工具，能讓靜態(tài)人物圖片動(dòng)起來，快來了解Viggle AI的功能和優(yōu)勢(shì)吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具

以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念，最具性價(jià)比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費(fèi)無限制的AI視頻生成工具火了!國(guó)內(nèi)無障礙訪問!附教程

人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
10. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

HuggingFace 聯(lián)創(chuàng)發(fā)推：高質(zhì)量微調(diào)數(shù)據(jù)集才是“卷”大模型的正確姿勢(shì)

請(qǐng)綁定手機(jī)號(hào)