發(fā)布時間:2024-03-15 19:28:45 瀏覽量:157次
本文作者:皮雨鷺
盡管對可信AI穩(wěn)健性、可解釋性、隱私保護和公平性的四項基本技術原則學界已達成了共識,但已有研究指出目前的技術尚無法實現(xiàn)這四項原則的和諧統(tǒng)一。實現(xiàn)可信AI不能將這四項原則割裂看待,而需要針對構建一體化研究框架,以保持不同原則之間的最優(yōu)動態(tài)平衡。除了在技術上實現(xiàn)這四項原則充滿挑戰(zhàn),在治理層面上可信AI也還處于一個初期探索的階段,具體細則仍需進一步明確。
圖源:https://us19.campaignarchive.com/?u=eaeece823e606d2458a568db9&id=df29be1ff7
伴隨著人工智能應用逐漸滲透各個行業(yè),其自身技術的不完善以及監(jiān)管體系的缺失帶來了一系列問題。例如,自動駕駛事故頻發(fā),電商平臺的大數(shù)據(jù)殺熟現(xiàn)象,聊天機器人使用歧視性語言,AI換臉帶來的新型詐騙手段。這些由AI引發(fā)的風險隱患引發(fā)了人類對這項新技術的信任危機。在用戶對人工智能服務逐漸失去信任的背景下,構建可信AI是實現(xiàn)人工智能在日常生活大規(guī)模應用的前提??尚臕I不僅僅是AI面對的技術問題,同時也是一個深刻的社會問題。雖然仍處于發(fā)展早期,各界已達成共識,實現(xiàn)可信AI既需要底層的技術支持,也要需要頂層的治理規(guī)范。
歐盟委員會發(fā)布的《可信賴人工智能道德準則》提出了7個可信AI的關鍵要素,即人工能自治的治理(人的監(jiān)督)、技術強大性和安全性、隱私和數(shù)據(jù)治理、透明度、多樣性、非歧視性和公平性、社會和環(huán)境福祉以及問責。美國國家人工智能倡議(American AI Initiative)將可信AI定義為具有“準確性、可解釋性、隱私性、可靠性、穩(wěn)健性、安全性”等特征的AI。經合組織(OECD)《確定OECD的人工智能發(fā)展原則》報告將創(chuàng)新和值得信賴的人工智能定義為包括:尊重人權和民主價值觀;為包容性增長制定標準;以人為本的價值觀和公平性;透明度和可解釋性;穩(wěn)健性、安全性;以及問責制。在可信AI發(fā)展的早期階段,盡管國際各界對可信AI的具體定義略有不同,但其核心的原則都包括了穩(wěn)定性、可解釋性、隱私保護和公平性這四項基本技術原則。穩(wěn)健性指AI能在存在各類環(huán)境噪聲以及惡意攻擊的情況下做出正確決策的能力;可解釋性是指AI作出的決策需要讓人能夠理解;隱私保護指AI系統(tǒng)保護個人或群體隱私不被泄露的能力;公平性指AI系統(tǒng)需要包容人的個體差異,公平對待不同群體。
澳大利亞科學院院士、京東探索研究院院長陶大程指出在這四項基本技術原則已成為各界共識的背景下,如何找到合適的標準來量化這四項原則成為了可信AI目前亟待解決的技術難題。若能對這四項原則進行定量分析,也將有助于相關治理條例的規(guī)范與完善。目前,穩(wěn)定性可以通過各類攻擊算法的攻擊成功率或攻擊性能來衡量; 可解釋性可通過失真度、敏感度以及用戶滿意度來衡量; 隱私保護能力常通過差分隱私法來刻畫,也能通過各類隱私攻擊算法的攻擊成功率或攻擊性能來評估; 公平性可使用個體公平性及群體公平性指標來進行衡量。實現(xiàn)可信AI需要將這四項技術原則作為一個整體看待,從技術和治理上層面上同時開展研究。
盡管這四項原則各有其技術支持,越來越多的學者認識到需要重視這些原則間的相互聯(lián)系,將它們作為人工智能產品的全生命周期中始終需要實現(xiàn)的原則。一個典型的人工智能產品的的生命周期可以被劃分為數(shù)據(jù)準備、算法設計、管理部署三個階段。在每個階段對這些原則的考慮,激勵了實現(xiàn)可信AI的技術探索。
數(shù)據(jù)準備
對人工智能系統(tǒng)的設計都是從數(shù)據(jù)源的選擇、設計、整理完善開始的。多項研究發(fā)現(xiàn),由于用于訓練算法的數(shù)據(jù)源本身就帶有偏見或歧視性,因此造成了算法對特定人群的歧視事件。而這些存在于數(shù)據(jù)源中的偏見卻并非總是顯而易見。例如,美國早期的預測性警務算法雖然并未使用種族的數(shù)據(jù),但種族主義卻通過種族相關的地理數(shù)據(jù)(如郵政編碼)悄悄影響了算法結果。
那么,如何在數(shù)據(jù)準備階段實現(xiàn)可信AI?最近,斯坦福大學計算機科學系李飛飛等人在《自然-機器智能》上共同發(fā)表的文章在AI數(shù)據(jù)全流程的各個環(huán)節(jié)上討論了如何評估、篩選、清洗和注釋用于訓練和測試AI模型的數(shù)據(jù)。例如,為了避免數(shù)據(jù)源中存在歷史性偏見以及個人數(shù)據(jù)涉及的隱私問題,可以使用計算機自動創(chuàng)建的合成數(shù)據(jù)作為現(xiàn)實世界敏感數(shù)據(jù)的代替品。合成數(shù)據(jù)不僅可以做到使數(shù)據(jù)源中所含數(shù)據(jù)更加多樣化從而增強算法的泛化能力,而且可以避免披露隱私信息以滿足合規(guī)要求。合成數(shù)據(jù)的技術目前已被逐漸商業(yè)化,在自動駕駛和醫(yī)療保健這兩個對數(shù)據(jù)需求量巨大、對數(shù)據(jù)隱私要求高的領域得到了廣泛使用。為了實現(xiàn)可信AI的基本原則,除了在數(shù)據(jù)收集階段使用合成數(shù)據(jù)外,常用的數(shù)據(jù)預處理手段還包括異常情況檢測、惡意數(shù)據(jù)預清洗以及數(shù)據(jù)匿名化。
算法設計
如果說數(shù)據(jù)是人工智能系統(tǒng)的血液,那么算法設計便是其骨架。目前與可信人工智能相關的研究為增強算法的穩(wěn)健性、可解釋性、公平性和隱私保護提供了大量的設計實踐??赏ㄟ^設計具有一定解釋性的算法或為黑箱算法提供事后可解釋方法來實現(xiàn)算法的可解釋性。通過對抗性訓練,即在自然樣本上添加微小的擾動而形成的對抗樣本來訓練AI模型,從而提升模型對于特殊構造的攻擊樣本的干擾,實現(xiàn)算法的穩(wěn)健性。通過加密算法設計、差分隱私技術、安全多方計算實現(xiàn)隱私保護。通過人為降低算法對于敏感數(shù)據(jù)的依賴,可避免對特定群體的明顯歧視。通過對算法的人為監(jiān)督,在訓練階段發(fā)現(xiàn)算法可能產生的歧視風險。
管理部署
在完成算法設計后,對于投入使用算法的管理應重視風險的發(fā)現(xiàn)和控制。通過對人工智能系統(tǒng)定期的審計,來確保其使用過程中對可信AI原則的遵循。通過審計發(fā)現(xiàn)的問題,應該被及時地改進。對公眾適當?shù)呐端惴▽徲嫿Y果,也被視作獲得公眾信任的有效方法。另一方面,也要確保系統(tǒng)內置緊急關停功能。在突發(fā)情況下,能夠人為的終止人工智能系統(tǒng)的服務,實現(xiàn)對緊急風險的有效控制。微軟、谷歌、IBM也通過內設負責AI倫理踐行的機構來進行對算法的內部審查,實現(xiàn)可信AI原則的落地。
盡管對可信AI穩(wěn)健性、可解釋性、隱私保護和公平性的四項基本技術原則學界已達成了共識,但已有研究指出目前的技術尚無法實現(xiàn)這四項原則的和諧統(tǒng)一。若只考慮一方面的要求則會造成其他要求的沖突。在特定場景下,穩(wěn)健性和公平性可能會相互沖突。例如,提高深度學習穩(wěn)健性的對抗性訓練已被證實會在不同群體之間引入顯著的性能和穩(wěn)健性差距,以犧牲模型的公平性為代價來提高模型的穩(wěn)健性。因此實現(xiàn)可信AI不能將這四項原則割裂看待,而需要針對構建一體化研究框架,以保持不同原則之間的最優(yōu)動態(tài)平衡。除了在技術上實現(xiàn)這四項原則充滿挑戰(zhàn),在治理層面上可信AI也還處于一個初期探索的階段。盡管各國對于實現(xiàn)可信AI有一定的政策建議,但明確的統(tǒng)一治理框架尚未形成,具體細則也仍需進一步明確。學術界和企業(yè)的技術創(chuàng)新為可信AI提供了基礎的技術支持,而政府對可信AI治理的探索則為技術研究指明了方向。實現(xiàn)可信AI仍然前路漫漫。正如曠視聯(lián)合創(chuàng)始人兼CEO印奇所言:“AI不僅要在技術創(chuàng)新和應用落地上下功夫,也需在治理上使力氣,這離不開所有AI從業(yè)者和社會各界的共同努力?!?/p>
作者:皮雨鷺
編輯:王燦
責編:云琪布日
原標題:可信AI的四項基本原則
本文選自《人工智能資訊周報》第192期,轉載請注明出處
《人工智能資訊周報》探討人工智能對公共政策、治理和政策建議的影響,探索人工智能對商業(yè)、政治和社會的影響,以確定潛在的研究領域,探討可能的合作研究和機構伙伴關系。本刊著重提供中國人工智能發(fā)展動態(tài)和對人工智能的思考,同時關注全球范圍內人工智能相關研究動態(tài)。本刊旨在通過可靠的研究,來幫助企業(yè)、研究機構和公民預測和適應技術引領的變化。
獲取更多內容,歡迎關注海國圖智研究院
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
以下是一些免費的AI視頻制作網站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
9. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
同學您好!