發(fā)布時間:2024-02-26 10:28:18 瀏覽量:231次
本文介紹了設(shè)計好的AI用戶體驗時需要牢記的三個基本原則——期望、錯誤和信任。
在先前的文章,我談到了《AI 開發(fā)指南:機器學習產(chǎn)品是什么?》,AI及ML產(chǎn)品需要更多的試驗、反復調(diào)整,也因此帶來更多的不確定性。 關(guān)于什么是AI及ML產(chǎn)品,在《如何設(shè)計和管理AI產(chǎn)品?》這篇文章里有更詳細的說明。
因此,我們需要為ML工程師和數(shù)據(jù)科學家提供足夠的空間和彈性,來探索可能的解決方案。 同時也需要明確定義目標函數(shù)(objective function),并鼓勵團隊盡早測試,以免失去方向。
為AI&ML 產(chǎn)品設(shè)計用戶體驗 (UX) 時,同樣面臨這樣的挑戰(zhàn)。 在過去的幾個月里,我與UX團隊合作,收集客戶意見并改進ML產(chǎn)品的用戶體驗。 以下是我們學到的三件最重要的事情:
機器學習模型的表現(xiàn)會隨著數(shù)據(jù)更多而提高,也就是說,ML模型會不斷自我進步,這是使用AI&ML最大的好處之一。 但這也意味著,他們一開始的表現(xiàn)不會是完美的。
因此,必須讓用戶了解ML產(chǎn)品不斷進步的本質(zhì)。 更重要的是,我們需要與用戶合作,事先確定一套驗收標準(acceptance criteria)。只有當ML模型符合驗收標準時,我們才會推出該項產(chǎn)品。
設(shè)置驗收標準時,可以比較系統(tǒng)的基準性能(baseline performane),替代或現(xiàn)有解決方案的性能,或甚至是比較標準答案(ground truth),
例如:比較人工翻譯及機器翻譯的準確度。 或是將機器預測的天氣數(shù)據(jù),拿來與真實天氣數(shù)據(jù)做比較。 又或是將機器包裝的速度及準確度,與人工操作比較,客戶可以設(shè)定:唯有ML模型的準確度到達人工的90%才能上線。
有時,制定驗收標準可能比想象中復雜:你可能有多個不同的用戶類型,他們需要不同的驗收標準。 或者,你的使用案例要求在某個特殊項目必須完全沒有錯誤。
另外需要注意的是,模型本身的準確性通常并不是最好的衡量標準,一般需要考慮精確度(Precision)和召回率(Recall)之間的權(quán)衡。 這在前一篇文章有更詳細的說明。
如果用戶需要ML模型從第一天開始就有很好的表現(xiàn),可以預先訓練的模型(pretrained model):是先搜集數(shù)據(jù),確定模型達到驗收標準。
但是,要注意的是,即使使用預先訓練的模型,例外情況(edge case)仍可能發(fā)生。 你需要與用戶合作,制定計劃降低風險。例如:如果模型不起作用,有什么備案? 如果用戶想要添加新的使用案例,需要多長時間重新訓練模型? 需要多少額外的數(shù)據(jù)? 當不允許更新模型時,用戶是否可以設(shè)置更新中斷期? 這些問題都需要事先回答。
通過建立用戶的正確期望,你不僅可以避免用戶挫折,甚至可以讓用戶感到驚喜。 亞馬遜搭載Alexa語音助理的智能型喇叭就是一個很好的例子。 我們對類人形機器人有很高的期望:我們預期它們可以像人類一樣自然交談和動作。
所以,當智能機器人Pepper(下圖)沒有辦法和我們進行流暢的對話時,我們感到沮喪,不想再使用它。 相比之下,Alexa 定位為智能型喇叭,降低了客戶的期望。 當我們了解到它不僅僅可以播放音樂,還有很多其他的功能時,就能夠讓用戶感到預期外的驚喜。
保持信息公開透明(transparency)是加強溝通和信任的另一個重要部分。 ML 比軟件工程更具不確定性。 因此,顯示每個預測的信賴區(qū)間(confidence level),也是建立正確期望的一種方式。 這么做也能夠讓用戶更了解算法的工作原理,從而與用戶建立信任。
ML算法通常缺乏透明度,就像一個黑盒子,我們知道輸入(例如圖像),和輸出預測(例如,圖像中的對象/人員是什么)分別是什么,但不知道盒子里是如何運作的。 因此,向用戶解釋ML模型如何運作很重要,可以幫助我們建立信任,和獲得用戶支持。
如果不對算法多做說明,有可能會讓用戶感覺被疏遠,或感覺產(chǎn)品不夠人性化。 例如,優(yōu)步司機抱怨說Uber算法感覺非人性化,他們質(zhì)疑算法的公平性, 因為算法所做的決定,并沒有給他們明確的解釋。 這些駕駛也認為算法搜集很多他們的數(shù)據(jù),對它們非常了解,但他們對算法的工作原理和決策卻了解的很少。
相反的,亞馬遜的網(wǎng)頁很清楚地告訴用戶為什么他們推薦這些書。 這只是一個簡單的單行解釋。 告訴用戶其他看過該項產(chǎn)品的用戶還瀏覽過什么商品,但卻可以讓用戶大致了解算法的原理,讓用戶可以更好地信任推薦系統(tǒng)。
同樣的優(yōu)步司機研究也發(fā)現(xiàn),司機覺得他們經(jīng)常被監(jiān)視,但他們不知道這些數(shù)據(jù)將用于什么用途。 除了遵守 GDPR 或其他數(shù)據(jù)保護法規(guī)外,還應(yīng)該嘗試讓用戶了解他們的數(shù)據(jù)是如何被管理的。
“… 也有未知的未知-那些我們不知道我們不知道的… 這一類往往是最困難的”
——唐納德· 拉姆斯菲爾德
“… But there are also unknown unknowns — the ones we don’t know we don’t know… it is the latter category that tend to be the difficult ones”
——Donald Rumsfeld
在設(shè)計系統(tǒng)時,通常很難預測系統(tǒng)會如何出錯。 這就是為什么用戶測試和質(zhì)量保證(Quality Assurance),對于識別失敗狀態(tài)(fail state)和例外情況(edge case)極其重要。 在實驗室或?qū)嶋H現(xiàn)場,進行更多的測試,有助于最大限度地減少這些錯誤。
你也需要根據(jù)錯誤的嚴重性和頻率進行分類和處理。 有需要通知用戶并立即處理的致命錯誤(fatal error)。 但也有一些小錯誤,并沒有真正影響系統(tǒng)的整體運作。 如果你每個小錯誤都通知用戶,那會非常煩人,干擾用戶的產(chǎn)品體驗。 相反的,如果不立即解決致命錯誤,那可能會是災(zāi)難性的。
你可以將錯誤視為用戶期望和系統(tǒng)假設(shè)之間預期之外的交互(unexpected interactions between user expectations and system assumptions):
舉例來說,如果用戶不斷拒絕來自App應(yīng)用的建議,產(chǎn)品團隊可能需要查看并了解原因。 例如,用戶可能從日本搬到了美國,但是應(yīng)用程序錯誤地根據(jù)用戶的日本信用卡信息,假設(shè)用戶居住在亞洲。 在這種情況下,用戶的實際位置數(shù)據(jù)可能是提出此類建議的更好數(shù)據(jù)依據(jù)。
最棘手的錯誤類型是未知未知(the unknown unknowns):系統(tǒng)無法檢測到的錯誤。 像上面的例子就是屬于這種錯誤類型,必須要回去分析數(shù)據(jù)或異常模式,才有可能察覺。
另一種方法是允許用戶提供回饋feedback:讓用戶能夠很容易地,隨時隨地提供回饋。 讓用戶幫助你發(fā)現(xiàn)未知未知,或是其他類型的錯誤。
你也可以利用用戶回饋來改進你的系統(tǒng)。 例如。 YouTube 允許用戶告訴系統(tǒng)他們不想看到的某些建議。 它還利用這一點收集更多數(shù)據(jù),使其建議更加個人化和準確。
將ML模型預測作為建議,而不強制用戶執(zhí)行,也是管理用戶期望的一種方式。 你可以為用戶提供多個選項,而不指定用戶應(yīng)執(zhí)行哪些操作。 但請注意,如果用戶沒有足夠的信息來做出正確的決策,這個方法就不適用。
我們之前談到的許多一般原則仍然適用在這里。 你可以在我上一篇文章中找到更多詳細信息。
作者:Bastiane Huang,擁有近10年產(chǎn)品及市場開發(fā)管理經(jīng)驗,目前在舊金山擔任 AI/Robotics新創(chuàng)公司產(chǎn)品經(jīng)理,專注于開發(fā)機器學習軟件,用于機器人視覺和控制。
本文由 @Bastiane 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議。
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
10. 10個建筑AI工具,從設(shè)計到施工全覆蓋!肯定有你從來沒聽過的
講述了建筑業(yè)比較著名的AI公司小庫科技做出的探索,在這兒就不多說了。今天,我們試著在規(guī)劃設(shè)計、建筑方案設(shè)計、住宅設(shè)計、管道設(shè)計、出渲染圖、3D掃...
最新文章
同學您好!