發(fā)布時間:2024-03-13 20:40:04 瀏覽量:151次
人工智能的浪潮遍及各行各業(yè),隨著自然語言處理技術(shù)的發(fā)展,計算機對文字的處理也進展到了一個新的層次,什么是文本智能?怎樣在產(chǎn)品中找到人工智能可賦能的場景?當(dāng)ai遇上產(chǎn)品設(shè)計,又將碰撞出怎樣的火花?
文本智能通俗來講,是計算機像人類一樣理解自然語言。
“冬天,能穿多少穿多少。夏天,能穿多少穿多少?!?/p>
“中國足球隊,誰都打不過。中國乒乓球隊,誰都打不過”。
人類看一眼就知道什么意思,對計算機來說則困難重重。因為人的表達方式千變?nèi)f化,短詞匯可以傳達非常寬泛的語義信息。
現(xiàn)在的文本智能處在什么層面?
文本也可以分成兩種類型:一種是書面文本,承載的形式為網(wǎng)頁、word、txt或pdf; 另外一種則是日常交流的口語形式。達觀專注于第一種。
一份簡歷、一份合同、一份上市公司的債券募集說明書、一條評論都可以算書面文本。
面對一篇文本,我們能做什么呢?
(1)拆解
像庖丁解牛一樣把文檔結(jié)構(gòu)化。
簡歷的姓名、照片、工作經(jīng)歷、教育背景;合同中交易的甲乙方、合同標(biāo)的物、付款方式、條款;新聞的標(biāo)題、摘要、來源、正文、關(guān)鍵人物、事件,組織機構(gòu)名稱,都是對文本拆解后抽取到的信息。
抽取是文本處理中最重要和實用的技術(shù)。抽取出合同中的“付款方式”之后,業(yè)務(wù)方才能夠去進一步審核“付款方式”是否符合法律法規(guī)。
(2)聯(lián)接
對多個文本進行庖丁解牛式的拆解,相關(guān)知識就能聯(lián)接形成一個巨大的知識網(wǎng)。
對標(biāo)到知識圖譜,新聞中的人、事、物、關(guān)系,公司年報中的出現(xiàn)的公司名稱及關(guān)系,都可以作為文本智能處理的大腦和背景知識,在知識網(wǎng)絡(luò)上進行邏輯推理和判斷。
(3)生成
生成是學(xué)術(shù)界研究的熱點,在當(dāng)前階段是非常困難的事情。騰訊的Dreamwriter,今日頭條的xiaomingbot都在嘗試用機器創(chuàng)作短新聞。
接下來我們具體看一些文本智能的例子。
根據(jù)一篇新聞資訊,生成不同長度的摘要,主要有兩種技術(shù)手段:抽取式和生成式。
給定一個用戶評論,提取出標(biāo)簽信息和觀點,屬于一個短文本處理。
文本分類和情感識別,在文本質(zhì)量管控和輿情分析方面使用較多。
文本審核也是分類的一種,涉黃涉政及判斷是否是廣告,是每一個做互聯(lián)網(wǎng)產(chǎn)品的公司比較頭疼的事。
下面是金融行業(yè)的債券募集說明書。
這樣一個文檔中,行業(yè)研究人員比較關(guān)注公司高管信息,比如:姓名、公司職位。在債券募集說明書中收購標(biāo)的是哪些,包括資產(chǎn)、標(biāo)的業(yè)務(wù)、標(biāo)的所在行業(yè)是否涉外、交易對手是否涉外、各類財務(wù)指標(biāo)等。
一般債券募集說明書從100到500頁不等,讓人從這么長的文檔中找到這些關(guān)鍵信息,非常容易出錯。
在公開的金融資訊網(wǎng)站上,債券募集說明書非常多,一個金融從業(yè)人員不可能在短時間內(nèi)把每篇文章內(nèi)的信息都抽取出來。所以在整個領(lǐng)域來說,文本智能處理出現(xiàn)了非常大的機會。這也受益于算法的進步,特別是深度神經(jīng)網(wǎng)絡(luò)從圖片識別領(lǐng)域到文本處理的遷移。
促成文本智能處理飛速發(fā)展的原因很多。
最近Google 的bert模型刷遍AI界朋友圈:NLP歷史突破,谷歌BERT模型狂破11項記錄,全面超越人類。
文本智能處理的需求遍及各行各業(yè)。只要存在文字處理工作的行業(yè),都有文本智能處理的需求,金融、法律、政府行業(yè),媒體、互聯(lián)網(wǎng),大型企業(yè)等。
掌握AI算法和基于AI算法設(shè)計產(chǎn)品之間的距離是非常大的,如同從火藥到火藥槍、從鈾到核炸彈、從硝化甘油到C4的區(qū)別。
怎樣才能基于這個AI算法設(shè)計產(chǎn)品呢?
產(chǎn)品經(jīng)理的思維是從用戶、場景和需求三要素出發(fā)。
要給客戶解決什么問題?目標(biāo)客戶如何刻畫?客戶在什么樣的場景下會使用我們的產(chǎn)品?怎么用一系列問題,需要產(chǎn)品系統(tǒng)的思考。
設(shè)計思維的六個步驟重點包括:啟發(fā)、構(gòu)思和實施。
機器學(xué)習(xí)的流程,是對要解決的問題定義好后,對數(shù)據(jù)加工處理,提取特征,進行算法選擇,從而確定可使用的模型。
當(dāng)這些模型滿足上線要求或業(yè)務(wù)要求以后,我們把模型放到線上系統(tǒng)中。當(dāng)新接受到的數(shù)據(jù)進行同樣的處理后,用訓(xùn)練出來的模型來判斷是否屬于垃圾郵件。
算法接受不同的數(shù)據(jù)可以訓(xùn)練出不同的模型。整個過程是迭代優(yōu)化,因為數(shù)據(jù)的分布和蘊含的特征可能隨著業(yè)務(wù)的不斷發(fā)展在產(chǎn)生改變。
兩者怎么樣進行深度的融合,是在人工智能時代下對產(chǎn)品經(jīng)理能力模型的要求。
這兩年AI的宣傳,特別是AlphaGO的普及作用,我們感受到每一個行業(yè)都會被人工智能技術(shù)所影響,任何職業(yè)都會受到影響。
但AI到了無所不能的地步嗎?
顯然不是。
AI對行業(yè)或職業(yè)影響的有多大,很大程度上,是取決于這個領(lǐng)域技術(shù)的成熟度和邊界在哪。
比如文本處理領(lǐng)域,針對文本處理技術(shù)評估可以分為3類:可用 、基本可用、難以應(yīng)用。
當(dāng)產(chǎn)品經(jīng)理在設(shè)計一個基于文本智能的產(chǎn)品時,要考慮這項技術(shù)處于什么類別。類別決定技術(shù)用到最真實場景時、場景對準(zhǔn)確度的要求。例如:自動駕駛或無人駕駛,場景容錯率是零,因為輕則車毀,重則人亡。
保守一點講,我們還處于AI的初級階段,AI的常識邏輯和邏輯推理能力都還很弱,但在日常生活中人類已經(jīng)享受到了AI帶來的價值。
那么,該如何找到AI賦能的場景,讓算法專家、行業(yè)專家和應(yīng)用開發(fā)專家三種角色的合作使人工智能落地呢?
找到這個場景的前提是需要思考,運用AI產(chǎn)品和解決方案的本質(zhì)什么。
首先,應(yīng)用可以分為兩類:互聯(lián)網(wǎng)行業(yè)應(yīng)用和企業(yè)級應(yīng)用。
在互聯(lián)網(wǎng)行業(yè)應(yīng)用,無論是搜索、推薦系統(tǒng)、廣告,提升的是過程中信息傳遞的效率。在企業(yè)級應(yīng)用上,主要是提升生產(chǎn)效率和創(chuàng)造新價值。
提到AI產(chǎn)品和解決方案,當(dāng)我們將它們服務(wù)于我們企業(yè)級場景的時候,它的核心是在提升生產(chǎn)效率。
產(chǎn)品需要找到在當(dāng)前的業(yè)務(wù)流程中,生產(chǎn)效率到底出現(xiàn)什么問題,或哪個環(huán)節(jié)希望借助AI技術(shù)進行生產(chǎn)效率的提升、節(jié)省人力。
這些可以分四個步驟做,算法開發(fā)人員也是站在這四步實現(xiàn)代碼:
1)流程拆解
對當(dāng)前的工作流程或業(yè)務(wù)場景進行詳細拆解,診斷阻礙生產(chǎn)效率的最大問題,對核心問題進行拆解。
2)數(shù)據(jù)評估
如果想解決問題,公司的哪些數(shù)據(jù)是跟這個問題相關(guān)的?
3)方案設(shè)計
方案設(shè)計是針對當(dāng)前的數(shù)據(jù)現(xiàn)狀去完善基礎(chǔ)數(shù)據(jù),選擇可能存在的AI算法是什么。比如進行垃圾分類,有很多分類算法可以采納:貝葉斯模型、SVM邏輯回歸。
第三點比較重要,很多時候人不知道算法的效果怎樣,如果工具能夠幫助我們進行快速的測試,會很快的驗證和優(yōu)化方案。
4)有機整合
當(dāng)設(shè)計好解決方案以后,準(zhǔn)確率是可接受的,這時考慮這項服務(wù)或應(yīng)用怎么跟現(xiàn)有的系統(tǒng)進行結(jié)合。
大體來看有兩種方式:
系統(tǒng)上線以后,怎么做模型升級、怎么做維護,也是我們面臨的挑戰(zhàn)的問題。概括來講,想找到AI能夠賦能或落地的場景,需要對流程進行拆解,然后評估數(shù)據(jù),進行AI方案的設(shè)計,最后和系統(tǒng)進行有機整合。
如果對差旅的報銷流程進行梳理,共有五個環(huán)節(jié):
對流程進行拆解,第一步,整理出差待報銷的發(fā)票。要先根據(jù)票據(jù)的類型進行分類,分好類分別計算各個票據(jù)的金額,交通、住宿,進行匯總。第四個環(huán)節(jié),財務(wù)部門需要核對申請表上的金額與提交的紙質(zhì)票據(jù)的原件是否一致。
當(dāng)對流程進行拆分以后,就可以進行AI技術(shù)的評估。比如:票據(jù)類型分類,能不能通過OCR技術(shù)。
當(dāng)對進行各項金額計算時,能否通過文本關(guān)鍵信息提取技術(shù)把金額自動提取出來,進行匯總計算。填寫報銷申請表時,能否根據(jù)數(shù)據(jù)接口的方式自動傳達財務(wù)部門的審核系統(tǒng)中。同樣,通過文本內(nèi)容關(guān)鍵信息提取技術(shù),把提取出來的數(shù)字和用戶上傳過來的數(shù)字進行復(fù)核,來判斷是否通過。
這幾項AI技術(shù)幫助賦能,在這個環(huán)節(jié)中,我們需要哪些數(shù)據(jù)?
第一環(huán)節(jié)需要報銷的原件,第四個環(huán)節(jié)既需要原件,又需要申請表。通過這樣的方式,我們找到了AI落地的場景點,并明白了技術(shù)在里面可以做到什么程度,同時讓業(yè)務(wù)方也了解到了這項技術(shù)確實是可以落地的。
通過拆解可以發(fā)現(xiàn)三個場景充分利用文本智能技術(shù):
找到這三個點以后,明確了提供AI產(chǎn)品價值是提升效率,幫助法務(wù)部門控制風(fēng)險。
當(dāng)我們找到可以AI賦能的場景后,我們需要遵循什么樣的原則去設(shè)計產(chǎn)品和解決方案呢?
我們先來看下傳統(tǒng)軟件設(shè)計和AI驅(qū)動軟件的差別。
傳統(tǒng)軟件設(shè)計,設(shè)計過程注重的因果、邏輯。設(shè)計一個OA系統(tǒng),要考慮員工辦公流程、每個流程要達到的目標(biāo)是什么、功能實現(xiàn)最短路徑。如果有輸入不符合預(yù)期時,傳統(tǒng)軟件產(chǎn)品時,開發(fā)工程師比較容易重現(xiàn)BUG和解決問題。而AI驅(qū)動的軟件,重點需要考慮的是結(jié)果不確定性、逼近優(yōu)化目標(biāo)。
比如合同條款讀取,通過歷史的合同數(shù)據(jù),已經(jīng)能夠訓(xùn)練出文本智能模型,可以對某些字段進行抽取。假對某個字段的抽取準(zhǔn)確率是98%,在歷史合同數(shù)據(jù)中這個非常高的準(zhǔn)確率了,站在業(yè)務(wù)方來評估,也基本能夠滿足上線要求。但當(dāng)系統(tǒng)上線以后,對新的一份合同,也許沒有抽取出來。又來一份新的合同,也許就抽取正確了。
對AI算法來說,準(zhǔn)確率98%是站在數(shù)據(jù)集的角度考慮的,但真正把模型或產(chǎn)品應(yīng)用到業(yè)務(wù)系統(tǒng)中,業(yè)務(wù)人員面對的是一份一份的數(shù)據(jù)。
另外,優(yōu)化目標(biāo)是個逼近的過程,過程是上下起伏的,總效果是逼近目標(biāo)的。就像人喝醉酒后回家一樣,搖搖晃晃,有時多走了幾步,但是還是往家的方向走。
可這種情況,對產(chǎn)品的使用者怎么辦?
使用者知道產(chǎn)品在優(yōu)化,但使用過程中還是會出現(xiàn)錯誤。優(yōu)化的過程有起伏,使用者被告知針對目前的問題,上了一個新的版本,新版本的準(zhǔn)確率由98%提升到99%,可在真正使用時,可能發(fā)現(xiàn)連續(xù)3份合同抽取錯誤了。這種情況下業(yè)務(wù)方很難接受,因為他們對AI算法本身不是太理解。作為產(chǎn)品經(jīng)理,這是一個需要解決的問題。
對AI產(chǎn)品,大家總是期望主動表現(xiàn)出智能型,對于這種需求,UI設(shè)計和功能設(shè)計都是可以起到作用的。
對于功能性,有4點比較重要:
理想的結(jié)果是交付一個AI產(chǎn)品,可以不斷的優(yōu)化、迭代,越來越聰明,成為一個動態(tài)的AI系統(tǒng),而不是靜態(tài)的。
AI也重新定義了產(chǎn)品設(shè)計和開發(fā)流程。
圖的上面跟機器學(xué)習(xí)算法相關(guān),識別問題、獲取數(shù)據(jù),進行模型訓(xùn)練、模型管理。模型之間有不斷的版本迭代,我們要進行模型的部署,上線以后模型要去適應(yīng)新數(shù)據(jù)的變化。
下面是站在開發(fā)角度,怎樣去進行需求建模、架構(gòu)設(shè)計、軟件設(shè)計、怎樣對AI產(chǎn)品進行開發(fā)測試、上線以后的維護。
當(dāng)系統(tǒng)上線后,用戶就是用來處理數(shù)據(jù)的,新的數(shù)據(jù)源源不斷,可能會出錯,系統(tǒng)會產(chǎn)生行為的異常,用戶看到錯誤時會跟系統(tǒng)進行人機交互,把自己的反饋提出來。
有時用戶有自己的專業(yè)知識、行業(yè)知識,把自己的行業(yè)知識傳授給AI系統(tǒng),讓它更加聰明。除了自我演化外,也通過接收外部信息的方式增強自己的智能。如果把這種視角加進來,可以讓AI產(chǎn)品站在宏觀角度把握各環(huán)節(jié),從而指導(dǎo)我們設(shè)計出更好的產(chǎn)品。
舉兩個例子展示,怎樣通過產(chǎn)品進行合同條款的抽取和進行規(guī)則審核。
共分為5步,前2步是預(yù)先做好的。根據(jù)客戶已有的歷史合同數(shù)據(jù)去訓(xùn)練AI模型,讓AI模型識別不同類型的合同,就不同類型合同中的關(guān)鍵要素進行自動抽取,做好這2步后預(yù)置到產(chǎn)品平臺中去。
對使用者來說,是三步完成:上傳到合同文檔、機器進行自動關(guān)鍵詞提取、提取結(jié)果呈現(xiàn)。形成這樣一個關(guān)鍵信息抽取的報告,法務(wù)人員可以對報告一目了然。
前兩步也是預(yù)置到產(chǎn)品中,針對各個不同的合同類型,根據(jù)業(yè)務(wù)方設(shè)計合同審核項,對每個合同類型的風(fēng)險點都配置好,機器模型可以自主的進行學(xué)習(xí)和訓(xùn)練。
業(yè)務(wù)方上傳合同文檔,機器可以進行自動處理,并給出些建議。
審核結(jié)果中包含針對這個合同,有哪些是必改問題、有哪些是缺失條款、有哪些是建議優(yōu)化的,都可以滿足。
這是我們產(chǎn)品的全景圖,展示了AI的幾個不可缺失的關(guān)鍵要素,只有保證這幾個要素后,提供的產(chǎn)品時才能夠消除由AI算法帶來的不確定性。
客戶是不可能為不確定性買單的。如果交付了一個產(chǎn)品,客戶問準(zhǔn)確率是多少,答“看數(shù)據(jù)情況吧”,客戶又問系統(tǒng)上線使用時撞戶率有多高,答“這個我也不清楚,需要新的線上數(shù)據(jù)判斷”,任何一個客戶都不會為不確定性的回答買單。
最后一部分,如何進行產(chǎn)品價值的評估。
針對上面的合同智能處理,我們了解到:
對不同的合同,原本通過人工閱讀的方式進行審核,處理時間基本是在小時級。引入智能合同審閱平臺以后,整個過程從待審閱合同、智能合同審閱到人工復(fù)查,從小時級變成分鐘級。
從價值來說:
合同評估對于AI產(chǎn)品有兩個層面:
算法層面的評估,更多的是面向AI算法和研發(fā)人員,比如:準(zhǔn)確率、召回率、F1值。
機器翻譯、智能客服、多輪對話、搜索、推薦、文本抽取等在算法層面都有不同的指標(biāo),對業(yè)務(wù)方很難講明白準(zhǔn)確率是多少,用戶很難把準(zhǔn)確率和它的業(yè)務(wù)價值映射起來。
評價的維度也非常多,取決于業(yè)務(wù)方怎么看待這個產(chǎn)品以及通過這個產(chǎn)品達到什么目標(biāo)。有時客戶的期望是通過AI的產(chǎn)品提升人員的工作效率、降低出錯。有的客戶使用AI的產(chǎn)品專注在創(chuàng)新。
不管做to C還是to B都是圍繞用戶進行服務(wù)的,有一個經(jīng)典的模型叫“AARRR”:怎么獲取用戶、激活、留存、商業(yè)變現(xiàn)、用戶幫助評估。
在這個場景實現(xiàn)AI落地,針對這幾個不同的環(huán)節(jié),到底帶來哪些業(yè)務(wù)價值上的提升:是新的獲客數(shù)量增加了、轉(zhuǎn)化率提升了,還是某項產(chǎn)品的營業(yè)額收入增加了。
節(jié)省人力;創(chuàng)造新價值,這是我們希望AI產(chǎn)品能夠達到的理想目標(biāo)。
以上是我想給大家分享的多年做AI產(chǎn)品設(shè)計和項目交付的經(jīng)驗,謝謝大家!
作者:賈學(xué)鋒,達觀數(shù)據(jù)副總裁,負責(zé)AI解決方案及產(chǎn)品設(shè)計。
本文由 @賈學(xué)鋒 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
8. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
9. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
最新文章
同學(xué)您好!