
AI語音助手的出現(xiàn),要從2011年說起,從那開始語音助手已經(jīng)從一種華而不實(shí)的噱頭變成了智能音箱技術(shù)的根基。未來的AI語音助手還會(huì)進(jìn)化成什么樣的高度呢?
如今,智能音箱已經(jīng)滲透到了美國六分之一的家庭。
尖端人工智能語音技術(shù)開發(fā)商N(yùn)uance Communications的創(chuàng)新主管湯姆?赫伯納(Tom Hebner)向Digital Trends表示:“在Siri出現(xiàn)之前,當(dāng)我談?wù)?我所做的)事情時(shí),人們的眼神都是茫然困惑的。人們會(huì)說,‘是你們開發(fā)了那些可怕的手機(jī)系統(tǒng)嗎?我恨你們。’當(dāng)時(shí)人們對(duì)于語音技術(shù)都是這樣的反應(yīng)。”
但今天情況已經(jīng)截然不同了。據(jù)市場研究機(jī)構(gòu)eMarketer預(yù)測,到2020年,將有近1億智能手機(jī)用戶使用語音助手。盡管人工智能助手不再是新鮮事物,但我們?nèi)蕴幱谠擃惣夹g(shù)的進(jìn)化初期。要完全兌現(xiàn)語音助手作為一個(gè)產(chǎn)品類別的潛力,仍然長路漫漫。
目前,可以從以下五個(gè)方面來讓AI 助手變得更智能、更高效,從而幫助我們過上富有成效的生活。姑且把它們稱為“預(yù)測”或“愿望清單”,畢竟它們都是些需要解決的挑戰(zhàn)。
1)充實(shí)專業(yè)知識(shí)庫
亞馬遜的AI語音助手Alexa可以告訴你各種各樣的東西,比如:馬來西亞吉隆坡的天氣狀況;總共720南非蘭特可以兌換720美元;生僻復(fù)雜的單詞如何拼寫。但從本質(zhì)上講,消費(fèi)級(jí)人工智能助手就相當(dāng)于數(shù)字世界中一個(gè)擁有一整套最新百科全書的人。你從它們那里得到了正確的信息,但它們并不具備專業(yè)級(jí)別的專項(xiàng)知識(shí)。
赫伯納在接受Digital Trends采訪時(shí)表示:“你家里的智能設(shè)備所面臨的挑戰(zhàn)是,它們嘗試給你解決的事情太過寬泛了。”
這是一個(gè)很難解決的問題,但一旦解決了,就能產(chǎn)生顛覆性的影響。Nuance開發(fā)了許多針對(duì)特定用例的專家級(jí)系統(tǒng),比如幫助航空公司客服回答客戶的問題,或者幫助醫(yī)生做筆記。這樣做不僅意味著這些系統(tǒng)可以深度獲取更詳盡的信息,還意味著它們可以產(chǎn)生更多的智能。“人們對(duì)能夠理解單詞意思的計(jì)算機(jī)感到非常興奮,但如果計(jì)算機(jī)不知道該如何作出回應(yīng),那就不一定有意義了。”赫伯納說道。
他列舉了一個(gè)例子:一個(gè)Nuance系統(tǒng)不僅能理解醫(yī)生跟病人說的潛在藥物清單,還能指出那些藥物之間潛在的沖突。這遠(yuǎn)遠(yuǎn)超出了大多數(shù)消費(fèi)級(jí)人工智能助手的能力。
然而,AI助手在不同領(lǐng)域擁有更專業(yè)、更詳盡的知識(shí)——Alexa技能暗示了這一點(diǎn)——可能是革命性的。從表面上看,向你的智能助手尋求法律或醫(yī)療方面的專業(yè)建議聽起來很瘋狂。但業(yè)界在法律機(jī)器人等領(lǐng)域已經(jīng)取得了非凡的進(jìn)步,最近發(fā)布的一份報(bào)告也顯示,蘋果希望到2021年Siri能夠與用戶進(jìn)行以健康為主題的對(duì)話。
人工智能助手的專業(yè)知識(shí)圖譜可謂兌現(xiàn)了科幻小說的情節(jié),最近發(fā)布的Voicebot.ai報(bào)告也顯示,虛擬助手的技能集正在迅速擴(kuò)大。隨著它們進(jìn)入各個(gè)專業(yè)領(lǐng)域,我們將會(huì)受益不淺!
2)更強(qiáng)的個(gè)性化功能
今天智能音箱的個(gè)性化還處于起步階段。你可以改變語音助手的口音和性別表現(xiàn),為其添加或刪除技能,給它輸入一些信息,比如你的名字和工作地點(diǎn)。在某些情況下,你可以設(shè)置多個(gè)語音配置文件,以便谷歌的Google Home能夠識(shí)別你家中的各個(gè)成員。
亞馬遜Echo Show智能音箱
但智能助手在個(gè)性化上還有很大的提升空間——不過往這方面努力還是很值得的。Mattersight公司開發(fā)了一種名為“預(yù)測行為路由選擇”(Predictive Behavioral Routing)的人工智能呼叫中心技術(shù),該技術(shù)可以分析呼叫者的言語模式,并將其與性格相容的人類接線員進(jìn)行匹配。根據(jù)該公司的說法,給呼叫者匹配性格相容的人類接線員有助于溝通順暢,相比匹配性格相沖突的接線員,通話的時(shí)間也能縮減一半。
使用類似的方法,可能會(huì)使得人工智能助手會(huì)用你喜歡的方式與你交談。比如提供像匹配談話對(duì)象的口音和音量這樣的簡單的功能。或者,智能助手也可以改變其表達(dá)方式,對(duì)某些用戶使用更有感情色彩的詞匯來表達(dá)感想,而不是像面對(duì)其他用戶那樣更多地使用細(xì)節(jié)性的信息。也許有的人想要與語音助手進(jìn)行長時(shí)間的交談,有的人則只是想要語音助手能以最簡潔的方式傳達(dá)必要的信息。人工智能助手應(yīng)該同時(shí)具備這兩種能力。
像谷歌Duplex這樣的技術(shù)顯示出,人工智能生成的合成語音和對(duì)話正在變得多么地準(zhǔn)確。隨著人工智能涉足比回應(yīng)歌曲播放請(qǐng)求和設(shè)定食物定時(shí)器更復(fù)雜的任務(wù),預(yù)計(jì)這項(xiàng)技術(shù)將會(huì)在我們的日常生活中扮演更加重要的角色。
這有望借助語音識(shí)別技術(shù)的突破得到實(shí)現(xiàn)。赫伯納指出,Nuance的技術(shù)僅憑一秒鐘的音頻便能識(shí)別用戶身份。 “過去,語音識(shí)別技術(shù)需要10秒鐘的時(shí)間才能了解你是誰,才能得到準(zhǔn)確的信號(hào)。” 他說,“如今,這種技術(shù)威力非常強(qiáng)大。”這種技術(shù)能夠通過一小段語音識(shí)別用戶意味著它能解決密碼問題,也意味著你可以選擇使用語音助手來獲取相對(duì)微妙的機(jī)密信息。
3)由被動(dòng)變主動(dòng)
優(yōu)秀的助手會(huì)在你提出要求的時(shí)候給你做事,而卓越的助手則不需要你提出要求,而是能夠前瞻性地主動(dòng)幫你解決問題。目前,人工智能助手還處于第一個(gè)階段。用戶可以得到他們想要的歌曲,可以得到他們所需要的提醒,但通常只有在他們向語音助手明確提出要求以后才能得到。隨著人們?cè)絹碓搅?xí)慣于使用語音助手,它們有很大的機(jī)會(huì)從單純的被動(dòng)型設(shè)備轉(zhuǎn)變?yōu)橹鲃?dòng)型設(shè)備。
你覺得人工智能助手代表你做決定怎么樣?這些建議可以是:當(dāng)有人說他們覺得冷的時(shí)候,把恒溫器打開;或者因?yàn)槟氵t到了,重新預(yù)約了一次午餐會(huì)議;督促你更多地進(jìn)行運(yùn)動(dòng)鍛煉,或者節(jié)省開支。隨著越來越多的智能設(shè)備進(jìn)入家庭,語音助手可以控制的東西將會(huì)大大增加。
這在一定程度上是一個(gè)社會(huì)問題,即人們對(duì)讓機(jī)器做決策有多放心。人們是否愿意把某些任務(wù)交給機(jī)器呢?這還存在很大的疑問。不妨將此想象成把你的信用卡和房子鑰匙交給你的人類助手。不好的地方在于,你得放棄一定程度的控制權(quán)。潛在的好處是你會(huì)有更多的空閑時(shí)間。當(dāng)然,這是一個(gè)巨大的技術(shù)挑戰(zhàn)……
4)反饋機(jī)制
赫伯納指出了賦予語音助手主動(dòng)性的一大挑戰(zhàn):我們的機(jī)器如何知道自己做對(duì)還是做錯(cuò)?說回“優(yōu)秀的助手”和“卓越的助手”的概念上,卓越的助手會(huì)在一個(gè)大型會(huì)議之前把你所有的文件都拿出來,而不需要你提出要求。但是,如果文件拿的不對(duì)呢?讓家庭人工智能助手變得更主動(dòng)的一個(gè)大問題在于,目前只有有限的方法來揭示我們獲得的信息是不是我們所需要的信息。
“如果我每天走進(jìn)家門都要聽同一首歌,然后有一天我走進(jìn)家門,智能助手就開始播放,它怎么知道自己選對(duì)歌了呢?”赫伯納說,“如果我不停止播放,那是否意味著它選對(duì)了呢?如果我跟它說“停止播放”,那又是不是意味著它選錯(cuò)了,不應(yīng)該再播放那首歌了?反饋機(jī)制缺失,是你沒有得到更積極主動(dòng)的智能系統(tǒng)的原因之一。”
對(duì)于工程師來說,這是一個(gè)具有挑戰(zhàn)性的問題。任何有過被實(shí)習(xí)生就每一項(xiàng)任務(wù)征求指導(dǎo)和反饋意見的經(jīng)歷的人都知道,有時(shí)候自己親自做一項(xiàng)工作比委派別人去做來得更容易。人工智能助手要能夠讓你的生活工作變得更順暢;而不是每天讓你做幾十個(gè)小調(diào)查來確認(rèn)它的工作有沒有做對(duì)。這將需要以一種不會(huì)損害這些設(shè)備的用戶友好性的方式來解決,并且在系統(tǒng)了解你的偏好之前不需要進(jìn)行大量的預(yù)先培訓(xùn)。
5)新的交互方式
科幻電影《2001太空漫游》(2001:a Space Odyssey)有這么一個(gè)場景:兇殘的HAL 9000——令人不安的是,它仍然是歷史上最著名的虛構(gòu)人工智能助手——揭示出,它不只是利用麥克風(fēng)來判斷別人對(duì)它說了什么。當(dāng)兩名機(jī)組人員試圖選擇一個(gè)他們知道HAL 9000聽不見的地方說話時(shí),HAL 9000透露,透過閱讀兩人的嘴唇運(yùn)動(dòng),它仍然能夠知道他們說了些什么。
很可怕吧?未來人工智能助手或許也能這么干。
語音助手應(yīng)該局限于語音互動(dòng)的想法,減少了它們與我們有效互動(dòng)的潛在方式。隨著面部識(shí)別和情緒跟蹤技術(shù)日益興起,人們?cè)絹碓蕉嗟纳锾卣髯R(shí)別數(shù)據(jù)被不斷收集,讀心技術(shù)甚至也有可能出現(xiàn),人工智能助手可以使用大量不同的信號(hào)來得出結(jié)論。
10年后,我們將只能使用語音來控制這些人工智能助手的想法,就像在上世紀(jì)80年代初看到個(gè)人電腦時(shí),會(huì)想,我們永遠(yuǎn)不會(huì)再有別的帶有鍵盤的計(jì)算設(shè)備。
聲明:本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電源網(wǎng)。本網(wǎng)站原創(chuàng)內(nèi)容,如需轉(zhuǎn)載,請(qǐng)注明出處;本網(wǎng)站轉(zhuǎn)載的內(nèi)容(文章、圖片、視頻)等資料版權(quán)歸原作者所有。如我們采用了您不宜公開的文章或圖片,未能及時(shí)和您確認(rèn),避免給雙方造成不必要的經(jīng)濟(jì)損失,請(qǐng)電郵聯(lián)系我們,以便迅速采取適當(dāng)處理措施;歡迎投稿,郵箱∶editor@netbroad.com。
貿(mào)澤新一期EIT系列:探索AI與人類智慧在工程設(shè)計(jì)中的協(xié)同之道 | 25-07-29 15:02 |
---|---|
西門子 NX 新增 AI 助手等多項(xiàng)功能 | 25-07-03 16:04 |
瑞薩電子推出全新GaN FET,增強(qiáng)高密度功率轉(zhuǎn)換能力, 適用于AI數(shù)據(jù)中心、工業(yè)及電源系統(tǒng)應(yīng)用 | 25-07-02 17:07 |
西門子推出 Questa One 智能驗(yàn)證解決方案,借 AI 之力縮小 IC 驗(yàn)證生產(chǎn)率差距 | 25-05-14 15:25 |
芯海科技發(fā)力BMS領(lǐng)域,打造AI賦能能源管理新范式 | 25-04-28 13:49 |
微信關(guān)注 | ||
![]() |
技術(shù)專題 | 更多>> | |
![]() |
技術(shù)專題之EMC |
![]() |
技術(shù)專題之PCB |