CTI論壇(ctiforum.com)(編譯/老秦):在過去的幾年里,語音技術似乎以光速發展。隨著人工智能(AI)以更強的能力進一步滲透到該行業,2020年尤為關鍵。自冠狀病毒危機爆發以來,這些能力肯定受到了考驗。這場危機迫使全球數百萬人在家工作、購物和娛樂,并日益依賴由人工智能驅動的語音技術支持的創新應用程序、平臺和在線解決方案。
Cogito的信號處理和機器學習主管JohnKane說,人工智能和語音終于達到了一個新的高度。
這個行業正在經歷重大的勝利,比如能夠準確地從語音中識別文本,創造出聽起來自然的計算機聲音。他說:新產品現在可以分析語言的非言語特征。言語中的許多意義來自于說話的方式,而不僅僅是所說的話。而語音技術讀取和分析這些特征的能力是該行業向前邁出的一大步。
Orbita首席執行官Bill Rogers也同意這一觀點。
如今的機器學習算法可以預測并提出建議,從而實現與人類水平的自動對話。這方面的高級應用包括結合生物標記來理解人類的情緒,并從語調模式和基于語音識別的用戶識別中得出結論,他解釋道。
其他人也同意,后一點尤為重要。
在同理心和同情心對成功互動至關重要的時代,語音技術的門檻已經提高,Interactions的研究與創新總監Michael Johnston堅持說。現代人工智能系統不僅提供日常自動化,而且已經開始依靠客戶和座席之間的對話,并以許多新的方式增加價值,例如提供個性化建議和呈現相關信息和內容。
最新的統計數據強調了語音和人工智能的重要性:
- Allied Market Research預計,未來7年,全球虛擬助理市場將增長37.7%,到2027年將達到443億美元。
- 根據insightSLICE的數據,到2030年,全球語音和語音識別市場預計將達到430億美元。
- 據谷歌統計,全球27%的在線用戶使用語音搜索;eMarketer顯示,幾乎40%的美國互聯網用戶和三分之一的總人口使用語音;據Perficient統計,目前55%的智能手機用戶使用語音搜索。
- 根據New Vantage的研究,10家企業中有9家以上正在對人工智能進行投資。
年度回顧
如果不優先考慮COVID-19以及它如何迫使人工智能迎接挑戰,就不可能評估2020年。
毫不奇怪,冠狀病毒是人工智能采用和語音技術創新的主要催化劑。廣泛的社會隔離以及對遠程通信和連接的需求將會話人工智能推向了中心舞臺,Rogers說。
例如:傳統的聯絡中心越來越多地轉向對話式人工智能,以確保業務連續性。
Johnston說:在一個充滿不確定性和混亂的時代,為客戶提供一致、有效服務的能力可能比以往任何時候都更為重要。
醫療保健組織和提供者也令人印象深刻地采用人工智能和語音技術來清除冠狀病毒的障礙。
Just AI首席執行官兼創始人Kiril lPetrov說:以人工智能為動力的聊天機器人和虛擬助理站在對抗COVID的最前線,幫助篩選和分類患者、進行調查、共享信息,并在人們無法離開家的時候實現遠程醫療。
使用語音分析和護理協調團隊,高危患者也能夠更頻繁地聯系,從而推動實時數據和參與。
Cosán集團創始人兼首席營銷和發展官DavidHunt說:隨著疫情的持續,人們對心理健康的擔憂增加,人工智能技術已經被用來提高患者的參與度,監測心理健康的變化。
總的來說,2020年讓商界領袖意識到,消費者習慣將繼續快速演變。
越來越多的公司認識到,人工智能可以幫助應對這些變化,繼續提供優質的客戶體驗,從而幫助公司與客戶建立更好的關系。Read Speaker北美區總裁Matt Muldoon說:公司已經開始利用人工智能開發出更感性、更高質量的聲音,品牌也使用了更多的交互式語音廣告,讓他們能夠直接與消費者交談。
2020年的其他亮點也很重要:
- 自動語音識別通過不斷增加的遞歸神經網絡傳感器的應用,實現了又一個飛躍,從而提高了準確性,減少了計算量。
- FacebookAI的wav2vec2.0吸引了大量的關注。Kane說:wav2vec2.0是音頻和語音的一項創新,不需要自動語音識別,它為下游的音頻和語音分類任務提供了強大的原材料。
- 引入OpenAI的GPT-3,以實現自然語言的預測和生成。
- 語音克隆得到改進,AI的本地化功能證明了這一點。他們的合成語音克隆可以被訓練說六種語言。這項新功能允許將數字語音翻譯成其他語言,這將使本地化更加容易,Petrov說。
展望未來
業內專家看好未來幾個月相關技術的快速擴張。
到2021年,我們將看到越來越多地使用會話人工智能來替代人類智能的增強。Johnston預測:我們還將見證對話人工智能從語音和文本渠道不斷擴展到富媒體和多模式交互,智能虛擬助理將能夠通過語音和文本的視覺媒體組合向客戶呈現信息。
Muldoon預測,由于流感大流行而改變的消費者習慣可能會加速人工智能和語音技術的應用,特別是在今年上半年。
我們將開始看到支持語音的人工智能能力的擴展。他說:隨著越來越多的模型繼續被構建,將會有機會創造出更強大的交互,幾年后,人工智能將成為完成任務的第二種方式,而不是支持性角色。
Kane預計,由于無監督的表征學習,諸如聲音事件檢測和語音情感識別等分類問題的準確率會有顯著的提高。
Kane說:今年可能是交互式會話數據得到應有的研究和開發關注的一年,我們看到了更多關于交互式語音合成的學術研究,以幫助語音助理等強大應用。
其他人則希望,人工智能的進步將在智能手機上帶來更好的語音文本轉換功能。
現在,當我們要求手機通過語音創建信息時,我們會看到很多錯誤。但隨著創新的繼續和算法的日益強大,我們將受益于這一應用的準確性提高,這也將影響智能說話者擴大他們對人類語言的理解,以及更廣泛地與用戶交談的能力,Rogers建議。
Wolters Kluwer的應用數據科學主管John Langton認為,我們可以預期,今年人工智能和其他技術(如面部識別和語音識別)之間的協同效應將會增強。
為了改進整合,我們現在可以使用情感計算作為額外的信號到語音輸入,在回答消費者問題時推斷用戶意圖,他說。
許多人同意,人工智能也將繼續在醫療保健領域提供更好的患者護理服務。
我們將觀察到為患者提供更加個性化的護理,為提供者提供更加高效和有效的手術。此外,遠程醫療的迅速采用,加上消費者對語音智能家居技術的廣泛使用,將可能推動交流醫療AI機器人的發展,Hunt說。
聲明:版權所有 非合作媒體謝絕轉載
作者:Erik J.Martin
原文網址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx