一、呼叫中心自助語音系統的起源與現狀
呼叫中心是基于現代通訊技術來處理大量各種不同的電話呼入和呼出業務與服務的系統。其最初的模型是基于PSTN的呼叫中心,是最早發展起來的呼叫中心,簡稱CC(Ca11Center),業務代表通過接聽電話為客戶提供信息服務,此時尚未與Internet網絡集成在一起,由專業的話務員根據自己的經驗和記憶力為打入電話的顧客進行咨詢服務,由于是憑人工記憶,信息容量有限,服務能力也無法提高。為了使電話系統為用戶提供更好的服務,CTI技術應孕而生。
CTI技術是指計算機電信集成(Computer Telecommunication Integration)技術,將計算機技術應用到電話系統中,能夠自動地對電話中的指令信息進行識別處理,通過建立有關的話路連接而向用戶傳送預定的文件、轉接電話,并且能夠處理傳真、電子郵件等其它形式的信息媒體。
現代的呼叫中心應用了CTI技術,通過相關的軟件處理使計算機也能夠處理電話的聲音及有關的信令信息,也可以提供自動語音應答(IVR)、自動呼叫轉移(ACD)、語音信箱等業務功能。這其中IVR(Interaction Voice Response,交互式語音應答)是呼叫中心產品鏈的重要組成部分,實現了呼叫中心的7*24小時服務,為企業處理大量的日常業務。
客戶通過按鍵或語音選擇來輸入相關信息,在允許范圍內訪問各類企業數據庫(通過ODBC),自助得到多種服務,令業務代表有更多的時間服務于有特別要求的顧客。IVR的文本與語音合成(Text-to-speech Synthesis)技術以事先錄制好的清晰的聲音為客戶服務,同時也可根據服務地區用不同語言播放語音提示或咨詢信息,但這種通過電話按鍵進行交互的自動呼叫系統在一次服務中客戶往往需要反復選擇按鍵多次,十分不便,如果可以采用自動語音識別方式將用戶的語音直接轉換成計算機能自動處理的文本信息則可以令呼叫中心的服務更加自動化、人性化。特別是在如今人工智能高速發展,在Torque和小冰、小娜、siri等智能機器人相繼出現的情況下,我們的電話銀行自助語音系統是否可以再進一步發展?
二、ASP技術介紹
自動語音識別(Automatic Speech Recognition,簡稱ASR)系統是一種可以識別講話者語音的軟件系統,通過語音信號處理和模式識別而將語音信號轉變為相應的文本,其目的是讓計算機自動識別和理解人類口訴的語言。
識別的原理:語音輸入后首先進行語音識別,包括對單詞(句)、音節和音素等的選取,進行特征提取,去除語音中對識別無關緊要的冗余信息,對確認的語音特征進行模擬訓練,建立語音識別所需的模板。而計算機要根據語音識別的模型將計算機中存放的語音模板與待識別的語音信號進行比較、匹配,找出最優的與輸入語音匹配的模板。然后根據此模板的定義就可以給出計算機的識別結果(如圖1)。
圖1 語音識別流程
隨著社會的進步,人工智能(Artificial Intelligence)的理論和技術日益成熟,應用領域也不斷擴大,可以設想未來人工智能帶來的科技產品將會是人類智慧的容器”。
2009 年時 Google 便已經利用語音識別技術在 YouTube上提供實時的自動字幕(Automatic Captions)”功能,讓客戶可以在避免干擾到他人的前提上在不開啟喇叭的狀況下觀賞網絡上各種影片內容,YouTube則利用Google的自動語音識別技術(ASR)給YouTube視頻加入字幕。
而在國內,支付寶中引入的語音機器人并非簡單地通過語音識別搜索商品或信息,而是進化到深層次語義理解的層面,能夠一步處理多層維度的信息。比如在支付寶上方搜索欄點擊右側的小話筒圖標啟動智能語音機器人,發起向某朋友轉賬1000元的語音指令,其中包含的朋友名字對應的賬戶、轉賬功能、金額1000元”三個信息要素,能夠在不足一秒即刻直接跳轉至最終功能頁,只需要點擊轉賬確認、輸入密碼即可完成,而以往則需要用戶分四步操作近10秒才能到達上述環節。
三、ASP技術是否可以應用于呼叫中心自助語音系統?
1、ASP技術與傳統自助語音結合的必要性
案例一:
電影《Her》中,男主角Theodore在情感低落期愛上了操作系統薩曼莎,其實Theodore會喜歡上操作系統一點兒也不奇怪,試想這世界突然有這么一個它”是專屬的、私密的、忠誠的,讓你能放下防備,毫無負擔地袒露脆弱、孤獨和彷徨,而這個它”又如此聰慧地理解你的喜怒哀樂,恰如其分地安慰你、鼓勵你、滿足你。如果呼叫中心是那個它”,你是否會接受它”的陪伴?但實際上在和Theodore溝通的同時薩曼莎總共有8316位人類交互對象,而且與其中的641位發生了愛情,而Theodore只是其中一位。試想如果是薩曼莎是一個人,那她只能為一人服務,但是薩曼莎是操作系統,這恰好反映了計算機的強大、反應迅速,如同呼叫中心,一位人工座席只能為一位客戶提供服務,而如果是完善的電話銀行語音系統卻可以同時向大量客戶提供更多的服務。
案例二:
筆者所在的運營小組曾經對七個工作日的全組接聽量13440通電話進行電話銀行信用卡客戶業務偏好分析,結果顯示大量的信用卡客戶通過電話銀行主要辦理查還款金額、調額、查可用額度和辦理分期付款業務(如表1)。
表1 電話銀行信用卡業務列表
但這些業務真的必要通過人工座席查詢、辦理嗎?是否可以通過電話銀行語音系統自助辦理?
呼叫中心作為企業與客戶的紐帶,建立功能完善的呼叫中心是增強企業競爭力的重要手段之一。
在呼叫中心將ASR技術應用于自助語音,實現了具有語音識別功能的IVR系統,通過直接的語言輸入就可以操作計算機系統,該技術不僅不會受到電話機按鍵的限制,簡化了客戶操作;同時還可以使IVR流程的功能大大增強,從而擴大傳統IVR的使用范圍。
電話接通后系統自動播放提示音,客戶根據提示音作出相應回答即可,系統記錄客戶語音,交由自動語音識別軟件處理,通過數據庫信息比對之后,系統自動輸出確認信息。例如客戶需要對20161215消費5000元進行分期付款一年期,按照現在的電話銀行業務處理僅可以通過人工服務辦理。客戶撥通電話后通過自助語音系統輸入證件號碼/卡號+密碼,通過層層語音菜單報讀后選擇分期付款人工服務,此階段將近2分鐘,進入人工服務后業務代表根據流程辦理分期付款,此階段大約需要3分鐘,整個分期付款過程需要耗時5分鐘左右。而對于應用ASR技術的自助語音,IVR系統可以達到直接辦理分期付款的功能,客戶可以在撥通電話后口訴需求:20161215消費1000元分期付款一年,經過模版庫匹配后語音自動進行身份核實,為客戶辦理此筆交易的分期付款。整個業務辦理過程簡單明了,并且計算機也可以同時為多位客戶辦理不同業務。
通過語音來輸入用戶請求,實現用戶與系統的互動,將語音識別技術運用到IVR系統中,這無疑將大大提高IVR系統對于呼叫中心的作用,更加堅定了呼叫中心在企業中的價值。
2、ASP技術與傳統自助語音結合的優勢
反應迅速:根據蘋果siri、微軟Cortana的表現顯示語音輸入后會在秒級得到響應,這種速度遠遠超過人工客服,應用ASR技術的電話銀行自助語音完全能夠代替一部分人的功能或者提高人的效率,提高呼叫中心工作效率,并且可以給用戶帶來良好的使用體驗。
成本更低:現在呼叫中心的運營成本一般包括人力成本、場地成本、IT成本等,其中人力成本的占比最大,高達75%,在呼叫中心的運營過程中如何控制”人的支出成為了關鍵,但實際上如果實現更加便捷的自助語音服務自然就可以降低人力成本,同時也可以為人工客服帶來更多分流,緩解呼叫中心流失率較大的尷尬。
改變習慣:現在很多客戶在撥通客服電話后會直接選擇人工服務,甚至在語音提示人工座席忙時仍一直等待接通人工,而客戶愿意等待人工服務的原因大多是因為主觀地認為自助服務無法解決問題,如果電話銀行語音系統能夠優化到能更加快捷地解決問題,那么客戶也會通過優化后的語音來辦理業務,從而改變自己的行為習慣
業務拓展:現在的電話銀行人工一般受理咨詢、查詢、業務辦理、投訴、建議等,而語音系統僅能受理簡單的咨詢、查詢,如果利用優化后的語音系統可以受理更多業務如大量咨詢、查詢,簡單的業務辦理等,未來的電話銀行自助語音系統將可以獨立完成業務辦理。
3、面臨的問題
(1)應用ASR的自助語音系統后在語音中可以進行相關知識匹配,進行業務處理,但這一切需要對應一個強大的模版庫以及細化后的專業知識,那么前期的知識整理工作將會非常繁重。
(2)根據呼叫中心服務地區的不同,客戶的意圖分類以及關鍵詞的設定及語音識別單元的整個選取過程較為復雜。
(3)隨著企業長期運營,知識的新增、變更以及過期刪除都需要投入大量的人力維護以確保提供知識的準確有效性。
4、未來的展望
改善服務,改善經營,使呼叫中心服務質量和利潤雙雙上升,可以說這樣一個新的完整的呼叫中心已為電子商務構架了完美的模式,它將肯定會成為電子商務的主題、平臺、核心和靈魂。
ASR技術與呼叫中心的結合以及語音數據、視頻信號的多媒體技術的集成將使呼叫中心在功能上有一個飛躍,創造出不同新概念、新功能的呼叫中心,使它在未來信息通信領域中將占有越來越重要的地位,這些新模式的呼叫中心將會成為電子商務的主體和新的平臺,這些全新概念的呼叫中心將成為未來電子商務的核心和靈魂。