以語音識別為基礎的各種應用,由于準確率技術上的突破,結合大數據庫應用,已成為目前金融,保險,政府及個大企業的關注重點。新應用利用語音轉文字及文本分析系統,自動檢測通話或錄音中的關鍵詞、敏感詞,實現百分之百的質檢,同時對內容進行邏輯分析,了解客戶需求及提供更高服務品質。除離線分析外,更可以進行實時監控、提供及時處理方式的業務應用。 近年來在國內市場需求快速擴張。在政府監管方面,保監會對于誤導式電話行銷的管理從嚴,要求全面質檢并鼓勵以語音識別為基礎的質檢方法,帶領風氣之先(保監會40號文:鼓勵保險公司通過技術手段實現系統信息化質檢,如語音識別、關鍵字、音調時長等新技術進行系統化質檢)。 在政府服務方面,以輿情分析,熱點關注為主,對于市民或客戶的來電進行原因分析,提高首次解決成功率,增加市民或客戶的滿意度,改善政府形象。在企業應用方面,除全面質檢外,還以提高銷售業績及改善服務品質為主。
普強信息技術專注于語音識別及文本分析系統開發,結合最先進的識別技術及分析理論,推出全套解決方案,為行業內的技術領頭羊之一。本文介紹語音識別的基礎理論、實際案例,與讀者們共同分享,并作為企業調研報告參考采用。
語音識別是一種概率學的應用
語音識別(Automatic Speech Recognition, ASR) 的基礎技術包括特征提取、模式匹配及模型訓練三個方面。利用聲音的特征比對,收集語料,建立對比詞庫,按使用者的語音輸入,分析輸入的聲音特征,比對現有的語料庫,找到最可能的詞句。所以語音識別應用是一種概率學的應用,是比對分析,而不是單純語音翻譯。
進階應用:語音轉文字
在實際應用中,語音識別應用以語音轉文字為主(Speech to Text, STT),即大詞庫連續性語音識別(Large Vocabulary Continuous Speech Recognition,LVCSR),是指針對連續性的語音輸入進行識別,將其由語音翻轉成文字形式存儲。常見的應用為智能手機上的語音發短信及編寫文件時的語音輸入法。實際上仍是詞庫比對,而不是真正意義上的翻譯。只能稱為語音轉文字,而不能稱為語音翻譯文字。
在語音轉文字的應用中,需要按用戶的常用詞句及話術,建立特定的比對大詞庫。標準的做法,是根據相關的錄音,進行人工標示,即人工記錄所聽到的錄音結果。當累積足夠的詞庫(基本為300小時錄音),即形成比對詞庫。以此為主要比對依據,輔助以行業專業術語、企業產品說明及服務話術內容,即可形成音轉字的應用。
通常的單字準確率在電話信道中可以達到70%以上,而關鍵字的準確率更可高達85%以上。由于是詞庫比對,所以不同的行業,使用不同的比對詞庫。發散式天馬行空的聊天對話,準確度只能達到30%左右,無實際價值。
在實際應用中,除識別引擎及分析系統外,專業的咨詢顧問以導入合適的企業應用是非常的重要。與國內外廠商相比,我司極大的優勢之一,是擁有由多年呼叫中心工作經驗的專家們所組成的專業咨詢團隊及完整的分析設備及工具,能協助客戶量身定做,按產品及服務內容的變化,提供最合適的應用,以保障企業最高的投資報酬率!
應用案例-邀約話術分析
在本案例中,我們的企業客戶為高端教育培訓公司,提供1對1的個人輔導,強調學生的全面發展,包括學業,個性,愛好等等。屬于長期性的高端服務。潛在客戶為具一定經濟能力的學生家庭,名單有限而且常需要多次訪談方能成功。該企業的市場總監,每天關心的重點是業績提高,而業績的提高與名單及話術成正比。在本案例中,由于名單特殊性及有限性,改善空間不大。所以我們以語音識別應用于話術改善,在有限的投入下,快速的提高邀約業績。
在進行標音,建立對比詞庫后,我們將呼叫中心坐席與潛在客戶間的錄音,轉寫為文字,以我們的語義分析系統,將通話內容分類為下列四個重點:
建立關系,包括:禮貌用詞,建立談話和諧氣氛,促發客戶自尊心。
促發需求,包括:了解客戶實際需求,說明培訓對學生的好處。
提供方案,包括:培訓內容說明,同類服務對比,相關法規說明。
異議處理,包括:客戶挽留話術,建立下次回訪機會。
按照上述重點,我們定義相對應主題,包括合適問候語,孩子成績分析,適當贊美,介紹專業教育資質,提供免費答疑服務等等,進行分類統計,判斷和成功邀約的關聯性,以進行話術分析改善,分析結果如下: