1 引言
現代呼叫中心是一種基于CTI技術、充分利用通信網和計算機網的多項功能集成,并與企業連為一體的一個完整的綜合信息服務系統,利用現有的各種先進的通信手段,有效地為客戶提供高質量、高效率、全方位的服務。一般看來呼叫中心似乎是企業在最外層加上了一個服務層,實際上它不僅僅為外部用戶,也為整個企業內部的管理、服務、調度、增值起到非常重要的統一協調作用。
2 呼叫中心概述
中國引入呼叫中心的概念在20世紀90年代中后期,1998年以前,中國呼叫中心產業主要集中在電信業的一些服務領域,1998年以后,對信息化應用程度較高的行業,如銀行、證券、保險和以服務導向為驅動的市場化行業,如IT業、家電、遠程購物等行業也開始不同程度的應用呼叫中心提供服務。
隨著呼叫中心技術的成熟和功能的發展,金融、電信、大型企業等行業對于呼叫中心均加大了投入,而且已經成為企業整體發展戰略不可或缺的組成部分,其在企業中的角色也逐漸從成本中心演變為業務平臺和贏利中心。
呼叫中心的發展大致經歷了如下三個階段:
第一代:熱線電話。該方式實現簡單,但是功能單一,擴展性差。
第二代:計算機+板卡。基于板卡的呼叫中心是由系統集成商按照客戶的具體需求,將不同廠家的板卡集成到一個系統中,按照客戶要求的專項定制,其成本低廉、設計靈活,但其實現的功能較專用,功能的升級以及規模的穩定性難于保障。
第三代:基于CTI,排隊機+計算機網絡+三層數據庫訪問結構。基于一體化的呼叫中心既有電信級的穩定性和強大的交換功能,又有開發實施便捷和成本相對較合理的優點。隨著越來越多的企業應用呼叫中心,企業面臨著如何使呼叫中心在技術發展上更進一步的問題。現代通訊系統技術、互聯網技術和交互式視頻信號系統的發展將作用于呼叫中心,使其向著智能化、個人化、多媒體化、網絡化、移動化發展。互聯網呼叫中心、多媒體呼叫中心以及虛擬呼叫中心在未來中國市場,也將隨著企業對呼叫中心認識程度的進一步提高、客戶關系管理市場及設備制造商的全力推動而得到推廣。
新一代呼叫中心的系統結構如圖1所示。
3 呼叫中心關鍵技術
雖然隨著技術的進展Web、E-mail、傳真等多種接入方式出現,但就實際應用而言,這些先進的接入方式應用得還很少,傳統的電話接入處理和IVR應答仍然是使用率最高的技術方式。所以,可以將語音和數據融合的技術就成為呼叫中心的關鍵技術,最重要的主要有如下三種:文語轉換(TTS)技術、語音識別(ASR)技術和Voice XML。這幾種技術對呼叫中心的自動語音服務和電話與計算機、Internet的結合起著至關重要的作用。
3.1 TTS技術
語音合成,又稱為文語轉化(Text-to-Speech),涉及聲學、語言學、數字信號處理、多媒體等多種學科,是中文信息處理領域的一項前沿技術。語音合成技術解決的主要問題是:如何將電子化文本的文字信息轉化為能夠播放的聲音信息。近代語音合成技術是隨著計算機技術和數字信號處理技術的發展而發展起來的,目的是讓計算機能夠產生高清晰度、高自然度的連續語音,近幾十年來國際和國內的研究主要集中在按規則文語轉換,即將書面語言轉換成口頭語言。
在語音合成技術應用之前,錄音回放一直是呼叫中心自動語音服務中所采用的主要手段,但是隨著多媒體信息需求的增大,語音服務系統中近年來應用TSS技術得到了迅速發展。
TSS和錄音回放相比具有以下優勢:
(1)就工作量而言,錄音需要大量的人力,在信息量以幾何級數增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數工作由機器代替,人們只需提供現成的文本信息即可輸出聲音信息。
(2)對于動態的信息,尤其是對實時性要求很高的信息,如股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現實時的轉換,每分鐘可刷新一次。
(3)由于信息的高速增長,錄音數據存放和查詢也存在問題。將信息以文本形式存儲在計算機中可節約大量系統資源再結合計算機技術對數據庫中的信息進行搜索和整理將輸出的結果用語音合成轉換成聲音,這樣就可以解決信息服務中海量信息的存儲和查詢的問題。
(4)錄音的信息維護、修改的工作量比較大。而文本信息的維護和修改相對要容易得多,通過語音合成技術只需對文本信息進行修改就可以完成信息內容的更改和維護工作。
目前TTS技術已經十分成熟,現在的研究主要集中在生成的漢語語音的清晰度和自然度上,而且通過一些參數做到語氣語調的調整,使得語音更接近真人播音。
3.2 ASR技術
語音識別的研究工作大約開始于20世紀50年代,當時AT&;T Bell實驗室實現了第一個可識別10個英文數字的語音識別系統??Audry系統。在隨后的幾十年間實驗室的研究一直處于不斷進展中,但是畢竟語音識別是一項復雜的技術,特別對于漢語語音識別尤其如此,因此,盡管多年前就有眾多公司和研究機構開始了語音識別技術的研究,但直到最近幾年,在國內才開始出現商業化產品。
應用于呼叫中心領域的語音識別技術有別于一般PC系統所使用的語音識別技術,其面臨的困難體現為:電話錄音質量差,識別率要求高,系統不能對電話用戶進行訓練;另外,系統還要能夠完成大量用戶語音數據的并發識別請求,這就對應用于呼叫中心領域的語音識別技術在功能和性能上要有更高要求。由于存在上面列舉的種種困難,使得應用于呼叫中心領域的ASR技術不可能像應用于PC的ASR技術一樣,能夠隨心所欲地識別用戶所說的任何詞匯。目前基于電話的語音識別應用主要是非特定人的命令識別,該技術的應用有效的解決了電話用戶按鍵輸入范圍有限,操作不方便的問題。目前ASR的廠商均支持中文普通話、英文的識別,而且只要普通話標準,識別正確率可以達到90%以上,部分廠商支持中英文混讀和其它語種(主要是粵語)的識別。
但是目前ASR技術在實際應用中仍舊存在的主要問題是漢語的方言多種多樣,口音千差萬別,很多地方的普通話說得很不標準,給識別帶來很大困難。