POST TIME:2021-09-05 20:38
隨著人工智能技術的發展,近半年來涌現了大量基于人工智能的呼叫中心業務服務商和集成商。僅電銷機器人這一個方向就至少有近百家公司正在推廣運營,包括百度、訊飛、智齒、硅基、百應、箭魚、容聯等。商務上的需求非常強烈,整個市場都飛快地熱鬧起來。
一套可提供saas服務的智能外呼系統,看起來功能并不復雜。一個網站可注冊、充值繳費開票,登錄后在后臺頁面選擇或者定制外呼話術腳本,新建外呼任務并導入外呼號碼列表,明確外呼策略(時間段、重呼次數),設置外呼機器人數量(同時撥出幾個號碼),點擊開始。然后就可以看著進度條走完,外呼機器人按照列表一個個打電話出去。任務完成后,可以查看外呼結果列表。
那么如何從零開始搭建一套對外可以提供saas服務的智能外呼系統呢?
我們先列出,搭建這樣一整套系統需要哪些技術和資源:
簡單關系示意圖如下:
上圖中四個主要模塊,其中一些難以自研,只能選擇供應商:
明確了涉及到的技術和資源之后,再明確一下建設步驟。由于各個廠商都有各自的資源和能力,建設方式也各不相同,簡單來說可以分成以下幾類:
作為初學者,為了自行從零開始搭建一套對外可以提供saas服務的智能外呼系統,身份必然是第四種,啥都沒有,啥都要干。
以上這四部分,核心角色是呼叫中心。AI只是插上了想象力的翅膀,但是沒這翅膀,呼叫中心還是呼叫中心,但是AI就只是空中樓閣了。業務明確可落地的呼叫中心才是想象力的基石,這一點與CV和安防的關系很像。
目前對呼叫中心比較普遍接受的定義是:呼叫中心是以計算機電話集成(CTI)技術系統為基礎,將計算機的信息處理功能、數字程控交換機的電話接入和智能分配、自動語音處理技術、 Internet技術、網絡通信技術、商業智能技術與業務系統緊密結合在一起,將公司的通信系統、計算機處理系統、人工業務代表、信息等資源整合成統一、高效的服務工作平臺 。
最新一代呼叫中心架構NGCC(Next Generation Call Center)如下圖所示:
具體如何理解呢?
先從最簡單的說起:個人A給個人B打了個電話。
然后來個復雜點的:個人A給呼叫中心400xxxxxxxx打了個電話,撥通后先聽到了錄音,“您好,找B類接線員說話請按0號鍵”。按了0,然后聽到錄音,“排隊中,請稍后”。幾分鐘后接通,B0026號接線員接了電話。
流程:A→PSTN→PBX→IVR→ACD→B
解釋:PBX是Private Branch Exchange,用戶級交換機,這是企業內部的局端用戶級交換機,整個呼叫中心的出入口設備。
PSTN到PBX之間是中繼(分成模擬中繼、數字中繼、IP中繼),這是將通訊公司的局端交換機與企業內部的用戶級交換機(PBX)相連的通訊線路。
IVR是Interactive Voice Response,互動/交互式語音應答,我們把它叫語音導航。實現的是類似撥打10086后聽到錄音說,xx業務請按x,這個環節。主要用途是根據業務分流來電,進入對應的排隊機。
ACD是Automatic Call Distribution,自動電話分配,也叫排隊機。
再來個復雜點的:個人A給呼叫中心400xxxxxxxx打了個電話,撥通后先聽到了錄音,“您好,您想找哪類接線員?”
個人A說,“B~~”。
然后很快接通,“您好,這是B0026號機器人,有什么可以幫您?”
個人A說,“我不想跟機器人說話,泥奏凱~”
然后聽到錄音,“為您轉接很貴的真人客服,排隊中,請稍后”。
幾分鐘后接通,B1026號真人接線員接了電話。
流程:A→PSTN→PBX→IVR(→ASR→NLU)→ACD(→ASR→NLU→DM→NLG→TTS)→ACD→B
解釋:現在智能的部分,也就是我們說的語音機器人的部分,分別在IVR和虛擬坐席處體現。
IVR部分,不再需要提示按鍵,而是直接問來電方需要辦理什么業務,然后識別語音、理解意圖后,進入對應的業務隊列排隊。排隊后可以等待真人客服接待,也可以由機器人先行接待。
機器人(實際是服務器資源)資源空閑時,直接接待,進行語音對話,對話過程就是語音識別、語義理解、語音合成的多次調用,部分業務涉及業務數據接口對接調用,比如查詢話費、積分。并可以根據需求自動或者選擇轉人工,再次進入排隊,等候真人客服接待。
其中IVR部分示意圖如下:
上面提到的全部流程中,PBX、IVR、ACD等部分基本都是由我們說的呼叫中心設備商提供,產品有三種類型:板卡式、交換機式、VoIP形式。
交換機式比較適合大型職場,例如三五百人以上,硬件價格五位數。交換機領域,主要有:avaya、genesys、cisco、華為、中興,其中最常用的兩家對比下來,avaya比genesys便宜(參見文章)。
板卡式適合中小型職場,比如幾十人到兩三百人,硬件價格四位數。基于板卡建設呼叫中心的步驟,可以參考使用三匯板卡的這幾篇(主要前4篇講原理)。
選擇板卡之前,先要確定選用哪種中繼線路,比如:使用常規的數字中繼,那么就需要選擇數字板卡,這個找板卡的供應商問就行了。通常來說呼叫中心要購買的一條E1數字中繼報價五位數/年,由用戶級交換機將局端的光信號轉換為30路模擬信號,也就是支持30個人同時接打電話,通話費會另外按照實際呼出分鐘數收取。
近期一個實際落地項目是選擇了數字中繼+Asterisk(開源VoIP PBX純軟方案),(可參考:安裝配置,調試)示意圖如下:
具體的軟件業務細節,比如:常規客服中心需要的管理模塊、配置模塊、工單服務、坐席服務、報表模塊、CRM,還有比如:坐席班長監聽、通話插入、質檢,錄音文件管理等整套軟件細節,不做詳述。
在具體落地中,這個領域的常規參與者通常具備呼叫中心能力或者AI能力其中一種,而主要的對接點也就在于AI能力與呼叫中心設備去對接,而ASR/TTS與呼叫中心設備對接的常規協議主要是mrcp/sip。
媒體資源控制協議(Media Resource Control Protocol, MRCP)是一種通訊協議,用于語音服務器向客戶端提供各種語音服務(如語音識別和語音合成)。有兩個版本的MRCP協議,版本2使用SIP作為控制協議,版本1使用RTSP。
實際對接的時候,會遇到不少技術問題,有的呼叫中心廠商會要求ASR/TTS引擎做私有云部署,這樣避免了內外網穿透時防火墻的諸多設置和語音流的時延。這對基于語義起家(并購買語音能力)的公司是一個小小的難題。
現有技術中實現一次性語音識別典型的流程時序,具體包括一下步驟:
電話渠道的語音流采樣率一般是8k 16bit,這種語音識別的準確率遠遠低于app等渠道采集音頻的識別率。再加上人在打電話時說話方式相對隨意,導致語音識別部分成為了影響電話機器人能力和效果的重要瓶頸。
實現語音合成典型的流程時序,具體包括一下部分:
現在主流廠商為了使通話效果盡可能模擬真人外呼,除了涉及業務接口調用的數據查詢使用了TTS,基本采取整句錄音的方式。
準確來說,一個簡單的對話機器人系統框圖,包括語音識別(ASR)、語音合成(TTS)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG)幾個模塊組成。而這一部分就是智能外呼系統的主流玩家——NLU類(智能客服)廠商的強項了。
對于呼叫中心從業者來說,ASR/TTS/NLU如同黑盒一般,只暴露出接口。而國內語音能力的供應商,要么很土豪,少量QPS不要錢,要么就是非常標準的報價五位數一條線路/年,實在也沒有太多可以選擇的余地。
對于只有NLU能力的廠商來說局面也是一樣,除了需要接入ASR/TTS的能力,還需要去尋找可以合作的呼叫中心,并且想辦法拿到盡可能低的話費報價。
經過一些調研和競品分析,行業內雖然有至少近百家公司在推廣和運營電銷機器人,但毫不客氣地說,大部分都不及格。
一星級 ★
二星級 ★★
有錄音可以試聽,但明顯可以聽出來,部分是真人直接對話錄音,而并非機器人與真人的通話錄音。部分若干家公司用于試聽播放的錄音文件完全一致,不知道誰抄誰的。
三星級 ★★★
四星級 ★★★★
五星級 ★★★★★
商務模式比較簡單粗暴,粗略的成本核算如下:
那么電銷機器人廠商,競爭這么激烈,誰才會笑到最后呢?
一是要有價格相對低廉的運營商資源和語音能力資源,這樣可以明確的報出一個行業內相對較低的價格。比如:完全不按照主流友商們1-3w/線/年的報價方式,直接來幾毛錢一分鐘隨便打,隨打隨充。
二是呼叫中心資源方,最好是帶客進場,別從0開始找客戶,直接把現有的呼叫中心B端客戶轉化一部分成為機器人電銷客戶。
三是語義的能力,尤其是話術模板的設計能力。這一塊兒很容易被忽視,但是這反而也是產品經理可以出成績的地方。一般來說可以拿呼叫中心多年積累的語料去分析一套最佳話術模板(堪比金牌銷售的萬能對話體系),然后做ABtest也好。
從mvp開始逐漸增加主要話術分支也好,心理學基礎必須要有,必要時可以從游戲成癮機制等角度入手,《戀與制作人》的對話技巧學起來,一句話怎么說能讓接電話的人最大概率的順著自己的思路走,達成目的,從而形成特定細分領域機器人話術模板,得到最佳的外呼效果(接通率、通話時長、電銷意愿、催收意愿)。
這一塊兒雖然很細,但是反復迭代之后可以以一敵萬,甚至達到現在各類智能音箱背后核心系統一樣的地位。
四是外呼saas平臺。這部分是web類產品經理的天下了,具體功能點就不詳細列舉了,友商們的網頁和后臺過一遍,基本好壞也能判斷出來了。
至于現在此時此刻被視作亮點的可視化外呼腳本編輯,筆者個人認為其實是雞肋,普通人根本用不好,腳本邏輯只能做得很簡單,多輪對話、跨節點對話效果也不好,反而很容易導致客戶放棄。還不如干干脆脆給個可設置變量的場景化標準模板(金牌話術模板由產品經理提供),外呼試用效果好,客戶更容易買單。
這一套智能外呼系統搭下來,不僅僅可以做電銷機器人,可以做各類外呼,也可以做IVR語音導航、呼入電話客服。“NLU+CallCenter”就像這幾年“CV+安防”的結合一樣,也會如商湯科技聯合創始人林達華所說:
“中間也存在風險:一邊是從應用端往前走,一邊是從技術端往后走,大家都想占領技術上的制高點。這需要大家建立一種信任和共贏機制,只有這樣合作才能長久”。
AI雖然火熱受追捧,但具體項目落地并被市場認可和買單并不是那么容易。作為入行并不久的初學者,嘗試借以此文抽絲剝繭梳理了從0開始搭建智能外呼系統的全流程,才疏學淺囿于見聞,疏漏和不當之處在所難免,權當拋磚引玉。
下一篇:如何從零開始搭建智能外呼系統