中,傳統式電話營銷占企業總營業額的一大半一部分,電話營銷客戶服務中心每日呼出幾萬元打電話,銷售話術全是如影隨行。但傳統式的電銷在線客服存有流通性大,塑造時間長,人工成本高的缺陷,怎樣降低企業的成本費又不降低電話營銷的市場份額,是每所遭遇的難點。智能化電銷機器人的發生,讓以上傳統式市場銷售難點引刃而解。但是,因為智能化電銷機器人未對于金融業情景開展改進和難以解決的語義識別等緣故,還未能運用于金融行業。
文中指出了一種組成應用文本相似度測算與特征詞標準配對的方式,可以提升語義識別準確度,完成更加友善的人機對戰對話。
傳統式的語義識別要靠軟件開發工作人員寫一些標準來處理語義識別問題。可是,要窮舉并制訂這種標準針對開發者而言勞動量無法想象。由于在自然語言處理行業中始終有寫不完的標準,這時就必須智能機器人應用你的自學能力開展邏輯推理。TF-IDF詞袋模型能依據詞的關鍵水平加上相匹配權重值,更合乎對話詞義邏輯性,但會使原文件格式轉換為高維的稀少空間向量,為向量儲存和相似之處測算產生了非常大的艱難。其關鍵技術性包括如下所示:
1、對電銷對話語料數據信息開展清理,刪掉對話邏輯性不科學的數據信息,刪掉語音轉文本全過程中鑒別偏差過大的數據信息,保存一部分語音轉文本全過程中的錯別字,進而提升實體模型的抗干擾性。
2、應用python分詞工具jieba包對清理后的語料開展中文分詞,與此同時刪掉停用詞和低頻詞。
3、創建詞袋模型,根據TF-IDF優化算法測算各詞的關鍵水平并做權重計算解決。
4、應用LSI對TF-IDF詞袋模型開展特征提取,去除小的奇異值,將文本文檔特點室內空間變成文本文檔定義室內空間。
5、整理電銷整體步驟,獲取電銷步驟中的每個情景,對于不一樣情景設定多種多樣意圖紙句。
6、將顧客的即時對話數據信息與各種各樣句核對(定義空間向量之問應用內積的交角余弦相似度測算比原先根據全文本空間向量的相似之處測算更靠譜),超過設定的相似之處閥值即鑒別為該情景下的相匹配用意。
7、開展電銷的相匹配銷售話術,進行一輪人機對戰對話。
對語音轉文本數據處理方法步驟如下所示:
比如,客戶說:“我還在駕車,到時候說。”標準配對字典中僅有“繁忙”“有急事”等,無 ** 確判斷顧客是“忙”的情景。將顧客的對話與意圖紙句開展同源性核對,若超過預置閥值則可判斷為“忙”的情況。
文本相似度測算應用無輔導優化算法,不用很多人力資源標明,與此同時加上新語料時,可自動更新特點引流矩陣,無需再次練習,合適商品快速迭代發布;組成應用文本相似度計算方式與特征詞標準配對方式,在智能化電銷對話全過程里能更確切的掌握顧客意圖識別,并高效增強了語義識別準確度。