自然語言處理,即Nature Language Processing,一般簡稱為NLP,是人工智能領域的熱點及微軟賴以生存的技術。也是忠仆1號智能電話機器人最重要的技術之一,它決定了電話機器人對自然語言的處理以及對自然語言的理解,也就是決定了它智能的程度。
自然語言處理就是體現語言智能重要的技術,它是人工智能一個重要的分支,幫助分析、理解或者生成自然語言,實現人與機器的自然交流,同時也幫助人與人之間的交流。我認為自然語言處理包括以下幾方面內容,第一是NLP的基礎技術,圍繞不同層次的自然語言處理,比如說分詞、詞性標注、語義分析做一些加工。后面做任何其他新的技術或者應用都必須要用到基礎技術。
中間這塊是NLP核心技術,包括詞匯、短語、句子、篇章的表示,大家所說的Word Embedding就是在研究不同的語言單位的表示方法。它也包括機器翻譯、提問和回答、信息檢索、信息抽取、聊天和對話、知識工程、語言生成、推薦系統。
最后是NLP+,仿照人工智能+或互聯網+的概念,實際上就是把自然語言處理技術深入到各個應用系統和垂直領域中。比較有名的是搜索引擎、智能電話機器人、商業智能和語音助手,還有更多在垂直領域——法律、醫療、教育等各個方面的應用。
正如其他人工智能學科,自然語言處理也要有很多支撐技術、數據——包括用戶畫像,以提供個性化的服務;包括用來做訓練之用的大數據;包括云計算提供、實施、訓練的基礎設施;包括機器學習和深度學習提供訓練的技能……它一定要有各種知識支撐,比如領域知識還有常識知識。這張圖就概括了人工智能方方面面的要素。
自然語言對電話機器人乃至人工智能都是很重要的。今年不論是百度2018人工智能大會,Google的2018開發者大會還是微軟第六代小冰,對自然語言的處理等是重中之重。
自然語言處理以及智能電話機器人的發展前景
第一,隨著大數據、深度學習、云計算這三大要素推動,所謂認知智能,尤其是語言智能跟感知智能一樣會有長足的發展。你也可以說,自然語言處理迎來了60余年發展歷史上最好的一個時期,進步最快的一個時期,從初步的應用到搜索、聊天、智能電話機器人上,到通過對上下文的理解,知識的把握,它的處理能力得到長足的進步。
第二,自然語言的會話、聊天、問答、對話達到實用程度。這是什么意思?這意味著在常見的場景下,通過人機對話的過程完成某項任務。這個是可以完全實現,或者跟某個智能設備進行交流,比如說關燈、打開電腦、打開紗窗這種一點問題都沒有,包括帶口音的說話都可以完全聽懂。但是同樣,這也不代表任何話題、任何任務、用任何變種的語言去說都可以達到。目前離那個目標還很遠,我們也在努力。
第三,智能電話機器人加上人工電銷完美的結合,一定會大大提高客服的效率。很多重復的客服工作,比如說問答,還有簡單的任務,基本上人工智能都可以解決。但是復雜的情況下仍然不能解決,所以,實際上是人工智能跟人類智能生產線的完美結合來提高生產力。
智能電話機器人正是基于對自然語言處理,溝通起來不像傳統的一些電銷工具那樣,應用起來既沒有互動,也不生硬刻板。提高電銷的效率,加快意向客戶的篩選,從而提高成交量和業績。