阿里妹導讀:2020年面對突如其來的新冠疫情,14億人心系家國共渡難關。阿里人更是此時此刻,非我莫屬,用技術的力量聚沙成塔,守護著千萬家。你可能在釘釘群里見過一個名字叫防疫精靈的小機器人,準時準點地為你播報著全國新冠肺炎的實時輿疫情數據;有求必應地為你解答關心的各類問題,例如防疫知識、線上問診、小區附近確診病例、發熱門診分布等等。更神奇的是,防疫精靈機器人最初從一個想法到上線釘釘,僅用了一個下午的時間,目前已累計至少服務了500萬個釘釘用戶。這看似不可能背后,是機器人工廠,這個強大的智能會話機器人孵化平臺,以其成熟的NLP算法能力及QA問答能力,將一切變成了可能。
什么是機器人工廠?
2016年開始,世界進入Chatbot時代,科技行業巨頭也紛紛發布了各自在Chatbot領域的相關產品,例如蘋果Siri、微軟小冰、百度小度、阿里的天貓精靈等等。會話機器人的出現帶來的是用戶與計算機之間交互方式的變革,從以計算機為中心的一串有序的操作指令,發展到以用戶為中心的自然語言會話AI。
機器人工廠就是在會話AIFirst浪潮中應運而生的Chatbot智能機器人孵化平臺。有了機器人工廠,任何人只需一分鐘就可以搭建一個專屬的會話機器人,不懂NLP技術、搞不定編程各種問題都不存在的!
機器人工廠整體架構圖如下所示,下面將圍繞產品場景和核心能力兩大塊做詳細介紹。
用于哪些產品場景?
機器人工廠的應用場景主要分為答疑、運營、運維三大類。
答疑是三種場景中最常見的。用戶對商家的產品問詢、員工對企業的規章制度,總會有大量共性重復的問題需要解答,將這些共性的問題抽取出來整理成問答對沉淀在機器人工廠平臺上,答疑機器人就可以幫你解答大部分問題,既省時省力,就降低了人工成本。比如:機器人工廠為云棲大會提供了大會引導機器人。
運營場景主要是通過機器人將消息準確快速的統一觸達到所有用戶。比如,小明運營著天南海北的100個商家群,只需機器人工廠一次配置消息內容、發送時間,就可以準時觸達100個商家群。輕松解決了人工操作100次的低效與時延。
運維場景就更厲害了,機器人不僅會回答問題還能夠執行命令。比如,你在阿里云上購買了一臺服務器,跑了一些任務,可以讓機器人幫你查詢任務執行的狀態,發現異常,終止任務等等。用戶提問—理解指令——調用服務(執行指令)——返回答案,是運維場景的鏈路。
還有更多新奇的玩法兒,比如結合語音文字互轉技術,與阿里云通信、菜鳥驛站一起打造了智能外呼機器人。調查問卷、電話回訪、上門服務確認是否在家等等場景都可以由機器人完成,機器人一天可以打出的電話可是多了好幾倍。
有哪些核心能力?
介紹了這么多,你應該對機器人工廠可以做什么有了一些基本認識。下面將為你介紹機器人工廠有哪些核心能力,到底怎樣玩轉起來。
智能會話機器人的看家本領就是QA問答。意圖和實體是兩個最基本的概念。意圖由用戶輸入、動作、回應三部分組成。其中用戶輸入定義了用戶問題;回應定義了對應的答案;動作非必選,定義了理解用戶意圖后需要去執行一系列指令。實體作用于用戶輸入,將用戶輸入中的結構化信息抽取出來,高效地解決了存在大量類似意圖匹配場景的問題。例如,杭州2020-03-08的天氣怎么樣?杭州可以抽取成一個枚舉實體,2020-03-08可以抽取成一個正則實體,動作可以定義為調用一個根據城市和時間去查詢天氣的服務,最后回應返回天氣信息。
上述例子說明,QA問答首先要做到對用戶意圖的精準理解。機器人工廠底層有一套完備的算法框架,傳統機器學習算法與基于深度神經網絡的自然語言處理算法相結合,離線的特征提取模型訓練與在線的實時預測相結合,純文本的FAQ意圖匹配與基于實體槽位的意圖匹配相結合,從而提高意圖匹配的準確率。這里不做詳細展開,后續會有專題文章介紹。
會話機器人的智能程度在一定意義上取決于它所理解的語料的豐富性。但絕大部分的知識都是以非結構化的文本形式沉淀下來,而非會話機器人所能理解的一問一答的意圖形式。因此,新創建的會話機器人怎樣快速構建語料具有智能問答的能力?機器人工廠提供了三種方式解決冷啟動問題,單個機器人應用內,通過語料爬取(自動化)與批量導入(人工)和預置意圖(系統公共語料)豐富語料;在多個應用之間實現語料共享(應用拼裝)。
語料爬取是指自動地將用戶已有非結構化的知識庫或文檔,通過機器閱讀和理解能力,抽取整理成會話機器人可以理解的問答對的形式。語料爬取不僅可以代替人工錄入快速豐富會話機器人的語料,而且極大的降低了知識庫對接機器人工廠的遷移成本。目前,機器人工廠平臺80%的語料都由語料爬取生成。此外,還支持人工的將excel或json格式的語料,批量導入自動生成意圖。
預置意圖是機器人工廠將用戶高頻、通用的場景下沉到平臺層面,使其可以賦能所有平臺上的機器人應用,增強QA問答能力。例如,閑聊、查詢天氣、查詢值班等等。用戶只需在平臺上勾選啟用,即可使自己的機器人擁有回答這些問題的能力。
語料共享是指不同會話機器人之間相互復用語料的能力。例如,所有銀泰百貨的會員手冊都一致,但不同的店打折促銷活動不同。機器人工廠支持將通用普適的語料創建一個機器人A,各自差異的語料分別創建各自的機器人,但大家都共享復用機器人A的語料。語料共享能夠提高語料的復用率,讓用戶更專注差異化的部分。
上文提到過意圖是由用戶輸入——動作——回應三部分組成,其中動作定義了理解用戶意圖后需要去執行一系列指令。通常動作會通過HTTP請求的方式去調用用戶自定義的一個服務。但發現經常會遇到以下問題:
若用戶已有服務接口,會遇到服務格式不適配;機器人工廠的特殊處理邏輯與業務邏輯強耦合等問題。
若用戶沒有服務接口,需要開發、部署、聯調、發布一系列流程,還會遇到機器、網絡、環境等問題,如果線上驗證失敗,上面步驟需要重新來過。
新增一些具有時效性的臨時功能,都需要牽一發而動全身。
為了解決上述問題,機器人工廠與阿里云計算平臺的在線開發平臺AppStudio合作開發出基于AppStudio的在線服務開發IDE,為用戶提供云上在線編程平臺,幫助你打通下游的服務實現數據查詢,指令執行,知識庫檢索,內容推薦等功能。可以為你提供:
- 靈活性:支持在線編程,自定義業務邏輯、安全性校驗等,與業務系統本身解耦;
- 開放性:可以引入需要依賴的sdk,支持odps、hsf等服務;
- 簡便性:封裝了基本類和openApi便于開發;
- 即時性:不依賴任何發布系統,隨改隨生效;
- 共享性:支持協同編輯開發,代碼共享;
- 調試:支持在線debug、服務測試等功能;
未來已來
機器人工廠在阿里巴巴集團內經過2年的發展與打磨,已經孵化2w+機器人,服務44w+用戶。連續2年參加云棲大會讓我們感受到用戶對智能機器人的強烈訴求,2020年機器人工廠正式發布公有云版本。最后,獻上機器人工廠為飛天大數據開發平臺DataWorks打造的一鍵答疑機器人的Demo。