本文目錄一覽:
-
1、阿里小蜜的架構設計
-
2、一臺移動的小型機器人有哪些結構?
-
3、如何搭建chatbot以及聊天機器人理論框架
阿里小蜜的架構設計
本篇總結了阿里小蜜從2017-2020年的演進過程,更偏向架構體系上的介紹,不對具體技術做詳細介紹。具體技術部分會放在后面的文章中。
來自2017年的分享 拆開阿里小蜜的內核,看智能人機交互的實現邏輯
阿里小蜜主要對接的機器人有客服、助理、聊天,根據不同場景的需求采用不同的機器人。后面有說到小蜜主要應用的3大領域場景:智能導購(助理)、智能服務(偏問答)、智能聊天(聊天)。阿里小蜜將對話系統分成兩層:
具體思路如下:
通常我們將意圖識別作為分類問題來解決;在阿里小蜜中,也存在對話領域語義意圖不完整的情況,因此除了傳統的文本特征之外,還加入了實時、離線等用戶本身的行為以及用戶本身相關的特征,通過深度學習方案構建模型,對用戶意圖進行預測。
另外,在基于深度學習的分類預測模型上,阿里小蜜有兩種具體的選型方案:一種是多分類模型,一種是二分類模型。(但是沒有詳細介紹分別在什么場景下用多分類或者二分類?)對于多分類和二分類的優缺點衡量如下:
主流的智能匹配技術分為如下3種:
智能導購對應的是任務型機器人,技術架構如下:
智能導購的意圖理解主要是用戶想要購買的商品以及商品對應的屬性,相對于傳統的意圖理解面臨的挑戰有:
基于以上問題,阿里小蜜通過品類管理和屬性管理維護了一個意圖堆。以下分別是品類管理和屬性管理的架構圖,方法都大同小異。
品類識別采用了基于知識圖譜的識別方案和基于語義索引及dssm的判別模型:
阿里小蜜的語義索引是結合搜索點擊數據和詞向量構造的,主要包括下面幾步:
我的理解是,語義索引是一種召回方式。
具體樣本構造
屬性管理的思路可以直接參考品類管理,具體架構圖如下:
部分細節需要說明的是,品類關系在智能導購中主要考慮的關系是:上下位關系和相似關系。(補充:在知識圖譜構建中實體與實體之間的關系,包括但不限于上下位、順承、時序等。)
上下位關系計算的2種方案:
相似性計算的2種方案:
這里只總結下阿里小蜜如何定義action、state、reward:
智能服務對應的是問答型機器人,小蜜采用基于知識圖譜構建與檢索模型。
基本的挖掘框架流程如下:
基于知識圖譜匹配的優缺點:
基于檢索模型的對話匹配的流程:
檢索模型整體流程如圖:
智能聊天對應聊天型機器人,目前主要有兩種技術:
內容主要來自于 2018 - 阿里小蜜這一年,經歷了哪些技術變遷?
算法方面本質上變化不大,新增了一些功能模塊。
通過對話管理系統的控制,面向不同的領域場景采用不同的領域技術:
與2017年相比,增加了Rec Bot和MC Bot。另外,隨著阿里小蜜平臺的擴展,部分領域存在難以獲得或者標注數據量不足的問題,因此開始引入遷移學習。
應用背景:(從各分享文章推測,阿里小蜜平臺應該是2018年推廣到其他業務)
基于機器閱讀理解模型的在線問答流程如下圖所示:
具體說明:
2019-01 - 未來已來!阿里小蜜AI技術揭秘
整體架構體系上基本沒什么變化,相比之前,2019的分享在任務型機器人中新增了slot,應該是在動作判斷中采用意圖+slot去做決策。
2019-09 - 干貨 | 阿里云小蜜對話機器人背后的核心算法
從2019年下半年開始的分享內容有了很大的改動,主要體現在:
內容來自于 2021-01 達摩院Conversational AI研究進展及應用 。由于是2021年初的分享,所以放在了2020年。
2020年的分享與2019年下半年的分享內容比較相似了,持續在技術深度上探索。改動點在:
一臺移動的小型機器人有哪些結構?
到目前為止接打電話機器人架構設計,地面移動機器人的行駛機構主要分為履帶式、腿式和輪式三種。這三種行駛機構各有其特點[2]。
(1)履帶
履帶最早出現在坦克和裝甲車上,后來出現在某些地面行駛的機器人上,它具有良好的穩定性能、越障性能和較長的使用壽命,適合在崎嶇的地面上行駛,但是當地面環境惡劣時,履帶很快會被磨損甚至磨斷,沉重的履帶和繁多的驅動輪使得整體機構笨重不堪,消耗的功率也相對較大。此外,履帶式機構復雜,運動分析及自主控制設計十分困難。
(2)腿式
腿式機構具有出色的越野能力,曾經得到機器人專家的廣泛重視,取得了較大的成果。根據腿的數量分類,有三腿、四腿、五腿和六腿等各種行駛結構。這里我們簡單介紹一種典型的六腿機構。
一般六腿機構都采用變換支撐腿的方式,將整體的重心從一部分腿上轉移到另一部分腿上,從而達到行走的目的。行走原理為:靜止時,由六條腿支撐機器人整體。需要移動時,其中三條腿抬起成為自由腿(腿的端點構成三角形),機器人的重心便以諶條支撐腿上,然后自由腿向前移動,移動的距離和方位由計算機規劃,但必須保證著地時自由腿的端點構成三角形。最后支撐腿向前移動,重心逐漸由支撐腿過渡到自由腿,這時自由腿變成支撐腿,支撐腿變成自由腿,從而完成一個行走周期。
腿式機器人特別是六腿機器人,具有較強的越野能力,但結構比較復雜,而且行走速度較慢。
(3)輪式
輪式機器人具有運動速度快的優點,只是越野性能不太強。現在的許多輪式己經不同于傳統的輪式結構,隨著各種各樣的車輪底盤的出現,實現了輪式與腿式結構相結合,具有與腿式結構相媲美的越障能力。如今人們對機器人機構研究的重心也隨之轉移到輪腿結合式機構上來了。
本文設計的移動機器人不僅要求具有一般輪式機器人移動速度快、控制簡單的特點,還要具有較好的越障能力,因此本文選擇輪腿式相結合的輪腿機構作為行駛機構。
2.1.2 驅動形式的選擇
驅動部分是機器人系統的重要組成部分,機器人常用的驅動形式主要有液壓驅動、氣壓驅動、電氣驅動三種基本類型[3]。
(1)液壓驅動
液壓驅動是以高壓油作為介質,體積較氣壓驅動小,率質量比大,驅動平穩,且系統的固有效率高,快速性好,同時液壓驅動調速比較簡單,能在很大范圍實現無級調速。但由于壓力高,總是存在漏油的危險,這不僅影響工作穩定性和定位精度,而且污染環境,所以需要良好的維護,以保證其可靠性。液壓驅動比電動機的優越性就是它本身安全性,由于電動機存在著電弧和引爆的可能性,要求在易爆區域中所帶電壓不超過9V,但液壓系統不存在電弧問題。
(2)氣壓驅動
在所有的驅動方式中,氣壓驅動是最簡單的。使用壓力通常在0.4~0.6Mpa,最高可達1Mpa。用氣壓伺服實現高精度是困的,但在滿足精度的場合下,氣壓驅動在所有的機器人驅動形式中是質量最輕、成本最低的。氣壓驅動主要優點是氣源方便,驅動系統具有緩沖作用,結構簡單,成本低,可以在高溫、粉塵等惡劣的環境中工作。其缺點是接打電話機器人架構設計:功率質量比小,裝置體積大,同時由于空氣的可壓縮性使得機器人任意定位時,位姿精度不高。
(3)電氣驅動
電氣驅動是利用各種電機產生的力或轉矩,直接或經過減速機構去驅動負載,減少了由電能變為壓力能的中間環節,直接獲得要求的機器人運動。電氣驅動是目前機器人是用得最多的一種驅動方式。其特點是易于控制,運動精度高,響應快,使用方便,驅動力較大,信號監測、傳遞、處理方便,成本低廉,驅動效率高,不污染環境,可以采用多種靈活的控制方案。
如何搭建chatbot以及聊天機器人理論框架
聊天機器人究竟是什么?
首先科普一下,了解下聊天機器人究竟是什么?Chatbot又可簡稱為Bot,指的是聊天機器人,注意這里的chatbot可不是實體的機器人,它是指以聊天界面為基礎,可以是文本聊天,也可以是語音聊天,通過聊天解決用戶需求的一種服務模式,類似于虛擬助理。
經蛋殼研究院研究了解,Bot并不是一個新玩意,甚至大部分的bot所運用的技術都較為簡單。相信大家都曾經有過chatbot的體驗(最簡單的比如當你短信回復10086幾個數字,10086就會把你當月的使用情況發送給你)。沒錯,chatbot很早就有了。只不過近幾年隨著移動通訊開始趕超移動社交,以及人工智能和大數據的興起。Chatbot才開始被視為一種巨大的機會,有可能替換app模式,改變互聯網現有的商業模式。并且從今年facebook和微軟的發布會可以看到,chatbot都是他們未來重點布局的一個方向。
聊天機器人創業需要避免幾個誤區
就最近半年來的情形,聊天機器人至少在歐美很受追捧,雖然大量的開發者涌入,但真正做得好的并不多,蛋殼研究院認為95%的細分場景仍舊在空白狀態,等著被挖掘建設。醫健領域的許多創業者對這一領域尚比較陌生,對這一領域如何切入存在誤區。以下幾個方面值得注意。
1、聊天機器人技術門檻未必很高
一看到機器人幾個字,很多朋友會覺得那就是智能領域,有較高的技術門檻。其實未必。現如今無論是自然語言處理還是AI結合大數據進行智能診斷技術層面都尚未十分成熟,個別創新公司和巨頭們確有所建樹,但也如大家所擔心的技術門檻較高,不是什么人都能玩起來。事實上并非如此,正如本文前面解釋的聊天機器人概念及基本工作模式,聊天機器人可深可淺,且有諸多開放技術平臺供使用,對人工智能技術的掌握并不需要十分深入。
2、升級交互界面體驗是當下Bot的主體價值
還在門外觀望的創業者,許多人并不明白Bot的訴求價值是什么。其實,當前聊天機器人模式能解決的核心問題是優化交互界面,以更為人性化的溝通模式全面升級交互體驗。核心價值在于界面體驗,未必一定升級服務本身的價值。
為什么一些評論家認為Bot可能全面替代App,事實上是從進入界面模式的角度來說得。也就是說以后我們不是打開一個一個App去獲取服務,而是打開一個Bot進行對話來獲取服務。正如幾年前,手機交互模式還主要依賴鍵盤,如今已全面轉向觸屏模式。
界面體驗的升級看著并沒有什么高智能,但卻符合人們愿意“懶死”的本性,能躺著就不坐著,能坐著就不站著,動嘴皮子能解決就絕不動手。簡單、直接、快捷這些好處多少能少用幾個腦細胞,在一個設計妥當的聊天機器人上確實能比App體驗更佳。
3、Bot與“導”相關,它可以成為流量入口
簡單直接快捷,這些訴求價值點十分適合成為人們獲得某項服務的入口,例如導購、導診、導航類似的目的都會十分匹配Bot,一個有平臺聚集性質的Bot可以成為一個新的流量入口。當然許多已經霸占在流量入口上的巨頭會想盡一切辦法再度霸占入口。這也是為什么Google、蘋果、Facebook等等巨頭們都在達平臺Bot的重要原因。
4、Bot不是被動應答,它可以有很強的主動性
通常人們覺得我向聊天機器人問一個問題,然后Bot被動應答。但其實,Bot也可以根據情景對你進行提問、追問。這一模式更為主動,更易調動用戶參與,提高用戶黏性。Bot相比網頁模式,更易有較強的互動性。
同樣作為入口,往往承擔著獲取數據的職能。從機器獲得數據的角度來看,Bot界面要比傳統網頁模式更為主動。以往傳統界面你只能被動等待用戶去填入信息,而Bot是可以在時間軸上不斷交互的,它可以根據前提設定主動追問,定向追問,也因此更有可能獲得更全面,更易結構化的數據。
無論是交互界面、個人數據采集、還是服務導航、流量入口等關鍵詞在數字健康、互聯網醫療領域無異也是重要詞匯,尤其對2C端模式更是如此。數字健康領域的創業者們根據自身情況不妨想一想如何借用Bot優勢提升自身產品的體驗,增加賣點,提高用戶黏性,提升轉化率。同時有必要關注人們對Bot模式的接受度。
國內醫健聊天機器人哪些應用場景更務實?
互聯網醫療健康領域,過去2~3年間已有大批APP涌入,絕大多數創業團隊尚在尋找更成熟可持續的商業模式。聊天機器人有何助益?在大多應用場景下以優化界面為核心價值的聊天機器人很難成為救命稻草,大多只能錦上添花。然而在某些領域,界面升級能匹配關鍵的價值訴求。蛋殼研究院認為以下幾個方面的應用會有點意思。
養老看護切入。老年群體對APP模式接受度差,他們許多人難以適應以往的人機交互界面,聊天機器人界面更易被老年人接受。一定程度作為生活助手,處理緊急情況,起到一定的陪伴作用。然而可能通過B2B2C業務模式來推進會更佳。
快捷百科解答。也許聊天機器人模式會顛覆我們以往查字典類型的知識獲取方式了。以往按各種索引查找的模式轉化成聊天機器人模式后能顯著提升效率,并且在有一定互動問答的模式下,更容易將有關聯的知識點全面獲取,避免犯下斷章取義的錯誤。尤其在醫學健康、營養保健、運動健身類知識領域,許多信息都不是單線條孤立存在的。
分診導診預診。在分級診療大政策背景的推動下,能高效配置醫療資源,為醫護人員節省精力,降低醫療部門運營成本的產品會有一定接受度。通過聊天機器人界面模式能更好的實現預診分診導診。以往在這一領域深度耕耘的互聯網醫療創業公司很多,競爭也十分激烈。僅以聊天機器人模式改進、優化、或新加入競爭不可能改變競爭很格局,也無法解決根本困境。最終仍舊需要多維度比拼。
醫療保健機構客服。將聊天機器人用于客服部分替代人工在許多產業已有應用,醫療保健機構也有較大的客服需求,這與其他產業的客戶中心需求類似,但其本質上和醫療健康本身并沒有什么關系,也是典型的2B業務。