抱著對人工智能的極大興趣,我這樣一位大叔,意外的遇到一個機器人蘿莉…。一切都是個意外!這個機器人蘿莉就是京東客服機器人JIMI,我更想把它叫做京東機密。

在某個場合,我見到了京東深度神經網絡實驗室(DNN Lab)首席科學家李成華,這位擁有博士后學位的深度學習領域的頂級專家,正在人工智能和機器學習領域進行研究。而京東JIMI,正是他創造出來的智能機器人,目前的工作是在售前咨詢、售后服務和生活伴侶三個場景,承擔超過30%的京東客服任務。

帶著對JIMI的好奇心,就產生了這段對話.jIMI的答復很有趣:它是一個蘿莉。可是,難道所有的智能機器人都具有類似的邏輯反應嗎?顯然,另一個業界知名的機器人某小二的反應卻略顯生澀,讓我這位大叔頓時失去了搭訕的欲望。
看來,機器學習再到深度學習,反映在智能機器人身上的效果還真是相差很大。
那么,問題來了,什么是深度學習,它跟傳統的智能機器人為什么差別那么大?
深度學習 小蘿莉的神經網絡
簡單說,深度學習是模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋和處理各種數據,包括文本數據、圖像數據和語音數據等。
而深度學習和普通的機器學習的最大區別就就是:神經網絡的層數。
傳統神經網絡一般只有兩三層的神經網絡,其有限的參數和計算單元,對復雜函數的表示能力有限,學習能力有限;而深度學習則具有5到10層的神經網絡。為什么JIMI能夠達到這樣的智能,李成華說,京東的深度學習已經能夠做到8到9層。

對比傳統的神經網絡,傳統神經網絡在大數據量的學習上性能較差,不符合大數據所需的時效性。另一方面,大數據的演進催生了軟硬件系統的進步,分布式架構的產生,使得算法的性能已經不是瓶頸,并行化框架和訓練加速方法,讓深度學習的前景變得光明。同時,大數據也會讓深度學習的效果越來越好。所以,從某種意義上說,深度學習是大數據的最佳拍檔。
可是,目前深度學習也有很多的困難。最為突出的就是人才稀少,李成華說,學這個專業的人才本身就少,能夠建立起一個實驗室的專家資源,甚至需要從全世界去尋找,京東的深度學習實驗室的8位專家就來自于全球各地。可見,深度學習,還沒有廣為人知,做深度學習的專家更是鳳毛麟角。
那么,問題又來了。京東把這么難找的一群專家聚集在一起,要做什么?
大數據價值 蘿莉也有長大時
其實,京東之所以能夠進入深度學習的領域,首先得益于開放生態系統的構建,和擁有的龐大的業務量并積累了較為完善的數據。李成華說我們數據比較突出,從大數據來說京東的數據可能是所有電商中數據鏈最長的,包括經銷商的數據、用戶一開始瀏覽我們的數據,可能別的電商有,最后我們做到客服有沒有返修,返修的時候跟我們人交互的時候他的情緒是什么樣的,這是別的平臺他們沒有的,因為他們服務不是自己做的,我們推送服務全是自己做的,所以京東對用戶數據掌握非常全,所以我們的描述也是最準的。
其次,京東雖然有近5000人的人工客服團隊,但應付618或者雙十一大促仍然顯得捉襟見肘。2012年12月,京東開始籌劃成立JIMI智能客服團隊,通過一些機器算法模擬人的思維,達到客服跟用戶交流的效果。隨后深度學習技術的研究,加深了京東完善JIMI的想法。

直到2014年9月9日,京東成立了京東深度神經網絡實驗室(DNN Lab),旨在通過神經網絡、知識層次、異構計算等新興領域的研究和應用來確保京東技術的領先性,提高JIMI的智能性及其應用的廣泛性是實驗室的首個直接目標。目前JIMI,已承擔超過30%的京東客服任務,但李成華希望未來JIMI可以包攬至少80%的客服工作。
看來小蘿莉也會有長大成人的時候。
JIMI的成長也許是電商的未來
其實,在文章開頭并沒有引用這段有趣的對話。我和JIMI還用這樣的對話,針對李成華的性別開了個小玩笑。玩笑歸玩笑,作為JIMI的創造者,李成華也可以說是JIMI之母。這個答案不知道李sir會不會滿意呢?

李成華的深度學習實驗室直接隸屬于京東副總裁馬松,而馬松本人是電商及人工智能領域的資深專家,在美國日本做過多年的研究,其他8名成員也是來自全球知名高校、企業和研究機構的技術精英,具有多年的實踐經驗和技術積累。目前,實驗室正從意圖識別,命名實體識別,自動問答和用戶畫像四個方向進行研究。
全球最有名的的深度學習技術首推IBM Watson,之后google和微軟等公司也把很多技術研發放到上面。在京東布局JIMI的同時,阿里也在積極布局深度學習實驗室。這說明,深度學習和數據挖掘技術已經被電商企業視為核心競爭力,也許JIMI成長到承擔咨詢業務量80%的時候,深度學習的智能機器人就真正成為電商平臺的未來。
未來?誰知道好萊塢電影里的機器人時代,會不會真的變成未來呢!