京東大數據的優勢得益于京東電商業務的全價值鏈數據。由于京東的主要業務是自營式電商,而且要求端到端的流程控制,使得京東的大數據覆蓋了電商的全部流程,從采購、庫房、銷售、配送到售后、客服,整個鏈條是完整的。
分分合合的大數據路線
京東大數據說來話長,實際上,它經歷了一個分分合合的過程。
2009年7月的時候,邢捕頭的心情可沒有現在輕松。那個時候,快速增長的業務帶來了海量的數據需求,業務部門扔過來大量的數據,幾乎天天到他那里來“討賬”。于是京東數據部在2009年底正式成立。
到了2010年下半年,數據部依照服務職能對象的不同拆分為兩個團隊,其中一個主要面向采銷、市場等部門,另一個數據團隊則為倉儲、物流等部門提供服務。
巧合的是,這兩支團隊也選擇了不同的技術路線。一個選擇了基于開源的MySQL自建數據倉庫,自主開發配套的數據調度生產、數據分析提取、數據知識管理、數據報表呈現及數據質量監控的產品體系,并建設相應的數據集市與業務部門聯合推廣使用。
另一個數據團隊選擇了購買ORACLE RAC小型機/ORACLE BIEE商業智能平臺,數據處理效率也得到了明顯提高。
但是隨著京東業務的不斷擴張和高速增長,商業軟件的局限性就日益顯露出來了,主要表現在兩個方面:
一個是維護成本高,商業軟件此后的每一次升級都要請原廠的專家上門,這個服務費可是相當的高。
另一個更重要的則是快速響應能力。電商行業變化非常快,幾乎每天業務部門都要做一些策略調整,比如增加某些品類,砍掉另一些品類,而商業軟件都是模塊化的,并沒有那么強的靈活性,響應速度根本跟不上業務的發展。實際上,我們看到一些使用了商業軟件的電商在這個方面吃虧不小。
到了2012年年初,為了更好地應對業務的快速增長,京東數據部又合在了一起,并且確定了基于Hadoop的分布式開源技術架構,原來的SQL Server和ORACLE數據倉庫均退出了歷史舞臺。在Hadoop的基礎上,京東開發出了JDW企業級數據倉庫,目前集群的總存儲量已經達到了50PB以上,是名副其實的大數據。

更加真實有效的大數據
在貴陽大數據博覽會上,出任京東集團高級副總裁及京東研發體系負責人的張晨表示:“京東全品類、全價值鏈的電商數據在行業內具有稀缺性,它使得京東大數據在數據、模型、技術、工具等多個層面高度的整合和統一,大大提升了大數據在整個集團內融合和利用的效率,促進大數據的深度價值挖掘。”
簡單來講,京東大數據的優勢得益于京東電商業務的全價值鏈數據。由于京東的主要業務是自營式電商,而且要求端到端的流程控制,使得京東的大數據覆蓋了電商的全部流程,從采購、庫房、銷售、配送到售后、客服,整個鏈條是完整的。
“數據不僅僅大才有價值,如果不完整或者只是局限于某個點的話,價值就小了。京東的數據很完整,量又很大,這個數據就很值錢。”邢捕頭認為。
而且由于京東對商品交易過程實行嚴格的管控,在京東平臺上進行代購和刷單的行為都是不允許的,這也使得京東的用戶數據更加接近真實用戶的真實需求。
有了真實有效的大數據,京東就可以做很多的事情,比如精準營銷、用戶畫像、C2B定制,等等。
以老冀為例,比如老冀想在京東上買本《從零到一》,結果正好這本書脫銷,老冀于是點擊了一下“到貨提醒”。過了幾天,老冀收到一封郵件,告訴老冀這本書已經到貨了,并且還推薦了《奇點臨近》、《創業者的思考》,老冀發現這兩本也是自己想要的書,于是照單全收。
不過,老冀感覺京東每次登陸的主頁面還是非常龐雜,似乎不如美國亞馬遜那么簡潔、個性化和有針對性。邢捕頭坦誠,目前京東在A/B 測試方面還不如亞馬遜成熟。所謂A/B 測試,就是先建立一個測試頁面,這個頁面在呈現邏輯和內容上與原有頁面有所不同,然后將這兩個頁面以隨機的方式同時推送給所有瀏覽用戶,接下來分別統計兩個頁面的用戶轉化率,即可了解到兩種策略的優劣。還有一個也是跟中國網民的購物習慣相關:大部分美國網民購物非常直接,而中國網民則喜歡那種“逛”的感覺。

大數據還有個很大的作用,就是用戶畫像。前面老冀談到京東有個很獨特的優勢,就是數據更加真實可靠。而且經過了十多年的發展,京東的商品品類也已經非常豐富,目前已經有接近1億SKU。很多商品本身就會有用戶特征,比如女士的胸罩和內衣,男士的刮胡刀,等等。京東根據這些購買行為給用戶打上標簽,直至勾畫出一幅清晰的用戶畫像。
有了用戶畫像,京東就可以做很多事情了。舉個例子,根據用戶在下單前的瀏覽情況,京東就可以了解用戶的購物性格是沖動型、理性型還是猶豫型。對于沖動型用戶,京東直接推薦給Ta最暢銷的同類商品,而理性型用戶則推薦給Ta口碑最好的商品。
京東還將用戶畫像數據提供給網站智能機器人JIMI,使得JIMI能夠快速理解用戶意圖、從而對用戶進行個性化關懷,從而大幅度提升用戶的滿意度。

而隨著2014年京東收購了騰訊的實物電商部門,并將其數據整合進來,京東大數據的準確性又得到了提升。此外,京東的大數據還能夠與騰訊的QQ/微信大數據結合起來,從而開展更有針對性的營銷活動。從過去一段時間雙方的聯合推廣來看,大數據功不可沒。
幫助業務部門決策
其實,大數據還能夠做更多的事情。對于邢捕頭所在的部門來說,最重要的還是幫助業務部門更好地決策。
比如目前市面上有那么多款手機,京東手機采銷部門到底應該采購哪一款手機?就可以根據京東大數據參考決策。如今,京東更深入了一步,在2013年推出了JDPhone計劃,與手機廠商一起打造用戶喜歡的手機。
舉個例子:京東大數據顯示,近半年來在京東購買過兩次以上手機的用戶,其中34%都選擇了更大屏幕,但是5.5寸是他們接受的極限,因此建議手機廠商選擇4.8-5.5寸屏幕作為最優尺寸。最近這幾年,正是基于大數據的威力,JDPhone計劃先后與中興、華為等手機制造企業合作,推出了目前市場上很多暢銷的機型
“我們的數據能夠幫助業務人員做決策和判斷,能夠利用很多統計方式展現報表,以更加形象、實時和統一的方式提供給他們,通過業務應用服務于我們的消費者。”邢捕頭對于自己的工作感到非常自豪。
2011年11月,京東準備對快遞包裹收費。那么,當用戶的訂單金額到了多少才能夠不收費呢?為此,京東大數據部門模擬了一個場景,分別按照用戶訂單免運費下限為19元、29元到89元之后,對京東的整體毛利情況做了一個詳細的測算,然后找到了比較合理的價格區間,將報告提交給了公司高層,對于配送費的合理制定起到了很好的輔助決策作用。
如今,對于京東高達上億的SKU,單是補貨就是個大問題,如果只是依靠人工補貨根本就忙不過來。京東供應鏈研發團隊自主開發了一套補貨系統,項目上線之后,給圖書部門的采購補貨工作帶來了極大的便利。面對超過百萬而且不斷增長的SKU,圖書業務部門的采購人員并沒有顯著增加
此外,京東還將自己的大數據拿出來,與復旦大學聯合推出了復旦-京東信息消費指數,包括消費者行為與信心指數、電子商務行業景氣度指數、電子商務便利度指數三大子指數,共同構成了一個完善的指標體系,綜合反映了當前信息經濟消費情況,能夠為政府政策、行業發展、消費者行為模式等提供重要的參考價值。這也是目前我國首個用于評估電子商務、“互聯網+”等信息要素集聚程度以及績效表現的綜合性指數。
大數據下的智慧供應鏈
隨著網絡和信息技術的不斷發展,人類產生的數據量正在呈指數級增長,云計算的誕生更是直接把我們帶了大數據時代。“大數據”作為時下最時髦的詞匯,開始向各行業滲透輻射,顛覆了傳統行業的管理和運營思維,更撥動著電商行業管理者的神經,大數據在電商行業釋放出的巨大價值已越來越被人熟知與接受。
“可能你的數據以前只看未來一周就可以,現在看兩周,未來想看兩年的數據,這時候大數據作為一種技術可以支撐你。然而大數據也好、云計算也好,所有的東西如果沒有生意人直接的參與和深度理解,以及未來深度地使用,那么所有的這些用現代的詞來說就是然并卵。”京東零售平臺產品機構負責人翟松濤在《大數據驅動京東智慧供應鏈》的分享中如是說,她從銷售預測、庫存管理、可視化、選品及動態定價等供應鏈環節講述了大數據的神奇運用。
作為自營電商,庫存是供應鏈中重要的組成部分。翟松濤首先介紹了京東運用大數據在庫存管理上取得的成果。作為樞紐環節,銷量預測決定了后邊運營所有的相關配合,“過去5年里,京東從只有20萬的自營商品到今天有將近500萬自營商品,我們做了很多相應的事情。通過清洗數據得到針對每一個單品的需求的形式。對于這些單品我們匹配相應的算法和模型,預測未來這個商品可能會產生的銷量。”
翟松濤重點提到京東在做銷量預測的大數據分析流程中加入業務思路,銷量預測第一個支撐到的就是補貨建議。根據銷量的預測在京東的倉庫、配送站點等提前布貨,當用戶定單需求來的時候,保證在離他最近的倉庫里已經有貨。
在庫內補貨方面,京東的倉儲系統會接受銷量預測的建議,按照未來銷量可能產生的時間,把貨物從補貨區送到撿貨區。各倉庫間也有自動化支援關系,避免配入倉的冗余和缺貨。
在傳統的供應鏈中普遍存在一種“牛鞭效應”,即供應鏈上的信息流從最終客戶向原始供應商端傳遞的時候,由于無法有效地實現信息的共享,使得信息扭曲而逐漸放大,致使需求信息出現越來越大的波動,最終導致供應鏈失調,出現供應商貨物積壓、或零售商出現缺貨等現象。面對這些問題,京東選擇與供應商共命運——供應商深度協同,將供應鏈協作進一步延伸到生產環節。這方面翟松濤帶來了一個京東成功的實踐案例。8月份京東與美的達成戰略合作關系,雙方在物流配送、大數據分析、智能設備等方面進行深度合作,先后上線了系統直連、深度協同等項目,實現基礎訂單數據及銷量庫存數據共享,實現供應鏈深度協同。深度協同的不同之處就在于把銷量預測時間延長,根據未來三個月的預測銷量與供應商協調生產計劃,廠商根據預測安排生產周期,在整個實踐過程中,京東實現了降低缺貨風險、降低庫存周轉、提高數據共享效率的三大優化效果,而美的則實現了生產計劃預測性加強、智能補貨的優化效果。這對于電商,尤其是自營電商來說未來是一個很明確的趨勢。
不僅如此,京東還為供應商、廠商帶來了一款稱為“零售羅盤”的產品,用戶可以通過可視化界面點擊直接進入操作流程,通過消費者分析、競品分析甚至品類分析等判斷下一步生產制造的方向,為廠商帶來價值,受到戰略合作伙伴的廣泛關注。
根據線上線下數據自動推送選品建議,為采銷提供選品依據的“智慧選品”、根據單品特質形成的不同競爭力計算價格的“動態定價“等,翟松濤也一一作了介紹,都為京東日常運營、促銷提供了不少分析思路。
對于京東的技術革新來說,其雄厚的技術基礎和完善的技術體系、前瞻性的業務部署以及京東本身渴求為用戶帶來優質體驗的理念都成為其技術前進的驅動力。而對于這樣一個非傳統企業,其發展據點落實在技術之上,著實是穩健的選擇。可以說,云計算與大數據大大改變了電商的營運之路,也為中國市場的“互聯網+”時代做足充分準備。