
本期局內人:桑文鋒(神策數據創始人&CEO)
一:大數據領域的新機會
大數據這個領域,已經有谷歌分析、百度統計這些做得比較好的產品了,但是我們還是做了神策,歸根到底是需求。有新的需求冒出來的時候,就會形成新的機會。
我把 2000 年的之后的互聯網分層 3 個階段:
第一階段:2000- 2006 年,流量時代。不管是三大門戶還是其他網站,歸根到底都是流量性質。阿誰時候你的產品流量大,你就牛。
第二階段:2006- 2011 年,用戶時代。這個階段大家更關注的是用戶數,像國內的開心、人人,國外的Facebook。對比產品的時候,更會偏向用戶活躍度,而不像最開始的時候以pv來衡量。
第三階段: 2012 年至今,,甚至到未來五年八年,我們進入了訂單時代。從 2012 年擺布的團購、到 2014 年擺布的O2O、再到去年的直播、互聯網金融的發展,我們看到一種趨勢,就是線下的交易在往線上搬。
發展到這個階段,我們做用戶分析的深度就紛歧樣了。從最開始的一個數據統計、分析用戶、到訂單交易、用數據漏斗做來源分析。這個時候你就會關心用戶留存,希望用戶下單、長久消費。所以你對信息的分析深度就紛歧樣。這就是需求的變革,需要更精細化的、更深度的用戶行為分析。
二:用戶行為數據在企業中有什么價值?
一個價值是用行為數據驅動決策。具體有三點:
1.產品改進。我們可以按照用戶行為數據分析出用戶的愛好,進一步改進產品。這個按鈕是放在左角還是右角,整個流程設計,怎么感官效果更好。
2.運營監控。我們做了一些運營活動,效果怎么樣?這時候就需要進行運營監控的數據分析。
3.商業決策。對辦理者來說,按照整體的運營分析數據,我們就能決定下一步該怎么走。
其實這是我們傳統的BI(商務智能),只發揮了數據價值的20%,數據更大的價值是驅動產品智能。好比現在最火的AI,其實邏輯有三步。第一步有了數據基礎;第二步在這個數據基礎上抄上必然的策略算法;第三步把這個策略算法和這個數值再回歸到產品里面去,這樣就形成了一個循環。對這個產品自己就是一個的學習過程,這就是智能。

最簡單的例子是有兩個產品,一個是百度搜索。按照用戶的點擊的情況,它會決定哪些結果往前排,哪些結果往后排,這個就是用戶行為引入到搜索引擎里面去。
那別的一個產品就是今日頭條,今日頭條是一個以替代引擎為核心的媒體渠道,它能按照用戶接觸的各種新聞,決定進一步給你推送什么類型的。
總結來說,用戶行為數據在企業里起到的作用,一方面是驅動決策,另一方面是驅動產品智能。
三:數據分析的四個環節
▎數據采集
第一個環節是數據采集,就是數據從哪里來。在搭建百度大數據系統的過程中,我有一個很重要的心得:數據要做好,最重要的就是數據源。
從源頭上來說,我把大數據分解為四個字:大,全,細,時。
大,并不是物理上的大, 98 年谷歌最開始做搜索引擎的時候,它抓取了整個網站的網頁信息,一共 2500 萬個網頁才47GB,一個U盤就能裝下,但它必定是大數據,因為它把整個網絡全都放進去了。
全,以美國選舉為例,網上的調研都說希拉里會獲勝,但結果特郎普獲勝了。后來分析原因說,美國中部的農民都是不上網的。這就印證了一個問題,就是我們收集數據的時候,不能只收集客戶端的數據,辦事端的數據也要收集的。
細,其實就是強調多維度。維度越多,占的數字規模不見得多,但是可能的組合形式就越多,你就會發現一些紛歧樣規律。
時,就是時效性。以前我們人口普查是每 5 年做一次,準備一年、做一年、一年之后出結果。但現在上今日頭條上看新聞,你剛看完這條新聞,數據系統馬上就會記住你的優先選擇,決定接下來給你保舉的內容。
▎數據建模
所謂建模,就是把數據進行儲存,把它整理得更便利以后使用。就像是一個倉庫,如果運來的東西不去分類,而是隨便往那一堆,等以后要用的時候,找起來就麻煩了。
▎數據分析
漏斗分析、用戶留存分析、多維交叉分析、用戶點擊分析,這些都是在數據模型基礎上的應用。
▎數據指標