Facebook首先是大數據
我以前有一個觀點,或叫不同意見,與互聯網同行交流起來,感到非常費勁。他們總是認為,Facebook首先是SNS;我卻認為,Facebook首先是數據。我指出:“國內業界總是把臉譜當作SNS津津樂道。其實這是一種比較業余的看熱鬧的觀點。臉譜確實是SNS,但他真正的核心競爭力,在數據核心業務上。”
我這種異類的看法,在項目經理、尤其是標榜SNS概念的項目經理那里,很少得到共鳴。這一回,終于在投資人那里,遇到了知音。我認為資本人的觀點,比項目經理的觀點,更接近Facebook的實際。
首先,資本人比項目經理視野更開闊,更長于把Facebook放在時代大背景中看,而不是項目經理那種單純業務觀點。
資本人把Facebook放到了兩個大背景中:
1、在時代判斷上認識到,社交網絡(SNS)的價值挖掘引領互聯網進入大數據時代,推動“大數據”產業發展。
2、在產業鏈判斷上認識到,以Facebook為代表的社交網絡率先進入大數據時代,將進一步引領其他互聯網領域的大數據應用,對用戶價值的挖掘將驅動“大數據”產業鏈的發展。
項目經理雖然注意到了Facebook的SNS,但對于SNS在更大范圍做什么用,想得并不多,因此把SNS當作了目標本身。
其次,資本人比項目經理更長于透過SNS的現象,看到其數據本質。
資本人把Facebook這個“特殊”,放在了“一般”之中:
1、資本人認識到SNS只是大數據在采集端的一個特例:大數據指的是“海量數據+復雜數據類型”,而社交網絡(SNS)恰恰就是每秒鐘都在生成海量的非結構化數據(文本、應用、位置信息、圖片、音樂、視頻等),是典型的“大數據”的系統;
2、SNS只是大數據的一種應用:“大數據”的核心在于數據的挖掘和應用產生的多方位價值。社交網絡(SNS)的價值挖掘本身就是“大數據”和商業智能應用的重要應用。
3、Facebook代表著一對一的消費驅動模式轉型:Facebook用戶數據蘊含著巨大的商業價值。用戶所發表的評論、上傳的圖片、音樂、視頻等均為典型的非結構化數據,其中蘊含的用戶消費傾向,“數據”的挖掘分析可以大幅提升廣告的精確投放效果,有利于Facebook開發對用戶更具吸引力的應用,并且可以通過用戶行為預測多個行業的發展趨勢,蘊含巨大的商業價值。
相形之下,項目經理對于Facebook的理解,過于集中到與轉型無關的功能細節上了,而較少理解Facebook商業模式在轉型上的含義。
對扎克伯格來說,甚至資本人都不能讀透他的心。資本只是在價值層面,解讀Facebook是什么。而扎克伯格一再強調,Facebook的創建目的并非成為一家公司,需要在意義層面,讀懂Facebook的使命。
不是SNS之后的Facebook將是什么
Facebook遠不是SNS,SNS勉強可以說是Facebook的一種稟賦。對于稟賦來說,SNS甚至還只是多種可能的稟賦之一。這一點連商業分析人士都看出來了。Federated Media的約翰·巴特利(John Battelle)就看出,“Facebook正在進行的某種轉變與我們過去的預測不同。該公司正嘗試著對自身進行重新定義,不滿足于做狹義方面的社交網站,而這恰是外界對它的理解”。
1、成為人們生活的操作系統
巴特利最看好的一個新方向,就是生活操作系統。
巴特利表示,所有企業都搶著成為人們生活的操作系統,他們想成為這樣一個中心地方,用戶參與并將所有數據存儲在那里,然后他們做任何事情都需要利用到這些中樞。扎克伯格本人說的則是:世界信息基礎架構應當與社交圖譜類似。
扎克伯格的視野已經越過社交,從社交受到啟發,擴展到圖譜類似的“世界信息基礎架構”。這個說法不如巴特利“成為人們生活的操作系統”到位。實際上扎克伯格的本義可能更接近這個意思,因為他說:人們分享得越多,他們就能夠通過自己信賴的人,獲得更多有關產品和服務的信息。他們能夠更加輕松地找到最佳產品,并提高生活品質和效率。分明在強調生活的意義。
“世界信息基礎架構”同“生活操作系統”,都可能算是大數據背后的原型架構,相較而言,前者更側重從客體把握數據的總體架構,而后者更側重于主體把握數據的總體架構。對大數據來說,什么是生活操作系統呢?這是指用意義重構生活,數據不過是用來重構的意義的質料。用主體方面的意義一聚焦,數據就有了好壞之分:數據最終趨向于意義的,成為智慧的;最后背離意義的,成為愚蠢的。所以說,智慧地球也好,智慧城市也好,并不是數據的大堆積,而因為面向生活而顯得更有意義的。
工業社會的架構,沒有把聚焦點放在意義之上,而是聚焦在價值上。價值與意義的關系,是手段與目的的關系。但是有價值不一定有意義,例如,有錢是有價值,快樂是意義,但有錢不一定快樂。也就是說,掌握了實現快樂的手段,但達不到快樂這個目的。工業社會的人性的基礎架構,跟價值有關的,都是充分社會化的,極為專業;但是跟意義有關的,都處于小生產狀態,極為業余。這使工業社會不完美,容易成為一個為了高度發達的手段而體制性地忘記目的和宗旨的社會。
大數據的使命,不從技術這個手段看,而是從人的角度看,就是建立一個手段與目的之間的專業化、社會化的聚焦系統,從而體制性地讓做事不要背離它的宗旨,從而讓工業化條件下處于小農水平的人類意義系統,成為高度發達的社會總體架構。
SNS與生活操作系統將是什么關系呢?SNS只不過捕魚用的魚網,建立一個聚焦于意義的生活操作系統,打到生活意義這網魚,才是意圖所在。而現在模仿Facebook的人,都被魚網這個生活數據采集器吸引住了,建起一些一模一樣的魚網,模仿著Facebook的拋網動作,卻不知那個動作是在打魚,結果一網不撈魚,二網不撈魚,最后只碰上一些小尾巴的小尾巴魚。殊不知,捕魚除了用魚網,還可以叉魚、釣魚、電魚等各種手段,象SNS這樣的數據采集器,還有許多,例如LBS、O2O、支付,甚至線下POS機。如果Facebook哪天不是SNS了,一定是發現有其它捕魚方法,可以打到更多的魚。打魚,在這里比喻的就是意義或企業核心價值;捕魚手段,在這里比喻的是稟賦(通常說的,你是干什么的,哪行的)。企業要基業常青,就要在保持核心價值的同時,讓稟賦跟隨環境的變化而變化。
2、“重塑架構”:以客戶為中心的倒置經濟體系
扎克伯格提出“重塑架構”的重要原則:我們希望通過幫助人們建立關系,重塑信息的傳播和消費方式。我們認為,世界信息基礎架構應當與社交圖譜類似——它是一個自下而上的對等網絡,而不是目前這種自上而下的單體結構。此外,讓人們自主決定分享哪些內容,是重塑架構的基本原則。
這種重塑架構的基本原則,實際上對大數據的結構化具有指導意義。
在沒有原則指導之下,大數據很可能在結構上是反的:仍然沿用傳統的從生產者向消費者傳導價值的結構,只是用新技術為老傳統服務。這種服務雖然也是必要的,但卻不是Facebook對大數據的定位。
我們從扎克伯格的話中讀出如下含義:
1)重塑架構意味著大數據將倒置經濟結構
第一,“我們希望通過幫助人們建立關系,重塑信息的傳播和消費方式”。重塑就是倒置,所謂倒置,就是顛倒價值生成的方向,原來是生產者到消費者,現在是消費者到生產者。這是從上到下,變為自下而上的第一重含義。
在SNS和搜索引擎這種倒置的經濟結構中,價值的生成,不是從生產者到消費者,而是反過來,從消費者到生產者。消費者首先在SNS和搜索引擎暴露(主動“生產”)消費意向信息,進入交換,使之形成抽象消費價值;第二步,由大數據對消費信息進行加工增值處理,相當于對消費進行資本化處理,使消費者主權象資本一樣能夠得到同樣的獲得剩余的待遇。
第二,“它是一個自下而上的對等網絡,而不是目前這種自上而下的單體結構”。
傳統經濟和經濟學,在生產與消費關系上,有一個重要的不對稱。按“自生產這個上,到消費這個下”的順序創造價值,生產者首先在商品和交換環節,將具體價值換化為抽象價值(交換價值);第二步,將一般價值,通過資本機制,進行增值放大。但是消費者卻沒有這樣的權利和權力,一是不能把消費者的具體價值轉化為抽象價值,二是不能對這個價值進行增值,即消費沒有資本化過程。
大數據一旦走出就技術談技術的原始階段(2012-2014年),進入大數據同經濟結合的中世紀階段(大約2015年以后),人們就會發現,自下而上不光涉及信息傳輸,更關系到價值生成方式轉變。變成通過大數據為消費者賦權的過程。我建議大家讀讀《公眾風潮》和《創新推動者》這兩本相反方向賦權的書,理解這種賦權對經濟生活的改變。
第三,“讓人們自主決定分享哪些內容”。
這里提到一個重要的概念:“自主”。在工業化經濟結構下,人失去自主性,最主要的一步,是自主勞動異化為勞動力,因此在信息化中,人們通過信息獲得自主性的先提,是將人性的因素,復歸到勞動力,形成“人性+勞動力=自主勞動”的效果。
扎克伯格由于歷史局限,現在只是模模糊糊感到是在重塑消費方式,將來取代Facebook的小男生小女生,將需要把這一信息分享過程,深化為消費資本化過程。這將是大數據下一階段(2018年以后)的課題。
在那個階段,人們將開始普遍思考海爾前些年解決的未來型問題:通過“人單合一”直接經濟模式,解決由消費者生成數據,倒過來決定生產(特別是資本的戰略結構的問題。現在美國管理會計師協會(IMA)暗暗盯住,并派人命名為ZEUS(宙斯)的海爾戰略損益表,可能就透著資本化時期大數據的戰略秘密通道。我昨天還專門同信息化企業首倡者胡建生討論它對BI的決定性影響。Facebook到那個階段,不再進步,小命就堪憂了。
2)重塑架構意味著價值與意義的倒置
工業社會的價值結構,是從價值到意義,人們先圍繞手段進行生產,然后再用目的對手段糾偏;信息社會的價值結構,是從意義到價值,通過SNS和搜索引擎定位意義所在,然后再根據意義去做有價值的事。
以往工業社會中,把握意義靠小農的方式。大數據要把意義,擴展為一個有數據結構的系統。在意義學研究中,這個結構要完成的任務,稱為“意義的闡釋”。這是一種讀心術。大數據的體系結構,從主體意義角度看,就應該是讀心術系統,是專業化地破除人類的斯芬克斯之謎的大系統。通過這樣的生活操作系統,使人類得到提升,從僅僅有價值,變成不僅有價值,而且有意義。使人類因為意義而獲得更高的滿足。
對于企業來說,道理也一樣。關于從意義到價值這一決定方向,扎克伯格指出:在這一過程中,企業獲得的益處是:他們能夠制造更好的產品–即以人為本的個性化產品。除了制造更好的產品,一個更加開放的世界還將鼓勵企業與客戶展開直接而可靠的互動。
這里說的以人為本及個性化,都是指意義所在;強調的是越過價值這個中間環節,實現生產者與消費者之間的“直接而可靠的互動”。用張瑞敏的話說,就是人單合一。
意義需要解釋,解釋必須通過意義的循環實現。
用扎克伯格的話說就是:它是一個自下而上的對等網絡,而不是目前這種自上而下的單體結構。此外,讓人們自主決定分享哪些內容。意義不是生產者(相當于作者)賦予的,而是通過消費者(相當于讀者,即產品的接受者)賦予的。大數據系統通過意義在生產者與消費者之間的循環,實現價值與意義的統一,手段與目的的統一。
另一方面,大數據的結構化還有另一方面,就是打通意義的語形、語義和語用三個環節。斯芬克斯之謎層面的意義,是可意會不可言傳的。通過SNS這樣的數據采集機制,形成的是意義的語形產業;接下來將形成語義產業,即對非結構化數據的加工產業鏈;最終形成語用產業,通過LBS、支付等手段,將數據挖掘與具體的一個人一個人的情境,進行錨定。這樣才能破解語言層面之下的個性化意義和體驗的意義。從人工智能角度講,Facebook的數據計算模式有獨特優點,它是人人計算,而非谷歌(微博)那種人機計算。人人計算,相當在對話中,人們互為搜索引擎,形成生態化的計算能力。這方面還存在很大的發展潛力。
3、大數據生產力發動機內部的探索
大數據作為新時代的生產力發動機,研究它的生產力特性,對于理解未來的商業狂潮,是一個基本功課。在大數據時代,對技術毫無感覺的人,很可能成為被狂奔的生產力戰車拖來拖去的尸體。
連對技術一竅不通的資本人,已經注意到Facebook大數據結構中“海量數據+復雜數據類型”,非結構化數據等典型問題。事實上,這還沒有涉及Hadoop、NoSQL、數據分析與挖掘、數據倉庫、商業智能以及開源云計算架構等諸多基礎性問題。
大數據大致的技術過程,是先以SNS、搜索引擎、POS機等采集器,將海量數據采集進數據倉庫中,然后用分布式的技術框架(Hadoop),對非關系型數據進行異質性處理(NoSQL),通過數據分析與挖掘,發展一對一的商業智能。由于大數據問題比較復雜,我現在有些個人想法,但考慮成熟之前,先不拿出來誤導大家。我們還是先順著Facebook的實踐和見識,自下而上歸納。
Facebook在大數據這一行,也是顯赫的主角之一。它在低成本整合海量數據方面,為大數據行內人士所稱道。但目前Facebook的大數據戰略在我看來,還沒有完全定型,它主要集中發展的是內部數據管理這一塊。
數據分析:先結構化再挖掘
把大量數據采集下來,它就有價值嗎?人們看好Facebook因為它不光是把用戶集合起來就了事。正如有學者判斷:“Facebook之前數年的努力讓接近10億數字移民建立了聯系和紐帶,這個世界的邊界仍要擴張,而下一步更重要的則是考慮如何讓關系產生的海量數據更有價值。”
現在,Facebook每天會采集到500+TB的數據,如果沒有數據分析,Facebook在全球大數據的產業鏈中,充其量就是一個礦工、挖煤的。只有有了關鍵的一步——數據分析之后,它才真正實現了向“礦石加工”的角色轉型,將采集到的數據,加以分類、提煉,發揮數據真正的價值。
要處理這些數據信息,Facebook要過的第一關是歸類。將用戶發表的評論、上傳的圖片、音樂、視頻這些碎片化、非結構化的數據進行瀑布式的分析,使其集結、歸類成結構化的數據信息。形成身份類數據(用戶注冊的基本信息)、需求類數據(有“贊”按鈕的顯性信息、狀態信息、心情信息)、關系類數據(通過用戶關注的人和粉絲,判斷與他與其他社交網絡用戶之間的關系)等多個數據模塊。因此,當用戶在Facebook上進行的分享、聽音樂、點擊無處不在的“贊”按鈕,將狀態改為“已訂婚”的時候,Facebook要做的第一件事情就是將個人的雜亂數據,進行分類,結構化處理。
數據分析的第二關會更難,就是要將這些結構化的數據進行解讀,深入到數據背后的潛在意義。每當用戶登錄Facebook,Cookie會一直駐留在用戶的瀏覽器中,從此它的瀏覽行為、瀏覽頁面的關鍵字會被記錄,通過對關鍵字和上傳信息的持續分析,Facebook很容易得出用戶的長期愛好和近期需求。再加上對你的朋友圈的分析,可以獲得你的教育、工作、收入、地理位置等等諸多方面,這種挖掘和解讀往往比個人主動填寫的信息還要全面、真實。
開心網副總裁郭巍對Facebook數據挖掘能力的羨慕之情溢于言表:“根據海量用戶的使用習慣做數據挖掘,然后對用戶進行‘畫像’,是社交網絡最強大的功能之一。相比其他社交網絡,Facebook的‘用戶畫像’能力非常強,這會使它能更精準地把握用戶需求和廣告主的需求。如果以素描來做比方,國內的SNS網站可能畫的是個大致的模樣,但Facebook可能就會非常詳細,睫毛多長,眼睛是灰色的還是藍色的,發型是什么樣子,然后穿著襯衫、領帶、西裝等,還有胡須。”
正是基于這樣細致的數據挖掘,Facebook給廣告主帶來了超乎想象的精準投放:在主頁上剛剛宣布自己“訂婚”了的波士頓女士收到了婚紗攝影的推送廣告,而同是待嫁的印度孟買的準新娘則會收到結婚莎麗的廣告。當兩個好友在Facebook上正聊著未來某個時候計劃去歐洲旅游時,Facebook就會在他們的右側廣告區滾動出現一則旅游公司的廣告,上面會介紹去歐洲旅游的機票價格和出團時間。
數據應用:廣告、產品、用戶三個層面
數據應用在Facebook的大數據戰略中還沒有完全定型,主要集中在廣告營銷、產品服務和用戶管理三個層面。
基于數據挖掘的自助式廣告下單系統
在介紹Facebook的自助式廣告下單系統之前,我們首先要理解Facebook的廣告模式。
我們知道谷歌Adword搜索引擎的關鍵詞的廣告模式是這樣的:用戶在搜索關鍵詞,如果這個關鍵詞和廣告商競價購買的那個詞相吻合,它的廣告就會出現。而Facebook的模式不同,它并不是用關鍵詞來找目標消費者,而是利用用戶的基本屬性、粉絲、興趣來找出潛在的用戶群。而這種廣告模式之所以可行,必然要求后臺有強大的數據系統作為支撐。
因此,基于這樣的廣告模式,Facebook的廣告下單系統也基本上以自助式為主。投放廣告的廣告主都由自定義受眾開始,Facebook會一步一步帶領客戶設定一系列的參數,主要有三種方式:第一根據人口統計特征進行篩選,即受眾的基本屬性,一共有11個維度,包括所在地、年齡、性別、性情對象、感情狀態、語言、教育程度和學校、工作場所等。第二根據粉絲頁進行篩選,即具體到哪類關系的人。第三根據興趣進行篩選,每個用戶在開設Facebook時都可以設定自己的興趣,包括宗教、喜歡的事情(旅游、電影、閱讀等)、喜歡的品牌等。

接下來廣告主需要提交廣告活動的總預算和每天的預算額。系統會根據廣告主設定的受眾條件,運算出目標受眾群的人數,然后根據廣告主選擇的廣告方式(CPM/CPC)給出建議費用的范圍。
以LadyGaGa為例來做簡單的說明:在美國加州喜歡LadyGaGa的女性約有15萬人,而加入英國以后,喜歡LadyGaGa的女性人數大幅增加到近2百多萬人。如此一來,如果廣告商想針對喜歡LadyGaGa這類表演或歌手的受眾打廣告時,對于受眾群的人數就有了大概的了解。假設產品是能量飲品(類似紅牛一類的飲品)的話,還可以進一步針對喜歡運動(#sport)和冒險(#adventure)的Facebook用戶,甚至將紅牛等能量飲品的粉絲頁設定為受眾條件。

由于和后臺的數據實時相連,廣告主可以在廣告下單系統上了解每天新增/減少的粉絲數目、從哪里來、粉絲的基本信息以外,還可以看到每次廣告投放所能接觸到的人數、點擊率和轉化率,以便隨時更改策略。在數據庫的支撐下,這種全自助的系統具有的優勢也十分明顯:一來給更多缺乏廣告代理公司的中小企業客戶提供了自己制定廣告預算和受眾群體的工具;二來通過細致的指標選擇,給廣告客戶帶來專業、精準的投放體驗;第三提升了廣告經營效率,節省了廣告經營開支;第四也避免了人為的服務錯失將一些客戶擋在門外。

利用數據優化產品設計
Facebook的數據挖掘和應用不僅對廣告商具有很強的誘惑力,還能幫助產品設計團隊優化網站的內容,掌握用戶的使用模式,優化界面交互和操作。
一個小例子:
Julie是Facebook產品設計團隊的一員,通過數據分析,掌握了Facebook是如何利用網站提供的各種功能的。
以圖片上傳這個功能為例:Julie得到了以下幾組數據:87%的用戶在第一屏中的相冊專輯名字提示框中選擇類型,57%的用戶打開文件選擇功能來選擇他們想上傳的圖片,52%的用戶點擊上傳按紐,48%的用戶會等待上傳進度完成。
數據很顯然地說明了問題:那就是少于50%的用戶能夠成功上傳圖片。因此為了提高用戶成功上傳圖片的比率,Facebook將Java/flash facebook文件選擇功能改成瀏覽器原生文件選擇功能,結果上傳量提高11%。這個問題運行了一段時間之后,團隊又通過數據分析發現上傳圖片的用戶中有85%僅僅上傳一張圖片。團隊同時觀察到用戶不知道使用shift來選擇多個圖片進行上傳,所以加了一個提示,在上傳開始前出現上傳多張圖片的提示,結果數據從85%降低到40%。