近年來,數據分析”儼然成為職場和商業管理領域最熱門的話題。在以客戶為中心的業務環境中數據分析可以提供客觀的、科學的、最給力的業務判斷依據或方向指導,繼而為業務的有序發展提供最堅實的基礎和最有利的支撐。對于一般的管理者而言,因其需要相當的理論基礎及一定的專業知識,也為數據分析”披上了一層神秘的色彩。數據分析的好處顯而易見,然而是否所有人都能正確認識數據分析并理解其內涵呢?顯然并非如此。筆者將撰寫系列文章以期為正在從事數據分析工作的同仁或對數據分析感興趣的朋友們勾勒一幅全景圖,所有文章都將圍繞以下幾個問題展開:
為什么要做數據分析?
數據分析的目的是什么?
數據分析的一般過程是怎樣的?
有哪些數據分析方法?
在服務性行業里,數據分析方法有哪些需要特別注意的地方?
在國內最容易犯哪些數據分析的錯誤?
因筆者能力和精力有限,文章中存在錯誤或沒有詳盡之處,還望各位讀者見諒并懇請及時指正,大家相互學習。
(一)數據分析的核心作用
根據國際標準的定義,數據分析是有組織、有目的地收集并分析數據,通過將數據信息化、可視化,使之成為信息的過程,其目的在于把隱藏在看似雜亂無章的數據背后的信息集中和提煉出來,從而總結研究對象的內在規律。”在實際工作中,數據分析能夠幫助管理者進行判斷和決策,以便采取適當策略與行動。
這里需引起關注的是任何沒有目的或結果的分析報告都是忽悠”,都僅僅是沒有靈魂的軀殼!我們經??吹絿鴥鹊耐聜兠τ诟鞣N所謂的數據分析報告”,堆砌了大量的圖表和文字,顯得專業”、美觀”,但認真研讀后卻發現缺乏最關鍵的分析”過程,更別說什么分析結果了。顯然大家只是把對事實的原始描述當成了數據分析,而實際上描述原始事實只是數據分析過程的一項內容而非全部。數據分析不能僅有報表沒有分析,因為有報表不等于有分析,有分析不代表有效執行”,報表只是數據的展現形式;數據分析也不能僅有分析沒有結論,沒有結論的分析無疑差了一口氣”,對實際業務工作無法產生價值,唯有通過分析得出結論并提出解決方案才能體現數據分析協助管理者輔助決策的核心作用。因此數據分析來源于業務,也必須反饋到業務中去,沒有前者就不存在數據分析的基礎,沒有后者也就沒有數據分析的價值了。
(二)數據分析的分類
最常見也是最標準的數據分析可分為三大類:描述性數據分析、探索性數據分析以及驗證性數據分析。
所謂描述性分析是對一組數據的各種特征進行分析,以便于描述測量樣本的各種特征及其所代表的總體特征。這種分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布以及一些基本的統計圖形,比如上個月的平均通話時長是多少,員工離職率是多少等等。
探索性數據分析是指對已有數據(特別是調查或觀察得來的原始數據)在盡量少的先驗假定下進行探索,通過作圖、制表、方程擬合、計算特征量等手段探索數據的結構和規律的一種數據分析方法,側重于在數據之中發現新的特征,比如呼叫中心的一次解決率和哪些因素相關?他們背后的驅動因素又有哪些?哪些因素是因”、哪些又是果”等等。
而驗證性分析是依據一定的理論對潛在變量與觀察變量間關系做出合理的假設,并對這種假設進行統計檢驗的現代統計方法,側重于驗證已有假設的真偽性。驗證性分析是在對研究問題有所了解的基礎上進行的,這種了解可建立在理論研究、實驗研究或兩者結合的基礎上,比如從調研的結果來看,本月的客戶滿意度比上個月高出2%,是否真是如此;男性客戶的滿意度是否高于女性客戶等等。
(三)數據分析的一般過程
通常來講完整的數據分析過程可分為以下幾步:明確數據分析的目的、采集并處理數據、分析及展現數據、撰寫分析報告。
現實情況中人們往往在做數據分析時陷入一大堆雜亂無章的數據中而忘記了分析數據的目的,數據分析第一步就是要明確數據分析的目的,然后根據目的選擇需要分析的數據,明確數據分析的產出物,做到有的放矢、一擊即中!
其次,在做數據分析時要根據特定需求采集數據,有目的地采集數據是確保數據分析過程有效的基礎,采集后的數據(包括數值的和非數值的)要對其進行整理、分析、計算、編輯等一系列的加工和處理,即數據處理,數據處理的目的是從大量的、可能是難以理解的數據中抽取并推導出對于某些特定人群來說是有價值、有意義的數據。
接著是對處理完畢的數據進行分析和展現,分析數據是將收集的數據通過加工、整理和分析、使其轉化為信息,數據展現的方式有兩類:列表方式、圖形方式。
最后,整個數據分析過程要以分析報告”的形式呈現出來,分析報告應充分展現數據分析的起因、過程、結果及相關建議,需要有分析框架、明確的結論以及解決方案。數據分析報告一定要有明確的結論,沒有明確結論的分析稱不上分析,同時也失去了報告的意義,因為整個數據分析過程就是為尋找或者求證一個結論才進行的。最后,分析報告要有建議或解決方案,以供管理者在決策時作參考。
(四)客戶中心常用的數據分析工具及簡介
1.Excel
Excel是微軟辦公套裝軟件的一個重要組成部分,它可以進行各種數據的處理、統計分析和輔助決策操作,廣泛地應用于管理、統計財經、金融等眾多領域。Excel提供了強大的數據分析處理功能,利用它們可以實現對數據的排序、分類匯總、篩選及數據透視等操作。
2.SPC
SPC(Statistical Process Control)即統計過程控制,是一種借助數理統計方法的過程控制工具。實施SPC的過程一般分為兩大步驟:首先用SPC工具對過程進行分析,如繪制分析用控制圖等;根據分析結果采取必要措施:可能需要消除過程中的系統性因素,也可能需要管理層的介入來減小過程的隨機波動以滿足過程能力的需求。第二步則是用控制圖對過程進行監控。
3.SAS
SAS是用于決策支持的大型集成信息系統,但該軟件系統最早的功能限于統計分析,時至今日,統計分析功能仍是它的重要組成部分和核心功能。在數據處理和統計分析領域,SAS系統被譽為國際上的標準軟件系統,SAS提供多個統計過程,用戶可以通過對數據集的一連串加工實現更為復雜的統計分析,此外 SAS還提供了各類概率分析函數、分位數函數、樣本統計函數和隨機數生成函數,使用戶能方便地實現特殊統計要求。
4.JMP
JMP是SAS(全球最大的統計學軟件公司)推出的一種交互式可視化統計發現軟件系列,包括JMP,JMP Pro,JMP Clinical,JMP Genomics,SAS Simulation Studio for JMP等強大的產品線,主要用于實現統計分析。其算法源于SAS,特別強調以統計方法的實際應用為導向,交互性、可視化能力強,使用方便。JMP的應用非常廣泛,業務領域包括探索性數據分析、六西格瑪及持續改善(可視化六西格瑪、質量管理、流程優化)、試驗設計、統計分析與建模、交互式數據挖掘、分析程序開發等。
5.SPSS
SPSS(Statistical Product and Service Solutions),統計產品與服務解決方案”軟件,是世界上最早的統計分析軟件,基本功能包括數據管理、統計分析、圖表分析、輸出管理等等。SPSS統計分析過程包括描述性統計、均值比較、一般線性模型、相關分析、回歸分析、對數線性模型、聚類分析、數據簡化、生存分析、時間序列分析、多重響應等幾大類,每類中又分好幾個統計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權估計、兩階段最小二乘法、非線性回歸等多個統計過程,而且每個過程中又允許用戶選擇不同的方法及參數,SPSS也有專門的繪圖系統,可以根據數據繪制各種圖形。
6.Minitab
Minitab軟件是為質量改善、教育和研究應用領域提供統計軟件和服務的先導,是全球領先的質量管理和六西格瑪實施軟件工具,具有無可比擬的強大功能和簡易的可視化操作,對一般的數據分析和圖形處理都可以應付自如。
7.MATLAB
MATLAB是矩陣實驗室(Matrix Laboratory)的簡稱,用于算法開發、數據可視化、數據分析以及數值計算的高級技術計算語言和交互式環境,它將數值分析、矩陣計算、科學數據可視化以及非線性動態系統的建模和仿真等諸多強大功能集成在一個易于使用的視窗環境中,為科學研究、工程設計以及必須進行有效數值計算的眾多科學領域提供了一種全面的解決方案。主要特點:高效的數值計算及符號計算功能、具有完備的圖形處理功能、友好的用戶界面、功能豐富的應用工具箱。
來源:客戶世界