對于一項數值型的KPI指標來說,在進行深入的對比、關聯、趨勢、預測、模式、特征等深入分析之前,先看一下數據的大致分布情況、有無異常、集中與離散趨勢如何,以決定是不是需要對數據做進一步的清理與修補等工作是不可獲取的。這部分工作在統計學中叫做描述統計。描述統計一般看兩個趨勢:集中與離散。表達集中趨勢的值主要是均值、中值和眾數,表達離散趨勢的值主要是方差和標準差,當然還有數據的四分位、最大、最小、極差、峰度和偏度等相關指標。數據分布趨勢的可視化主要通過直方圖和箱線圖來展示。下面就以員工的月度接聽量數據展示一下這個過程:
那么這組數據呈現什么樣的分布特征呢?是否符合我們的預期呢?有沒有異常數據需要進一步處理呢?我們先來看一下Excel給出的描述統計結果:
再來看一下R的數據摘要:
由以上數據可以看出,整個中心所有員工的月度接聽量均值約為2500通,中位數和眾數也都非常接近,分別為2498和2489,偏度趨近于0,應該說分布還是比較對稱和均勻的,并沒有出現異常或偏態分布。標準差約為30通,最多和最少之間的月度差距為209通,整體表現的離散趨勢還是比較明顯的。從業務的角度看,員工之間的這個接聽量差距還是稍微有些大,從數據的角度看還是有幾個離群值的。
下面我們再用直方圖和箱線圖更直觀地看一下,數據的特征會更明顯:
那么問題來了,面對這么一組還算不錯的數據,下一步努力方向是什么?基本思路是:集中趨勢,代表整體水平,因此要繼續合理提升或穩固;離散趨勢代表員工表現分布差異,也直接影響著產能和客戶體驗,因此要繼續降低異常干擾,優化流程,合理縮小差異。