“實在不好意思,不能和你們聚會了。公司的一個系統癱瘓了,現在還找不到原因,整個IT部門都在進行‘尸檢”一一排查,我馬上要趕回公司。你們也知道,干我們這行的,這種事情多,沒辦法。”周未聚會上,剛在某傳統行業世界500強公司當上IT主管的劉建軍對朋友們抱歉地說。
當劉建軍趕到公司現場時,上到公司老總,下到銷售代表,都已經急得跳腳,貨發不出去,款收不回來。劉建軍除了安慰老總馬上盡快搞定外,面對突發復雜的情況帶來的壓力,也有點慌亂,但他只能一邊親自逐步排查,一邊拿起了搶修電話叫技術專家過來共策共力。
最終,問題在凌晨2點時,得到了排除,原因出在系統軟硬件兼容性上,造成了系統崩潰,服務器宕機,從下午5點到凌晨2點,短短9個小時的時間,這次故障給公司帶來了直接二百多萬的訂單損失,還不算間接影響。
問題解決后,凌晨3點公司主管IT系統的老總當即現場召集IT主管開會,對IT整個部門做出一系列嚴厲的行政處罰,并提出要求,類似的情況,要平時把好關,將故障率降到最低,整個公司的信息化管理銷售全依賴這套系統,老總清楚IT信息化帶來便利的同時,完全杜絕出現故障是不可能的,問題的關鍵在于故障前的細心維護,快速反應,快速解決,他責成劉建軍在最短時間拿出一個根本性的解決方案出來。
會議結束后,劉建軍壓力很大,的確,在現有的IT運維服務模式下,他不得不總去拯救瀕臨死亡的IT系統,得充當救火隊長到處滅火。企業賴以運轉的IT系統一旦出現故障,不僅不能提高效率,而且還影響正常業務的開展。而作為肩負保證IT系統正常運行責任的IT部門,面對的是由各種網絡、主機、系統軟件、中間件、數據庫、應用軟件等等組成紛繁復雜的系統。處于救火狀態的IT主管,剛處理完財務系統的故障,辦公系統又罷工了。眾多的軟硬件耦合在一起,系統的復雜性和維護量呈指數級上升。要實現系統可持續運營,太難了!
時間回溯到事故發生前,另一家世界500強公司的IT主管王彬卻顯得輕松自在,下午他陪女朋友游完一個小時泳,然后到了晚餐時間參加部門同事組織BBQ燒烤大會,其間他手機收到一條公司IT系統故障告警短信,當他正準備結束聚會趕往公司搶修時,短信提示故障專家已經遠程處理,系統恢復正常。經過王彬電話向公司值班同事確認,部門BBQ燒烤大會照常舉行,大家一起度過了一個輕松愉快的周未,相比劉建軍充當救火隊長的水深火熱,是什么樣的系統讓王彬如此游刃有余?
話題要從王彬不久前參加過的《網管員世界》雜志社舉辦的“2009中國網絡主管論壇”說起,在眾多國內外廠商演講中,會議上王彬他注意到神州數碼提出的一個全新理念,面對現有的復雜IT網絡與系統環境,傳統的被動式IT維護已經顯得捉襟見肘,而目前,以ITIL理念為指導,以IT運維專家為載體的“主動式IT運維服務”正應運而生。
在被動式IT運維模式下,由于沒有預警服務,故障隱患不斷集聚,異常情況出現后,直接負責人不能即時發現,IT部門不得不成為處理大量突發事件的“救火員”,無法提高工作效率。
而對于神州數碼易邦服務(www.ebond.com.cn)提出的主動式運維模式來講,它是一套由獨立軟硬件相結合的運維服務平臺,以監控、告警、日志、報告服務工具為依托,實時監控系統的運行狀態,并與呼叫中心結合一體,針對維護服務范圍中的IT系統,進行實時的監控,出現問題的同時可以進行實時告警,做到故障的主動式實時發現,并自動、及時提供故障診斷服務,若出現一些小的問題,在IT主管收到告警短信的同時,神州數碼易邦服務運維專家就已經將故障隱患消滅于萌芽之中。
而當這套系統遇到一些特別復雜的情況遠程無法處理時,神州數碼易邦服務IT運維專家會根據客戶承諾的時間及時趕到現場,進行快速的反應和處理,并提供備機和備件、大大的減少了客戶故障恢復時間,為客戶爭分奪秒,減少損失。
最終王彬經過詳細咨詢易邦主動式IT運維服務的相關技術指標及內容,并根據公司自身需求征集各方IT專家論證后,該司正式啟用神州數碼主動式IT運維服務——易邦服務 ,我們發現,當企業應用了主動式的IT運維服務后,IT主管就可以經常給系統做‘體檢’,從而實現長期的系統可持續運營,而不是在系統癱瘓后坐‘尸檢’。
有了健康的IT系統,王彬不僅可以按時參加朋友聚會,而且不用擔心因系統突發故障而臨時被召回去救火。與此同時,公司信息化流程的穩定運行,業務運轉越來越順暢,大大提高了公司內部溝通的效率,公司的產品及服務在市場上的競爭力將越來越強,使公司在激烈的市場競爭中立于不敗之地。