編者按:在印度著名的軟件服務出口商Mphasis的IT部門,風險主要集中在業務流程外包(BPO)操作上。為了緩和公司面臨的風險,該公司與其客戶實行連續性的計劃。另外,該公司的IT部門使用了一個多層標簽交換MPLS網絡來連接其國內的其他分支機構。在最后一公里接入方面,Mphasis采取了冗余保護,采用兩種不同的傳輸媒體互為備份,在其中一條出問題的時候,另一個條線路還可以讓業務保持正常。這些應對措施令其不僅能輕松應對來自人為的風險,即使發生了臺灣地震那樣的自然災害,Mphasis的CIO也能高枕無憂,他就是這樣給我們講述了兩個應對自然災害的故事。
兩項改進應對資源危機
【IT168 專稿】盡管應對措施非常完善,我們還是曾經面臨過一次非常嚴重的網絡資源耗盡危機,很多網站遭受著被中斷的危險。后來,我們發現我們的冗余設計在服務商接入點POP上存在問題,在其上聯處只有一個路由器。這意味著連接到這個特定MPLS服務商接入點POP的網站被影響了。
幸運的是,我們在班加羅爾有一個24x7x365工作的全球網絡運行中心,它可以全天24小時地監視我們網絡的運行情況。它發現了這個問題。而且由于我們及時采取措施,我們不用再去求助于我們的災難恢復計劃了,該計劃將在災難發生4小時后啟動。
根據這次事故的經驗,我們采取了兩個改進措施:首先,我們在服務商接口地方進行了冗余設計;另外我們還將最后一公里接入的其中一條線路轉移到第二個服務商接入點上。這種級別的設計很容易,同時也讓我們的網絡可以一直保持不出問題。
雙層ATM環的保障
我們的系統經常遭受到來自大自然的考驗。2004年發生的海嘯影響了其中一條線路,在另一條線路保持順暢通信的情況下,我們順利恢復了出故障的線路。另一次是最近臺灣的地震,這次地震對我們的網絡造成了一定威脅,但是我們把所有數據的路由從太平洋線路無縫地切換到了大西洋的線路上,因此這中間沒有一分鐘的斷線。
因此到現在為止,我們還沒有面臨任何真正的危機。
我們可以實現這些事情是因為我們的網絡是一個具有冗余線路的雙層ATM(異步傳輸模式)環。這意味著我們使用了不同的線纜系統,可以在發生意外情況的時候可以自動切換系統到沒有故障的線路中。
我從風險降低中所學到的最重要的東西是,IT危機需要從源頭上解決。CIO們不應該在簽訂了一個合約后,整日擔心其風險的發生,而應該在危機發生后,甚至危機發生前就從源頭上將其徹底解決掉。
點評:從印度軟件服務出口商Mphasis的IT危機解決經驗中,我們知道在面臨IT危機的時候,我們要透過危機的表面現象,查找到引起危機的真正根源,從根源上真正將危機解決。無論是技術性還是管理性問題,解決辦法莫不如此。