據iThome報導:「太平洋時間(PDT)的上周五( 2010/10/29 )早上8點,eBay旗下的金流服務PayPal某個資料中心的一台網路硬體出現故障,導致服務中斷,且全球用戶都受到影響。當時PayPal立刻找問題,但沒法依照計畫立即回復系統運作,於8點45分時回復部份服務,並到9點20分才完全恢復正常。不過,當天早上11點半PayPal再度出現服務中斷,隨後也在一小時內讓系統回復。
PayPal在全球190個市場擁有逾9000萬名使用者,而且對母公司eBay的營收貢獻度愈來愈高,其收入所佔eBay營收比重已自2009年第三季的31%成長到今年第三季的37%。」
PayPal這次的大當機,導致客戶無法使用其服務達2小時20分鐘之久。根據一般對銀行業務系統的要求,其可利用性(Availability)應該達到99.999%,也就是每年可允許的停機時間(或ICT服務暫停的時間)為5分鐘15秒。因此,PayPal這次的表現,可說是嚴重的不及格。
從這次的事件可以得知,PayPal在「可利用性管理」和「ICT服務連續性管理」上有嚴重的問題,尤其是在「回復的設計」方面有嚴重的缺失。
(採自《資訊和通訊科技基礎建設管理系統(ICTIMS) 第二版》一書)可利用性的設計確保能夠達成所需要的ICT服務的可利用性水準。可利用性管理需要確保可利用性的設計活動從兩個相關但不同的方面來考慮這個任務:
Ÿ 可利用性的設計:這個涉及為了滿足對ICT服務的可利用性需求而所需要的ICT基礎建設的技術設計以及內部和外部供應商的緊密合作。可利用性的設計可以看作是目標在於避免喪失ICT服務可利用性的事先主動的方面。
Ÿ 回復的設計:這個涉及萬一ICT服務失敗的話,為了確保服務能夠恢復以使正常的業務運轉能夠盡快地重新開始而所需要的設計要點。回復的設計可以看作是目標在於最小化ICT服務失敗對業務和使用者衝擊的事後反應的方面。
PayPal的最高管理階層必須找出事件發生的根本原因,重新檢視其ICT基礎建設的可利用性的設計,特別是回復的設計方面,才能避免這樣的事件再度發生。
《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》》》》
l 如果你是高階經理人,你如何讓企業和ICT(資訊和通訊科技)的策略和目標結盟,以提升企業的競爭優勢?你應該作成哪些與ICT相關的決策,而不會讓ICT花費大筆的預算,卻達不到你想要的結果?
l 如果你是資訊長,你如何擬定ICT的策略和目標,與事業單位溝通,建立ICT組織,扮演好ICT的角色,以提升企業的競爭優勢,而不會被批評為只是花錢的單位,毫無貢獻?
l 如果你是資訊部門經理,你如何根據企業的ICT策略和目標,建立相關的流程和組織,例如:服務要求管理流程、意外事件管理流程、異動管理流程、資訊安全管理流程等等,並且據以實行,以達成ICT目標?
l 如果你是系統、網路、應用軟體管理、設計、開發、操作人員,你如何將自己從技術人員提升到管理人員,對企業整體的ICT基礎建設及其管理有一個全面的了解,從而提升自己在公司的地位?
l 如果你從事於資訊服務業,你如何管理本身和顧客的ICT基礎建設、如何擬定合理的價格、如何與顧客談判服務水準並且擬定服務水準協定(SLA)?
龍山顧問所出版的《資訊和通訊科技基礎建設管理系統(Information and Communications Technology Infrastructure Management System, ICTIMS)》書籍和相關服務,能夠提供上述問題的解答、滿足你的需求,詳情請參考龍山顧問公司網站http://www.longshine.tw/。
沒有留言:
張貼留言