與可利用性關係密切的另一個ICT基礎建設特性是可維護性。可維護性是關於ICT基礎建設元件(ICT服務)被維持在,或者被恢復到,操作(服務)狀態的能力,通常是以「平均修復時間(MTTR, Mean Time To Repair)」來加以衡量。
我們利用下列的可利用性公式來說明可利用性、可靠性和可維護性之間的關係:
可利用性=
|
MTBF
|
×100%
|
MTBF + MTTR
|
這個公式看起來與在《可利用性、可靠性》一文中所提到的可利用性公式不同,其實其意義是一樣的,都是表示:
可利用性=
|
正常運行的時間
|
×100%
|
全部的時間 = 正常運行的時間 + 停機時間
|
根據上述的公式,我們可以定性地描述可利用性、可靠性和可維護性的關係如下(可靠性或可維護性的變動對可利用性的影響):
可靠性(例如:MTBF)
|
可維護性(例如:MTTR)
|
對可利用性的影響
|
增加
|
沒有改變
|
增加
|
減少
|
沒有改變
|
減少
|
沒有改變
|
增加
|
減少
|
沒有改變
|
減少
|
增加
|
●
可維護性對ICT部門(或ICT服務業者)及其顧客和使用者有重大的影響。以幾天前( 2006/12/26 )在屏東恆春外海所發生的芮氏規模6.7級的大地震為例,這次大地震導致台灣周圍八條國際海纜斷線(這類纜線目前共有十五條),跨國聯繫與金融交易因而無法順利進行,甚至停擺。中華電信不僅蒙受重大的損失,並且還因為無法迅速恢復正常的ICT服務〔也就是說,可維護性(MTTR)太差〕而使顧客/使用者遭受損失,進而遭到媒體的批評其沒有備援方案。
中華電信為了維護其商譽,因而發表如下聲明:
1. 因地震發生導致海纜通訊中斷,預估影響本公司營收約1億元。
2. 海纜斷線修復及向同業調度電路之費用大約5千萬元,修復所費時間大約需2~3星期。
3. 因地震強度過大,導致備援電路亦受影響,非如報載「沒有備援方案」。
如果中華電信因為海纜通訊中斷而使其營收損失一億元的話,那麼筆者大膽估計,其顧客的營收損失應該以百億計(一元的通訊費至少產生一百元以上的營收,應該不是離譜的估計)。當然,通訊中斷對不同的產業有不同的影響。對某些採計畫式生產的產業而言,例如鋼鐵、石化,通訊的中斷不會立即產生影響(雖然長期一定會有影響)。但是對股匯市和期貨市場、網路公司(例如亞馬遜書店、eBay)以及利用B2B、B 2C 網站採訂單式生產的公司而言,就會產生立即的影響,而使其遭受到營收上的損失。
雖然中華電信因此意外事件而遭到批評沒有備援方案,但是筆者認為以中華電信歷史之悠久、規模之大以及人才之多,應該不致於沒有備援方案,只是其備援方案沒有辦法應付像此次恆春大地震這種規模的災難事件。
筆者猜想,中華電信應該是採取纜線之間互相備援的方案,也就是當一條纜線斷掉時,其他的纜線可以分攤負擔該纜線的頻寬負載。由於纜線的頻寬通常不會被百分之百地使用,因此這個方案不僅可解燃眉之急,也不會增加成本(但是可能會降低某些服務水準,例如會延長通訊的回應時間)。
其實,在通訊電路方面,大部分的公司也都是採取這種備援方案。如果有兩條並聯的通訊電路,每條通訊電路中斷的可能性是百分之一,那麼兩條通訊電路同時中斷的機率是萬分之一。基於成本的考量,這種風險對大部分的公司而言是可接受的(雖然會犧牲某些服務水準),而如果MTTR的時間很短的話,那就更好了。
只是,這種備援方案通常比較適用於只會影響某條通訊電路的局部性的意外事件,而不適用於會影響所有通訊電路的大規模的災難事件。以海纜互相備援的方案而言,所適用的狀況可能是某條海纜例如由於漁船作業的疏忽而被拉斷的情況,而不適用於像此次恆春大地震將一大部分的海纜震斷的情況。
因此,要應付這種災難事件可能需要思考其他的備援方案,例如利用衛星通訊作為備援方案或建造耐震性更強的海纜。只是基於風險和成本,這樣的方案是否可行,可能需要加以考量。
關於在災難事件下如何能夠持續提供ICT服務,例如緊急應變計畫和備援計畫的建立和實行,請參考《資訊和通訊科技基礎建設管理系統》一書之《第十六章 ICT服務連續性管理》。
●
與可利用性、可靠性相同,在ICT基礎建設中,我們通常會從使用者使用ICT服務的觀點來看可維護性:使用者並不在乎他所使用的ICT服務(例如ATM、POS、線上遊戲、購物網站、VoIP)要經過哪些通訊線路和伺服器以及這些元件的個別的可維護性,使用者所關心的只是他所使用的某個ICT服務,萬一中斷的話,到底要多久才能恢復。
使用者所感受到的可維護性與發生故障的ICT元件或發生中斷的ICT服務及其發生的時機有關。例如某個ERP系統在週末沒有人使用的時候發生故障,而且一直到週一的凌晨才修復,雖然其實際的可維護性很差,但是使用者根本感受不到,因此很可能不會受到責難。但是如果這個ERP系統是在星期一的早上七點鐘發生故障的話,那問題可就大了〔假設工廠的生管依照程序,必須在早上七點鐘的時候利用這個ERP系統產生工單〕。
在筆者的經驗中,使用者對其所使用的個人電腦在發生故障時是否能夠迅速修復的感受最強烈、反應也最激烈,甚至於超過對公司的影響層面更大的伺服器當機或網路斷線。由於我們(ICT人員)本身也是個人電腦的使用者,因此應該相當容易理解這件事:雖然伺服器當機或網路斷線對公司的影響很大,但是使用者還是可以利用個人電腦來做其他的事,但是在ICT成為基礎建設的今天,如果沒有了個人電腦,使用者幾乎不能做任何事。這就是為什麼有些公司會以極低的修復時間來作為其銷售個人電腦的訴求,甚至於保証當顧客/使用者的個人電腦故障時,他們將提供代用的個人電腦以使顧客/使用者能夠繼續進行其工作。
●
由於可利用性(Availability)、可靠性(Reliability)和可維護性(Maintainability)這三者是在設計和運轉元件、系統、服務或基礎建設時的重要參數,並且其關係密切,因此有些人會給它們一個簡稱。美國國防部將它們簡稱為RAM,也有人稱之為ARM或RMA,在這些之中,筆者傾向於稱之為ARM。這是因為arm有手臂、力量之意,因此,當我們用在ICT基礎建設上時,我們可以說:「我們的ICT基礎建設的ARM是否夠力,能夠幫助企業及其業務流程一臂之力,以達成其目標?」
〔就在筆者寫這篇文章的時候,網路上又傳來兩篇報導( 2007/1/2 ),分別是:1.台灣彩券公司新樂透開賣,連線、系統不穩定,電腦大當機;2.台灣高鐵第一天預售,系統、連線異常,購票大排長龍。這表示這兩家公司的ICT基礎建設準備不夠充分,其ARM不夠有力,才會造成這種情況。〕
前面所提到的與ARM相關的觀念和公式,當我們在設計和運轉ICT服務及其基礎建設時,應該加以運用。如果可能的話,ARM及其服務水準應該在服務水準協定(SLA)中加以定義和決定。基本上,在SLA中ARM的決定有兩個來源:
1. ICT部門(或ICT服務業者)根據其ICT基礎建設的實際能力,計算出其所能夠提供的ICT服務的ARM服務水準,由顧客/使用者決定是否接受這樣的服務水準。
2. 顧客/使用者提出其所需要的ICT服務的ARM服務水準,由ICT部門(或ICT服務業者)決定是否能夠以及是否要提供這樣的服務水準(通常會根據其ICT基礎建設的實際能力)。
由ICT部門(或ICT服務業者)所提出的ARM服務水準通常會比較合理,因其係根據其ICT基礎建設的實際能力而得出〔但是,這並不總是為真,有些ICT部門(或ICT服務業者)根本就搞不清楚其ICT基礎建設所具有的ARM能力〕。如果是由顧客/使用者提出,那麼可能就會很離譜,例如:「我所使用的這個ICT服務,需要100%的可利用性、完全不能有中斷的情況發生。」比較不那麼離譜但也是令人覺得怪怪的,例如:「我所使用的這個ICT服務,需要99%的可利用性、一年最多可以中斷3次、每次中斷需要在30分鐘內恢復服務。」
之所以會造成這種情況,可能是顧客/使用者並不了解ARM服務水準所代表的意義以及高服務水準通常也代表高費用。因此,在決定某個ICT服務的ARM服務水準時,ICT部門(或ICT服務業者)也許需要與顧客/使用者進行商議和談判,以找出雙方都能夠接受的ARM服務水準,也就是ICT部門(或ICT服務業者)有能力提供而且顧客/使用者有能力支付的ARM服務水準。
●
對ARM服務水準的要求,不僅存在於顧客/使用者對ICT部門(或ICT服務業者),也存在於ICT部門(或ICT服務業者)對其供應商。我們用「有用性(Serviceability)」來描述ICT部門(或ICT服務業者)與其供應商(例如:委外服務業者、設施管理業者)之間,對在這個供應商看管之下的ICT服務或元件的可利用性、可靠性和可維護性所作成的合約協議。
我們可以用一句話來描述這件事:「我們〔指ICT部門(或ICT服務業者)〕的供應商是否有用(也就是其所提供的服務的ARM),能不能夠幫助我們達成對顧客/使用者的承諾?」
為了滿足ICT部門(或ICT服務業者)對有用性的需求,需要對供應商進行適當的管理。ICT部門通常會根據公司的供應商管理程序來管理其供應商,而ICT服務業者(例如中華電信)則應該建立其本身的供應商管理程序。關於供應商管理,請參考《資訊和通訊科技基礎建設管理系統》一書之《第6.6節 採購和供應商管理》。
《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》》》》
資訊和通訊科技基礎建設的浮現,對企業界人士產生各種不同的衝擊,例如:
l 如果你是高階經理人,你如何讓企業和ICT(資訊和通訊科技)的策略和目標結盟,以提升企業的競爭優勢?你應該作成哪些與ICT相關的決策,而不會讓ICT花費大筆的預算,卻達不到你想要的結果?
l 如果你是資訊長,你如何擬定ICT的策略和目標,與事業單位溝通,建立ICT組織,扮演好ICT的角色,以提升企業的競爭優勢,而不會被批評為只是花錢的單位,毫無貢獻?
l 如果你是資訊部門經理,你如何根據企業的ICT策略和目標,建立相關的流程和組織,例如:服務中心、意外事件管理流程、異動管理流程、資訊安全管理流程等等,並且據以實行,以達成ICT目標?
l 如果你是系統、網路、應用軟體管理、設計、開發、操作人員,你如何將自己從技術人員提升到管理人員,對企業整體的ICT基礎建設及其管理有一個全面的了解,從而提升自己在公司的地位?
l 如果你從事於資訊服務業,你如何管理本身和顧客的ICT基礎建設、如何擬定合理的價格、如何與顧客談判服務水準並且擬定服務水準協定(SLA)?
龍山顧問所出版的《資訊和通訊科技基礎建設管理系統》一書能夠提供上述問題的解答、滿足你的需求,詳情請參考龍山顧問(http://www.longshine.tw/)所出版的《資訊和通訊科技基礎建設管理系統》一書的目錄。本書內容包含章節:
1. 資訊和通訊科技基礎建設的演進,
2. 資訊和通訊科技基礎建設與價值鏈,
3. 資訊和通訊科技基礎建設與電子商務,
4. 資訊和通訊科技基礎建設管理系統模式,
5. 企業和ICT的策略和目標,
6. ICT基礎建設和管理系統規劃和實行,
7. 服務中心(The Service Desk),
8. 意外事件管理(Incident Management),
9. 問題管理(Problem Management),
10. 建構管理(Configuration Management),
11. 異動管理(Change Management),
12. 上線管理(Release Management),
13. 服務水準管理(SLM, Service Level Management),
14. ICT服務的財務管理(Financial Management for ICT Services),
15. 容量管理(Capacity Management),
16. ICT服務連續性管理(ICTSCM, ICT Service Continuity Management),
17. 可利用性管理(Availability Management),
18. 應用軟體管理(Application Management),
19. ICT基礎設施管理(ICTIM, ICT Infrastructure Management),
20. 資訊安全管理(Security Management)。
沒有留言:
張貼留言