據〔自由時報2013-4-26
〕報導:「高鐵昨天首度非天災停擺,最後只能以「重開機」方式恢復營運,並未徹底解決問題,專家直言,主系統與備援系統同時失靈時如何應變及提前避險機制等環節,高鐵都應重新建立SOP。」…See More。
高鐵停擺的相關報導很多,也有學者、專家、高鐵員工、政府官員提出很多意見。在這裡,我僅淺談可能被忽略而需要注意的地方。
根據報導:「高鐵維修人員廿三日就發現主系統ET2故障,當時先啟動備援系統因應,並排定昨天更換,沒想到已執行過五次的小動作,竟惹出三萬五千人無車可搭的大麻煩。」
這不禁令人懷疑高鐵是否採取「用到壞才更換的維修策略」?反正有備援系統,何必進行預防保養,總不會那麼倒楣,兩套系統一起壞吧!?為了幫公司省錢,就採取「用到壞才更換的維修策略」吧!
希望這只是我的疑慮,高鐵並沒有採取「用到壞才更換的維修策略」,如果有的話,請高鐵立即修正其維修策略。
對於普通的設備,採取「用到壞才更換的維修策略」或許合理,但對於與安全有關的設備則萬萬不可,否則,將來有一天會出大災難的。
另一報導:「維修人員4個多小時找不出原因,後來只花幾分鐘重開機就恢復正常。」
技術人員總想找出造成問題的根本原因,以求一勞永逸的解決(永久性解決方案)。而面對顧客的服務人員則想趕快把意外事件排除(暫時性解決方案,在此案例中,也就是重開機),以免被顧客罵死、煩死。
在重大意外事件發生時,到底要馬上尋求永久性解決方案或需要先有暫時性解決方案,需要經驗及/或完善的SOP,而高鐵的管理人員在這兩方面剛好都沒有。以致於,在技術人員陷入尋找問題根本原因的泥淖而無法自拔時,管理人員只能在旁邊乾瞪眼,無法做出適當的決策。
等到管理人員發現就算到天荒地老、海枯石爛,也找不出問題的根本原因,而決定放棄尋求永久性解決方案,轉而要求技術人員找出暫時性解決方案時,已過了4個多小時。
在《資訊和通訊科技基礎建設管理系統(ICTIMS)》中,這是屬於「問題管理流程」與「意外事件管理流程」之間的衝突。意外事件管理流程想要盡快恢復服務,而問題管理流程則需要時間找出根本原因。
當發生重大意外事件,現場人員向上提報給管理人員時,管理人員如果缺乏經驗及/或完善的SOP,有時候就會陷入馬上尋求永久性解決方案或需要先有暫時性解決方案的兩難困境,甚至做出錯誤的決策。這也是此案例所顯現出來的情況。
《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》》》》
l
如果你是高階經理人,你如何讓企業和ICT(資訊和通訊科技)的策略和目標結盟,以提升企業的競爭優勢?你應該作成哪些與ICT相關的決策,而不會讓ICT花費大筆的預算,卻達不到你想要的結果?
l
如果你是資訊長,你如何擬定ICT的策略和目標,與事業單位溝通,建立ICT組織,扮演好ICT的角色,以提升企業的競爭優勢,而不會被批評為只是花錢的單位,毫無貢獻?
l
如果你是資訊部門經理,你如何根據企業的ICT策略和目標,建立相關的流程和組織,例如:服務要求管理流程、意外事件管理流程、異動管理流程、資訊安全管理流程等等,並且據以實行,以達成ICT目標?
l
如果你是系統、網路、應用軟體管理、設計、開發、操作人員,你如何將自己從技術人員提升到管理人員,對企業整體的ICT基礎建設及其管理有一個全面的了解,從而提升自己在公司的地位?
l
如果你從事於資訊服務業,你如何管理本身和顧客的ICT基礎建設、如何擬定合理的價格、如何與顧客談判服務水準並且擬定服務水準協定(SLA)?
龍山顧問所出版的《資訊和通訊科技基礎建設管理系統(Information and Communications Technology Infrastructure Management
System, ICTIMS)》書籍和相關服務,能夠提供上述問題的解答、滿足你的需求,詳情請參考龍山顧問公司網站http://www.longshine.tw/。