跳至主要內容

確保預報系統全天候正常運作

確保預報系統全天候正常運作

張永佳
2018年8月

炎炎夏日,天際以外,風雨欲自遠方來,香港卻烈日當空,幾朵白雲懶閒飄遊,藍藍的天空沒帶一絲暴雨將至的跡象。此時,香港天文台天氣預測總部的天氣預報員若沒法看到地面及高空天氣觀測、自動氣象站、氣象衛星、天氣雷達和電腦預報模式等天氣數據及產品,要單憑肉眼觀天,也實在難以判斷及預測未來數小時會否有風雨抵港。可想而知,這些天氣數據和產品對天氣預測總部的運作相當重要。事實上,要確保背後負責處理數據及製作產品的電腦系統能二十四小時暢順運作,亦是天文台同事的重要工作之一。然而,再利的刀都總有生鏽天,若天文台龐大的數據處理系統中任一電腦出現故障,豈不是要天氣預測總部局部「失明」?
天文台除了有二十四小時運作的天氣預測總部外,其實另一個與預報員緊密連繫的資訊科技管理部的同事,亦要二十四小時全天候監察天文台各關鍵電腦系統及資訊科技基礎設施的運作。每當系統未能正常運作時,資訊科技主任會根據既定程序,立即處理各種故障情況。於非辦公時間但情況緊急時,已下班的相關同事也會提供協助,確保支援天氣預測總部的電腦系統能繼續正常運作。可是磨刀也尚需時間,如需要搶修時,期間預報員會否「瞎子摸天」?
圖一
圖一: 資訊科技管理部同事正在密切監察預報系統的運作情況
工程學中有一重要概念稱為「冗餘」(Redundancy)。聽來貶義,但實際上卻對保障關鍵電腦設備正常運作起了重要作用。冗餘其實是指系統中的重要元件均有複本,亦即是說,各重要元件最低限度也有另一套備用元件,能在業務運作中的元件損壞時立即頂替,繼續支持整套系統正常工作。人的眼、肺和腎等成對器官其實也有類似概念,當一對器官中任一損壞時,也總有另一器官可以支持身體繼續運作。不過,人體的成對器官雖然總是同時運作,具備冗餘的電腦系統卻不一定是兩套系統同時並行。一般而言,冗餘系統中只會有一套在業務運作,另一套後備元件則在業務運作元件出現問題時,才會以自動模式或經人手調節來即時頂替運作。
為了確保天氣預測總部在「打風」落雨等關鍵時刻能暢順運作,及時提供天氣預測及警告服務予廣大市民,天文台都以冗餘概念來設計所有關鍵電腦設備,換言之,各關鍵設備均設備用元件,即使意外到來時,受影響的設備也能立即改為使用備用元件,以保證所有系統能正常運作。此外,當資訊科技管理部得悉系統出現問題時,會視乎問題的嚴重性,來判斷系統是否需要改以備用模式運作。若設備真的改以備用模式運作,資訊科技管理部亦會盡快搶修原來出現問題的設備,使該設備盡快恢復運作。如此,預報員就不必擔心被迫「瞎子摸天」了。