跳至主要內容

气象数据库的特质

气象数据库的特质

郑子路
2017年8月

香港地理面积虽小,却拥有一个非常稠密的天气观测网络(图一)。在香港约1,100平方公里的陆地上[1],就有超过三百个自动气象站和雨量站,大部分由香港天文台所建立。由于自动气象站一般都会同时测量多种不同的气象数据,所以每分钟约有2,500多组自动观测数据由本港各区透过通讯网路传到天文台。这些原始数据经过整理后会存入天文台其中一个专责处理本地及邻近地区观测数据的数据库中,成为预报及观测报告的重要数据来源之一。
图一
图一     一个非常稠密的天气观测网络复盖全港。
或许你会问,每分钟3,000组也不到的数据量,何需用上复杂的数据库呢?其实在演算及品质管理这些数据的过程中,需要多次从数据库提取及修改,而产生多达20,000组的衍生数据及成品数据,亦需存入数据库中。因此,数据的处理量在短时间内以倍数增加,而数据更被数十个应用程式不断地提取以制作不同的气象报告及预报产品。还有,该数据库亦需同时处理邻近地区数量庞大的天气数据,所以天文台确实有需要利用数据库出色的效能来处理气象数据。
为方便气象人员理解及分析天气状况,技术支援人员会尽量提供同一观测时间的气象数据给他们参考。因此在一般情况下,各气象站都会同时测量气象元素,并把数据实时传送到天文台,导致气象数据库每每需要在数十秒内同时处理大量原始数据、衍生数据和成品数据。当高峰期过后,数据库的工作量会显著回落,直至下一次数据收集周期。换句话说,气象数据库处理的工作量在同一周期内的不同时段都有显著的分别(图二)。气象数据库需要处理这种具爆发性的数据潮,跟一般商业数据库的日常运作颇不相同,因此,气象数据库相对于一般商业用数据库需要有较优良的运作性能才能避免数据丢失和延迟。
图二
图二     气象数据库的工作量随时间变化示意图。图中显示周期性工作量显著变化的特质。
其实这种气象数据库工作量起伏的特点在金融业的数据处理上也很常见,但天气系统跟金融市场最大的分别大概是天气系统没有停下来的一刻,而金融市场却有「休市」的时候。尽管全球不同时区的金融市场已高度连结起来,但关系还远不及处理全球天气数据的系统那样紧密。在气象的世界裹,气象数据「7x24」的在流转,实难找到「休市」的时间可供气象数据库作出定期维修。因此,气象数据库对于硬体及软体的可用程度以至灾难恢复的准备都有严格要求。科技日新月异,数据库技术亦推陈出新,天文台会继续致力采用先进及最合适的技术为市民提供服务。
参考资料:
[1] 香港统计数字一览