2 解放军 96631 部队, 北京 102208
3 中国科学院城市环境研究所城市环境科学卓越中心, 厦门 361021
4 中国科学院大学, 北京 100049
5 南京信息工程大学, 南京 210044
6 江苏省环境监测中心, 南京 210036
7 上海市气象局, 上海 200030
2 96631 Army, People's Liberation Army of China, Beijing 102208
3 Center for Excellence in Urban Atomsprheric Environment, Institute of Urban Environment, Chinese Academy of Sciences, Xiamen 361021
4 University of Chinese Academy of Sciences, Beijing 100049
5 Nanjing University of Information Science and Technology, Nanjing 210044
6 Jiangsu Environmental Monitoring Center, Nanjing 210036
7 Shanghai Meteorological Service, Shanghai 200030
随着快速的能源消耗、城市群发展和人口增长,近年来以高浓度臭氧为典型特征的光化学污染在长江三角洲(长三角)地区日益严重(Gao et al., 2011)。研究表明,高浓度臭氧严重影响人体健康、危害生态环境(Zhang et al., 2006)。向公众特别是敏感人群提供准确的臭氧污染的预报和预警服务很有必要(唐晓等,2013)。中国科学院大气物理研究所以其自主研发的嵌套网格空气质量预报系统(NAQPMS)模式为核心、综合集成国际上先进的CAMx、CMAQ和WRF-Chem等空气质量模式,建立了长三角地区区域空气质量多模式预报系统。该系统在江苏省环境监测中心已投入运行,能够提供长三角地区五天以内的逐小时精细化臭氧预报。
由于数值解法、排放清单、边界条件以及对大气中的物理化学过程的有限认知,臭氧的数值预报不可避免的存在误差和不确定性(Kang et al., 2010, 唐晓等,2013)。而对多模式系统而言,如何将多个数值模式结果综合集成一个准确、可靠、直观的预报结果是目前面临的重要问题。多模式集成方法是一种提高模式准确率的非常有效的后处理方法(杨学胜,2001)。Danard et al.(1968)和Thompson(1977)发现,通过将两个相互独立的预测结果进行特定的线性组合,其预测均方根误差可以小于单个预测的均方根误差。基于此,多模式集成平均(Ensemble Mean, EMN)、消除偏差的集成平均(Bias-removed Ensemble Mean, BREM)、回归改进集成平均(Regression-improved Ensemble Mean)、超级集成法(Superensemble Prediction, SUP)(Krishnamurti et al., 1999, 2000)等集成方法被相继提出,且广泛运用到气象上的中短期预报、延伸期预报及气候预测中(智协飞等, 2009, 2014, 2015, 2016;崔慧慧和智协飞,2013; 张涵斌等,2015)。以上研究皆认为,在众多集成方法中,超级集成法可以更有效的减小均方根误差,提高预报技巧。其思想是将时间序列分为训练期和预报期两段,通过在训练期建立模式距平与实况距平的回归方程来确定各个模式权重信息,并将这些权重信息运用于预报期内多模式集成预报。
近年来,多模式集成平均、回归改进集成平均等具有代表性的集成方法也被拓展运用到空气质量预报领域(王自发等,2009;黄思等,2015),但将超级集成法应用到环境空气质量要素的研究却鲜有案例;另外,以往超级集成法的研究多为针对某特定时间序列展开的预报试验(智协飞等,2009;刘建国等,2013),最佳训练期长度也多通过固定的培训期数据来确定,并未随时间变化;且未提出一套适用于业务预报的集成方法(崔慧慧和智协飞,2013;黄思等,2015; 智协飞等,2016)。
针对上述问题,本文尝试将多模式超级集成的方法进行改进,使其适用于实时业务化预报。基于长三角地区区域空气质量多模式预报系统2015年的预报结果,将改进后的超级集成法、超级集成法、多模式集成平均和消除偏差的集成平均等多模式集成方法运用到长三角地区O3的24 h预报中,比较四种多模式集成方案的预报效果;然后将最优的集成方案运用到48 h和72 h预报中,考察其短期(三天)预报水平。
2 资料和方法 2.1 长三角地区多模式空气质量预报系统长三角地区多模式空气质量预报系统中,区域空气质量模式包括中国科学院大气物理研究所自主开发的嵌套网格空气质量预报模式NAQPMS(王自发等,2006)、美国环保署(EPA)的CMAQ模式(Dennis et al., 1996)、美国Environ公司的空气质量综合模拟系统CAMx模式(ENVIRON International Corporation, 2002)及由美国NOAA预报系统实验室(FSL)开发的气象模式(WRF)和化学模式(CHEM)在线耦合的WRF-CHEM模式(Grell et al., 2005)。所有化学传输模式均采用三层嵌套,区域设置如图 1a所示:第一层(D1)为东亚地区(170×160格点),第二层(D2)覆盖中国东部地区(160×154格点),第三层(D3)涵盖江苏省全部、山东南部、安徽大部及浙江北部(199×181格点)。三层嵌套区域的水平空间分辨分别为27、9、3 km。各个模式垂直方向上从地面到20 km分为20层。系统所用气象模式为WRF模式(3.5.1版本)。WRF模式水平网格设置与化学传输模式一致,采用地形追随坐标,垂直方向分为30层,模式层顶为50 hPa。外层选择较大的区域可以保证长期模拟过程中内层区域具有较为合理的侧边界条件,并可以充分考虑大尺度天气系统对长三角地区的影响。
系统排放源输入是由清华大学基于中国多尺度排放清单模型MEIC(Multi-resolution Emission Inventory for China,http://meicmodel.org/ [2017-04-20])制作的实时更新的排放源清单。大气污染物排放源分类是在参考《区域高分辨率大气排放源清单建立的技术方法与应用》及国内已有较为成熟的排放源分类体系的基础上,结合目前我国统计年鉴活动数据分类特征、国民经济行业分类情况以及江苏省的实际情况,针对SO2、NOx、CO、PM10、PM2.5和NH3等九种污染物,将排放源主要分为农业源、生物源、工业源、电厂源、居民源、交通源及其他源共七类。排放源的空间分辨率和化学传输模式及气象模式匹配,时间分辨率为1小时。
2.2 站点选取及观测资料$ {{S}_\text{picked}}=\text{max}(D({{S}_\text{refer}}, {{S}_\text{candidate}})), $ | (1) |
长三角地区大部分空气质量监测站点的空间位置存在向城市集中叠加的现象,故按照测站之间的距离远近,挑选了有代表性的26个站点(图 1b)。具体算法是:任选一个站点作为基准站Srefer,然后按(1)式从余下站点中选取代表站点。从备选站点Scandidate中找出距离基准站Srefer最远的站点作为已选站点Spicked,然后将已选站点从备选站点中剔除,重复(1)式表述的挑选过程,直到已选站点个数满足研究需求。
选取的空气质量数据来自中国环境监测总站,包括臭氧(O3)和二氧化氮(NO2)。研究时段为2015年1~12月,其中,1月1日至3月5日为准备期,评估时段为3月6日至12月31日,按月分为冷暖两季,冷季为3~4月和10~12月,暖季为5~9月。模式数据为相应时段系统包含的NAQPMS、CMAQ、CAMx及WRFCHEM模式的24、48及72 h预报产品。观测及模式数据分辨率均为1 h。
O3因极易受气象及城市排放条件影响,短时及日变化显著(殷永泉等,2004);同时由于O3关注短期急性健康效应,我国于2012年将日最大8 h浓度作为O3日评估标准纳入到新的《环境空气质量标准》中(中华人民共和国环境保护部,2016)。故文中O3的评估考察日最大8 h浓度,具体算法参考了美国环保署公布的8 h O3数据处理指南,即先对小时分辨率资料进行8 h滑动平均,然后逐日对滑动平均结果求最大值得到(Park, 1998)。
2.3 集成方法(1)多模式集成平均(EMN)
将多个模式的结果通过求平均转化为一个预报结果,即多模式集成平均:
$ {{V}_\text{EMN}}(j, \text{ }t)=\frac{1}{N}\sum\nolimits_{i=1}^{N}{{{F}_{i}}(j, \text{ }t)}, $ | (2) |
其中,VEMN (j, t)为第j个测站t时刻的多模式集成平均的预报值,N为参加集成的模式总数,Fi (j, t)为第i个模式在第j个测站t时刻的预报值。
(2)消除偏差的集成平均(BREM)
模式通常存在系统偏差,通过引入观测平均态,并在其基础上叠加模式预报距平,可得到无偏的集成平均:
$ {{V}_\text{BREM}}\left(j, \text{ }t \right)=\overline{O}\left(j, \text{ }t-1 \right)+\frac{1}{N}\sum\nolimits_{i=1}^{N}{\left[ {{F}_{i}}\left(j, \text{ }t \right)-\overline{{{F}_{i}}}\left(j, \text{ }t \right) \right]}, $ | (3) |
其中,VBREM (j, t)为第j个测站t时刻的消除偏差的集成预报值,
(3)超级集成法(SUP)及滑动训练期的超级集成(R-SUP)
Krishnamurti et al.(1999)指出,系统偏差信息还可通过模式在训练期的表现提取得到,并在预报期予以消除。通过选定一段训练期,在训练期获取各个模式的权重系数,并在训练期内得到观测平均态和模式距平,综合考虑模式的不等权重和消除偏差即得到超级集成预报(SUP):
$ \begin{align} &{{V}_\text{SUP}}\left(j, \text{ }t \right)=\overline{O}\left(j, \text{ }t-1 \right)+ \\ &\sum\nolimits_{i=1}^{N}{{{a}_{i}}\left(j, \text{ }t \right)\left[ {{F}_{i}}\left(j, \text{ }t \right)-\overline{{{F}_{i}}}\left(j, \text{ }t \right) \right]}, \\ \end{align} $ | (4) |
其中,
$ G\text{=}{{\sum\nolimits_{t=1}^{{{N}_\text{tr}}}{({{{{V}'}}_{\text{SU}{{\text{P}}_{\text{t}}}}}-{{{{O}'}}_\text{t}})}}^{2}}, $ | (5) |
根据最小二乘法原理建立训练期回归方程使得训练期中误差G最小,以此确定最佳的训练期长度及参与超级集合的各模式权重系数
(4)改进的超级集成法(AR-SUP)
已有的超级集成法研究中,一般是将预报期固定后,逐渐增加训练期长度来获取相应的权重系数,通过考察不同权重系数下的集成预报结果优劣来选定最佳的训练期长度。这样得到的最佳训练期长度和固定预报期的选取有关,一旦预报期变化,在调试阶段获取的最佳训练期长度势必不再是“最佳”。而在实际的业务预报中,预报期逐日更新,故最佳训练期长度应随预报期变化,最佳训练期也应合理涵盖历史数据,不断纳入新的观测信息。
基于此,设计一个用于挑选最佳训练期且长度可变的活动区间,区间右端为靠近某一预报日的相对固定端,左端则为远离预报日的活动端,在此活动区间内,左端不断向远离预报日的方向推进,活动区间的长度由此不断增加。另外,考虑到用活动区间确定最佳训练期势必需要活动的预报期来与之配合,本文中,在预报日活动区间之间紧邻活动区间的右侧设计一个“试预测期”,用试预测期的预报效果来选定针对某一预报日的最佳训练期长度和与之对应的最优权重系数。随着预报日的更新变化,活动区间和试预测期向前逐日滚动推进。活动区间长度的变化范围最短定为2 d,参考相关文献,将最大长度定为60 d(智协飞等,2009;崔慧慧和智协飞,2013;黄思等,2015)。试预测期长度最优为4 d,具体的确定方法后面再详细讨论。
按上述思想,将首个最大活动区间及其临近试预测期作为准备期(1月1日至3月5日)。在首个最大活动区间及其临近试预测期以后(即自3月6日始),
(1)在活动区间内,训练期由2 d到60 d逐渐增加。在每一个训练期内,按(5)式建立回归方程,由最小二乘法原理使训练期误差G最小来得到不同训练期条件下的
$ L\text{=min}\left(\sum\nolimits_{m=1}^{{{N}_\text{tf}}}{{{\left[ {{V}_{km}}(j, t)-{{O}_{m}}(j, t) \right]}^{2}}} \right)\text{, }k\text{=1, }\cdots, {{N}_{w}}. $ | (6) |
(2)将
(3)按此方法,训练长度挑选区间及试预测期向前逐日滚动推进来获取此后每一日的超级集成预报值。
2.4 评估参数为评估改进后的超级集合算法的预报能力,本文中用到的常用预报能力评估参数包括:均方根误差(RMSE)、标准化平均误差(NME)、平均偏差(MB)、标准化平均偏差(NMB)、相关系数(r)、IOA(一致性指数)。其中,前四项为误差评估参数;相关系数考察观测和预报时间序列的相关程度,一定意义上反应了模式趋势预报的能力;一致性指数综合体现了模式与观测的一致程度(Kang et al., 2010)。各参数表达式见表 1。
计算各评估参数在冷暖季的区域平均(各代表站平均)值,如表 2所示。整体来看,暖季各模式RMSE在42 μg m-3以上,冷季在33 μg m-3以上,结合RMSE和NME来看,CAMx模式误差最小。MB的结果各个模式差异较大:NAQPMS和WRFCHEM模式存在低估,且暖季尤为显著,分别可达-26.84 μg m-3和-22.21 μg m-3,而CMAQ和CAMx模式在冷季的正误差明显,在6~8 μg m-3左右。NMB的结果与MB的结果类似。IOA与相关系数的结果较一致,CMAQ和CAMx模式高于NAQPMS和WRFCHEM模式,冷季略高于暖季,且四者比较而言,CAMx模式最高。
$ \text{N}{{\text{O}}_{2}}+{{h}_{\text{v}}}\to \text{NO}+\text{O}\left( ^{3}P \right), $ | (7) |
$ \text{O}({}^{3}P)+{\text{O}_{2}}+M\to {\text{O}_{3}}+M, $ | (8) |
$ {\text{O}_{3}}+\text{NO}\to \text{N}{\text{O}_{2}}+{\text{O}_{2}}. $ | (9) |
Haggen-Smit(1952)指出,氮氧化物(NOx)是对流层O3的主要前体物之一。在太阳辐射强度稳定的理想状态下,NO、NO2、O3三者处于(7)~(9)式所示的化学平衡状态。其中,hv为光能;
总体而言,各模式仍存在较大的预报误差,且暖季的预报误差大于冷季,CMAQ和CAMx模式在冷季存在明显高估,而NAQPMS和WRFCHEM模式在暖季存在明显低估。各模式对氮氧化物的预报偏差是导致O3预报误差的重要原因之一,模式在前体物与O3化学转化方面还有待进一步研究。各模式综合比较而言,CAMx模式预报误差最小,且与观测保持了较好的相关性和一致性。
3.2 不同集成方法的对比评估 3.2.1 整体效果对比评估用改进后的超级集成方法(AR-SUP)、滑动训练期的超级集成方法(R-SUP)、多模式集成平均方法(EMN)和消除偏差的集成平均方法(BREM)四种不同集成方法对多模式系统的O3预报进行集成,并计算评估参数的区域平均值(表 3)。与最优单模式的结果对比:四种多模式集成方法在冷、暖两季均降低了预报误差,具体来看:AR-SUP和RUP方法误差降低较显著,二者相较AR-SUP方法更优。RMSE较最优单模式在暖季和冷季分别降低了8.67 μg m-3和7.71 μg m-3,NME则分别降低了24.94%和17.39%;EMN方法降幅最不明显,RMSE与NME与最优单模式的结果接近。从MB和NMB可以看出,采用R-SUP方法后,MB控制在±1.5 μg m-3以内,NMB亦在±1%以内,而AR-SUP方法则在此基础上进一步将MB控制在±0.2 μg m-3以内,NMB控制在±0.5%以内,较最优单模式分别下降超过7 μg m-3和20%,改善明显;EMN和BREM方法改善了单模式在冷季的高估现象,但却整体出现了负偏差,在暖季尤为明显。这是由于EMN和BREM方法虽有差异,但均是基于等权的多模式集成,而从单模式评估结果可知,NAQPMS和WRFCHEM模式负偏差显著,导致了EMN和BREM方法集成出现负偏差。采用AR-SUP方法集成预报后相关系数也得到明显提升,两季分别提升了0.06和0.12,而其余方法和最优单模式接近。从区域平均的角度结合一致性指数IOA来看不同集成方法对预报技巧的改善情况:AR-SUP方法的IOA指数较最优单模式提高了0.09和0.14;R-SUP方法次之,提升值分别为0.03和0.06;BREM方法和最优单模式接近;EMN方法则较最优单模式下降了0.05和0.03。这说明,参与集成的单模式预报技巧差异较大时,对各模式结果进行算术平均或消除偏差的算术平均并不能明显提升预报技巧,算术集成平均甚至会出现集成预报技巧低于最优单模式的情况。相较于前两者,R-SUP方法能够明显减小单模式预报误差,而AR-SUP方法在此基础上能够进一步提高预报技巧。
将2015年3月6日至12月3日日最大8小时O3集成预报与观测值的区域平均值绘成时间序列(图 3)。从EMN和BREM方法预报结果来看,3~4月中旬,二者(蓝色、绿色线)略高于观测值(黑色圆圈);4月中旬进入暖季后高污染事件出现明显增多,预报低估逐渐凸显;11月,预报和观测均吻合较好;2月以后,预报整体偏高。这说明EMN和BREM方法在冷季的部分时段(3月、12月)存在高估现象,在冷暖过渡的季节(4月、11月)与观测时间序列同步较好,而在暖季(5~9月)和10月则存在出现明显低估。这可能与CAMx模式与CMAQ模式正偏差明显、NAQPMS与WRFCHEM模式负偏差明显有关。从R-SUP方法得到的时间序列(紫色线)与观测值的对比来看,R-SUP方法能够改善EMN和BREM方法在暖季明显低估的情况,但对暖季部分时段的高污染过程的谷值预报整体偏高(5~7月上旬、9月中下旬),在冷季的部分时段(3月中下旬、10月中下旬至11月上旬)出现低估。AR-SUP方法(红色线)相较于R-SUP方法与观测值保持了更好的一致性,其对4月下旬、5月下旬、6月中旬、8月上旬及下旬、9月上旬和10月下旬的高污染事件(峰值)和污染清除的转折阶段(谷值)的出现时间和浓度值预报较准确。究其原因在于,R-SUP方法是历史观测平均态基础上的模式距平加权集成,而历史观测平均态决定于训练期内的历史观测值,R-SUP方法训练期长度固定,实际预报值易受训练期内观测平均态的影响而出现谷值偏高、峰值错位等现象;而AR-SUP方法通过试预测期的预报效果来不断调整训练期长度,合理选取观测平均态,从而能够进一步逼近观测,减小误差。
为进一步考察不同集成方法对实况观测动态变化的预报能力及在不同观测浓度水平下不同集成方法的预报偏差变化趋势,按Mathur et al.(2008)提出的方法,计算各代表测站不同集成预报值及观测值在冷、暖季的浓度频率分布函数,截取集成预报值的5%、25%、50%、75%和95%百分位点与相应百分位点观测值对比(百分位点大小表示浓度的高低)。为了便于分析,在图 4中增加了1:2、1:1以及2:1三条特征线。受各单模式预报水平影响,EMN和BREM方法在暖、冷两季,存在低浓度预报整体偏高(5%、25%百分位点偏高),高浓度预报整体偏低(75%、95%百分位点偏低)的现象,且冷季更为明显,二者与1:1特征线拟合优度系数在0.85以下。R-SUP方法在暖季的预报与观测值散点基本沿着1:1特征线集中分布,拟合优度系数为0.9;而在冷季,预报与观测值散点沿1:1特征线的集中度降低,较低浓度(5%、25%百分位点)沿1:2和1:1特征线之间的区域散布,较高浓度在1:1和2:1特征线之间的区域散布,拟合优度系数降至0.79;R-SUP方法在冷季各百分位点预报偏差增大的原因可能是由于冷季O3浓度较低使得历史平均态影响增加,进而出现低浓度预报偏高,高浓度预报偏低的现象。AR-SUP方法则一定程度上修正了上述偏差,与1:1特征线拟合优度系数保持在0.91。
为考察集成预报法的空间表征能力,图 5给出了不同集成预报绝对误差(MB)的年均值在长三角地区的空间分布。从图中可以看出,EMN方法的结果在暖季长三角的整个中东部地区明显低估(<-5 μg m-3)m,西部地区则为明显高估(>5 μg m-3);在冷季,低估的范围和强度有所减缓,但在中部地区仍为明显低估(<-5 μg m-3),且除西部地区外,北部和南部的部分站点也出现了高估的现象。从BREM方法的预报结果来看,在暖季,MB的分布与EMN方法的结果近似,但就误差的范围和强度而言,优于多模式集成平均;在冷季,除北部的个别站点及中部的部分站点预报偏低(<-5 μg m-3)外,大部分站点的MB在±5 μg m-3以内。从空间分布上看,R-SUP方法较前两者能够明显减小误差,在暖季,长三角中部地区大部分站点的MB均控制在±2 μg m-3以内,但在北部及东南部的部分站点略偏高(>2 μg m-3),个别站点存在明显低估的现象(<-5 μg m-3);在冷季,误差为±2 μg m-3站点范围缩小,在北部和东部低估站点(<-2 μg m-3)范围扩大,西部则有高估站点(>2 μg m-3)出现。与R-SUP方法比较,AR-SUP方法在暖、冷两季MB在±2 μg m-3以内的站点范围进一步扩大;但在中部有一个站点在暖季出现明显低估(<-5 μg m-3)、冷季明显高估(>5 μg m-3)。查找原因后发现,该站点的观测资料自2015年10月下旬开始缺测,而本文中规定,当活动区间内缺测值超过半数,基于活动区间超级集成失效,以消除偏差的集成预报(BREM)代替,导致AR-SUP方法在该站点结果出现较大偏差。
为进一步比较不同集成方法在全年的时空表征能力,将各个测站的集成预报值和观测值按照表 1逐月计算评估参数,绘制成盒状图(图 6)。逐月比较来看,AR-SUP方法的RMSE总体最低,R-SUP方法与AR-SUP方法接近,BREM方法次之,EMN方法最大。MB的结果显示AR-SUP方法的优势明显,各月中位数在0左右,百分位之差亦控制在5 μg m-3,无明显季节差异;R-SUP方法结果略高于AR-SUP方法,各月中位数绝对值在5 μg m-3左右,百分位之差在10 μg m-3左右;EMN和BREM方法的MB要明显大于前两者,二者在暖季的MB达到或超过了-20 μg m-3,冷季的MB相对减小,但百分位之差超过10 μg m-3。EMN和BREM方法的相关系数保持了较高水平,二者在暖季可达到或超过0.6,冷季亦维持在0.4以上;R-SUP方法的相关系数最低,暖季在0.4左右,冷季跌至0.2左右。AR-SUP方法则在R-SUP方法基础上整体将相关系数提升了0.2左右,在大部分月份达到或超过了EMN和BREM方法的相关系数水平。分析其原因在于:BREM和EMN方法基于单模式的等权集成,能较好保留单模式良好的趋势预报能力。R-SUP方法从减小误差的角度来挑选权重系数,在有限逼近观测的过程中势必导致模式预测时间序列变化趋势改变,这种改变在短时间内、观测浓度较低时相对明显,其表现为冷季的月尺度相关性显著降低。而AR-SUP方法能够较R-SUP方法进一步逼近观测,这在一定程度上修正了时间序列变化趋势的改变,从而提高与观测序列的相关性。从IOA指数的结果来看,AR-SUP方法明显优于其余三种方法,其IOA指数在绝大部分月份超过了0.6,部分月份(4、8、9月)达到甚至超过0.8,整体较其余三种方法高出约0.1;其余三种方法比较而言,R-SUP和BREM方法接近,R-SUP方法略高,EMN方法最低。
从上述评估结果可知,四种方法比较而言,AR-SUP方法能够有效的减小误差,在冷、暖季均能保持高水平且稳定的预报技巧,预报效果要明显优于其余三种集成方法。
3.3 改进的超级集成法在短期预报中的应用在日常的业务预报中,未来三天的空气质量均是关注重点。将AR-SUP方法进一步运用到48 h和72 h预报中,并与最优单模式进行对比评估,检验该方法短期预报效果。
图 7为72 h内预报评估参数箱式图对比,从图中可以看出,CAMx模式暖季的RMSE随着预报时效的增加而增长,其中位数从37.7 μg m-3升至41.4 μg m-3;而AR-SUP方法预报则稳定在36 μg m-3左右,二者差距随时间增长,冷季与暖季结果类似。这从二者MB的对比中有更加直观的体现:CAMx模式在暖季为较大的负偏差,且偏差随预报时效的增加表现愈加显著;而AR-SUP方法的MB则稳定在±5 μg m-3以内。从相关系数(r)的对比结果看:CAMx模式暖季24 h预报的r中位数高于AR-SUP方法,随着预报时效的增加,CAMx模式的r中位数下降且百分位之差显著增大,至72 h与AR-SUP方法虽中位数接近,整体水平已显著低于AR-SUP方法。在冷季,AR-SUP方法的r中位数稳定在0.78左右,且百分位之差亦稳定在0.3左右;而CAMx模式则整体随时间下降。各项评估参数的结果都表明AR-SUP方法的预报技巧并未随着预报时效的增加出现明显降低。
在日常的业务预报中,环境空气质量指数(Air Quality Index, AQI)等级准确率亦是考察预报能力的一项重要指标。按照环境空气质量指数(AQI)技术规定中关于空气质量分指数(Individual Air Quality Index, IAQI)的相关定义及其等级划分规定(中华人民共和国环境保护部,2016),计算了O3的环境空气质量分指数,并对72 h内CAMx模式和AR-SUP方法的IAQI预报的等级准确率进行了对比分析(图 8)。其中,灰色和黑色盒状图分别对应CAMx模式与AR-SUP的结果。等级准确率(cH)(Eder et al., 2009)定义为:
在改进的超级集成方法(AR-SUP)中,试预测期长度也是影响预报效果的关键因子。将2015年8~9月、11~12月分别作为暖季和冷季试验期,均方根误差RMSE和一致性指数IOA作为考察预报准确率的两项评估参数。将试预测期从1~30天逐渐增加,计算在不同试预测期下代表测站RMSE和IOA的区域平均值变化情况,并与同期消除偏差的集成平均预报(BREM)的RMSE和IOA对比(图 9)。
最优试预测期长度的选取应遵循RMSE较低、IOA较高的原则,同时兼顾考虑计算效率。从图 9中可知,在暖季,随试预测天数增加AR-SUP方法的RMSE呈一致下降的趋势;而在冷季,RMSE则呈现先降后升的趋势;IOA指数在冷暖季皆表现为先升后降的趋势。AR-SUP方法的RMSE和IOA指数在冷、暖季节的变化虽各不相同,但在试预测期天数较短时,均存在一个显著变化期:当试预测期小于3天时,暖季AR-SUP方法的RMSE大于BREM方法的,说明试预测期天数过短并不能有效的减小误差、提高准确率。这是由于在实际业务预报中,预测日当天的观测值未知,故预测日的最佳训练期和模式权重并不可得,而此时经由活动区间选取的最佳训练期长度及最佳权重,只是针对试预测预报的“最佳”。试预测期过短,会使得最佳训练期长度及权重获取的偶然性和不确定性增大,导致预报准确率降低,相应RMSE较大、IOA指数较低。所以,需要适当延长试预测期,使得最佳训练长度及权重更具普适性,得到针对预测日的“相对最佳”训练期及模式权重。但试预测期亦不可过长,过长的试预测期会导致计算效率降低。所以需合理挑选试预测期长度。可以看到,试预测期由1天延长至4天时,RMSE迅速下降,IOA指数则明显升高;而4天以后,RMSE的降幅明显减缓,在冷季则呈现出缓慢上升的趋势,而IOA指数则开始缓慢上升,说明此时延长试预测期并不能有效提高准确率且RMSE和IOA指数对试预测期的增加不再敏感。故从RMSE和IOA指数的变化趋势及计算效率综合考虑,选择4天为最佳的试预测期。
4 结论本文将超级集成方法进行改进,使其适用于日常的业务预报。将改进后的超级集成方法、滑动训练期的超级集成法、多模式集成平均的方法、消除偏差的集成平均法与长三角地区多模式空气质量预报系统的预报结果相结合制作了2015年长三角地区的O3集成预报,并对四种集成方法得到的预报结果从多方面进行了对比评估;在此基础上用最优的改进超级集成方法对48 h和72 h预报结果进行集成,并与最优单模式的结果进行比较;最后对改进的超级集成方法中最佳试预测期进行了调试。得到以下结论:
(1)从单模式对比评估结果来看,CAMx模式与CMAQ模式误差小于NAQPMS模式与WRFCHEM模式,前两者相较而言,CAMx模式更优;前两者在冷季存在高估,后两者在冷暖两季均存在低估,且暖季更为明显。模式对氮氧化物预报偏差是导致O3预报误差的重要原因之一。
(2)改进的超级集成方法(AR-SUP)、超级集成方法(R-SUP)、多模式集成平均方法(EMN)以及消除偏差的集成平均方法(BREM)均能在一定程度上减小单模式的系统误差,但效果有差异。EMN方法为多个单模式的算术平均,实际也包含对单模式系统误差的算术平均。在时间上表现为暖季预报偏低、冷季部分时段预报偏高,在空间上表现为东部低估、西部高估。BREM方法在多模式集成平均的基础上引入观测平均态,预报效果优于EMN方法,其在冷季的高估现象不明显,暖季低估的现象也得到一定的改善,低估的空间范围也有所减小。相较于EMN和BREM方法,R-SUP方法能够更为显著的减小系统误差和预报偏差,但仍存在观测高浓度时预报偏低,低浓度偏高的现象,且该方法在减小误差的同时损失了局部相关性,这在冷季时尤为显著。AR-SUP方法通过活动区间与试预测期配合来合理选取观测平均态的取值范围,不仅能够在R-SUP方法基础上进一步逼近观测,且在一定程度上改善了R-SUP方法相关性较低的局限性。
(3)和最优单模式相比,AR-SUP方法减小了误差和偏差、提高了相关性和一致性,且48 h和72 h预报和24 h预报相比,误差并无明显增长,预报技巧稳定在较高水平。进一步说明了该方法的稳健性。
(4)运用AR-SUP方法,试预测期也是影响预报效果的重要因子。通过对AR-SUP方法试预测期的调试,发现试预测期过短,会导致预报的不确定性增大,预报技巧降低;而试预测期过长则会降低运算效率。综合考虑后将试预测期定为4天时,预报效果最佳。
(5)本文中集成方法仅在选定的离散站点中应用,在以后的研究中将进一步应用到所有站点和连续网格点中。
崔慧慧, 智协飞. 2013. 基于TIGGE资料的地面气温延伸期多模式集成预报[J]. 大气科学学报, 36: 165-173. Cui H H, Zhi X F. 2013. Multi-model ensemble forecasts of surface air temperature in the extended range using the TIGGE dataset[J]. Transactions of Atmospheric Sciences, 36: 165-173. DOI:10.13878/j.cnki.dqkxxb.2013.02.006
|
Danard M B, Holl M M, Clark J R. 1968. Fields by correlation assembly-A numerical analysis technique[J]. Mon. Wea. Rev., 96: 141-149. DOI:10.1175/1520-0493(1968)096<0141:FBCAAN>2.0.CO;2
|
Dennis R L, Byun D W, Novak J H, et al. 1996. The next generation of integrated air quality modeling:EPA's Models 3[J]. Atmos. Environ., 30: 1925-1938. DOI:10.1016/1352-2310(95)00174-3
|
Eder B, Kang D W, Mathur R, et al. 2009. A performance evaluation of the national air quality forecast capability for the summer of 2007[J]. Atmos. Environ., 43: 2312-2320. DOI:10.1016/j.atmosenv.2009.01.033
|
Park T. 1998. EPA-454/R-98-017 Guideline on data handling conventions for the 8-hour ozone NAAQS[S]. United States Environmental Protection Agency's Office of Air Quality Planning and Standards, 4-7.
|
Gao L N, Jia G S, Zhang R J, et al. 2011. Visual range trends in the Yangtze River Delta region of China, 1981-2005[J]. Journal of Air & Waste Management Association, 61: 843-849. DOI:10.3155/1047-3289.61.8.843
|
Grell G A, Peckham S E, Schmitz R, et al. 2005. Fully coupled "online" chemistry within the WRF model[J]. Atmos. Environ., 39: 6957-6975. DOI:10.1016/j.atmosenv.2005.04.027
|
Haggen-Smit A J. 1952. Chemistry and physiology of Los Angeles smog[J]. Industrial & Engineering Chemistry, 44: 1342-1346. DOI:10.1021/ie50510a045
|
黄思, 唐晓, 徐文帅, 等. 2015. 利用多模式集合和多元线性回归改进北京M10预报[J]. 环境科学学报, 35: 56-64. Huang S, Tang X, Xu W S, et al. 2015. Application of ensemble forecast and linear regression method in improving M10 forecast over Beijing areas[J]. Acta Scientiae Circumstantiae, 35: 56-64. DOI:10.13671/j.hjkxxb.2014.0728
|
Kang D W, Mathur R, Trivikrama Rao S. 2010. Real-time bias-adjusted O3 and PM2.5 air quality index forecasts and their performance evaluations over the continental United States[J]. Atmos. Environ., 44: 2203-2212. DOI:10.1016/j.atmosenv.2010.03.017
|
Krishnamurti T N, Kishtawal C M, LaRow T E, et al. 1999. Improved weather and seasonal climate forecasts from multi-model super ensemble[J]. Science, 285: 1548-1550. DOI:10.1126/science.285.5433.1548
|
刘建国, 谢正辉, 赵琳娜, 等. 2013. 基于TIGGE多模式集合的24小时气温BMA概率预报[J]. 大气科学, 37: 43-53. Liu J G, Xie Z H, Zhao L N, et al. 2013. BMA probabilistic forecasting for the 24-h TIGGE multi-model ensemble forecasts of surface air temperature[J]. Chinese Journal of Atmospheric Sciences, 37: 43-53. DOI:10.3878/j.issn.1006-9895.2012.11232
|
Mathur R, Yu S C, Kang D W, et al. 2008. Assessment of the wintertime performance of developmental particulate matter forecasts with the Eta-Community Multiscale Air Quality Modeling System[J]. J. Geophys. Res., 113: D02303. DOI:10.1029/2007JD008580
|
唐晓, 朱江, 王自发, 等. 2013. 基于集合卡尔曼滤波的区域臭氧资料同化试验[J]. 环境科学学报, 33: 796-805. Tang X, Zhu J, Wang Z F, et al. 2013. Regional ozone data assimilation experiment based on ensemble Kalman filter[J]. Acta Scientiae Circumstantiae, 33: 796-805. DOI:10.13671/j.hjkxxb.2013.03.026
|
Thompson P D. 1977. How to improve accuracy by combining independent forecasts[J]. Mon. Wea. Rev., 105: 228-229. DOI:10.1175/1520-0493(1977)105<0228:HTIABC>2.0.CO;2
|
王自发, 谢付莹, 王喜全, 等. 2006. 嵌套网格空气质量预报模式系统的发展与应用[J]. 大气科学, 30: 778-790. Wang Z F, Xie F Y, Wang X Q, et al. 2006. Development and application of nested air quality prediction modeling system[J]. Chinese Journal of Atmospheric Sciences, 30: 778-790. DOI:10.3878/j.issn.1006-9895.2006.05.07
|
王自发, 吴其重, GbaguidiA, 等. 2009. 北京空气质量多模式集成预报系统的建立及初步应用[J]. 南京信息工程大学学报(自然科学版), 1: 19-26. Wang Z F, Wu Q Z, Gbaguidi A, et al. 2009. Ensemble air quality multi-model forecast system for Beijing (EMS-Beijing):Model description and preliminary application[J]. Journal of Nanjing University of Information Science & Technology (Nature Science Edition), 1: 19-26. DOI:10.13878/j.cnki.jnuist.2009.01.003
|
杨学胜. 2001. 业务集合预报系统的现状及展望[J]. 气象, 27(6): 3-9. Yang X S. 2001. The new development and the outlook of the operational ensemble prediction system[J]. Meteorological Monthly, 27(6): 3-9. DOI:10.7519/j.issn.1000-0526.2001.6.001
|
殷永泉, 李昌梅, 马桂霞, 等. 2004. 城市臭氧浓度分布特征[J]. 环境科学, 25(6): 16-20. Yin Y Q, Li C M, Ma G X, et al. 2004. Ozone concentration distribution of urban[J]. Environmental Science, 25(6): 16-20. DOI:10.13227/j.hjkx.2004.06.004
|
张涵斌, 智协飞, 王亚男, 等. 2015. 基于TIGGE资料的西太平洋热带气旋多模式集成预报方法比较[J]. 气象, 41: 1058-1067. Zhang H B, Zhi X F, Wang Y N, et al. 2015. Comparison of multi-model ensemble methods for western Pacific tropical cyclone forecast based on TIGGE data[J]. Meteorological Monthly, 41: 1058-1067. DOI:10.7519/j.issn.1000-0526.2015.09.002
|
Zhang Y H, Huang W, London S J, et al. 2006. Ozone and daily mortality in Shanghai, China[J]. Environmental Health Perspectives, 114: 1227-1232. DOI:10.1289/ehp.9014
|
智协飞, 林春泽, 白永清, 等. 2009. 北半球中纬度地区地面气温的超级集合预报[J]. 气象科学, 29: 569-574. Zhi X F, Lin C Z, Bai Y Q, et al. 2009. Super ensemble forecasts of the surface temperature in Northern Hemisphere middle latitudes[J]. Scientia Meteorologica Sinica, 29: 569-574. DOI:10.3969/j.issn.1009-0827.2009.05.001
|
智协飞, 彭婷, 李刚, 等. 2014. 多模式集成的概率天气预报和气候预测研究进展[J]. 大气科学学报, 37: 248-256. Zhi X F, Peng T, Li G, et al. 2014. Advances in multi-model ensemble probabilistic prediction[J]. Transactions of Atmospheric Sciences, 37: 248-256. DOI:10.13878/j.cnki.dqkxxb.2014.02.013
|
智协飞, 季晓东, 张璟, 等. 2013. 基于TIGGE资料的地面气温和降水的多模式集成预报[J]. 大气科学学报, 36(3): 257-266. Zhi X F, Ji X D, Zhang J, et al. 2013. Multi-model ensemble forecasts of surface air temperature and precipitation using TIGGE datasets[J]. Transactions of Atmospheric Sciences, 36(3): 257-266. DOI:10.3969/j.issn.1674-7097.2013.03.001
|
智协飞, 张璟, 段晚锁. 2015. ENSO预测的目标观测敏感区在热带太平洋海温的多模式集合预报中的应用[J]. 大气科学, 39: 767-776. Zhi X F, Zhang J, Duan W S. 2015. Application of sensitive area for target observation associated with El Niño-Southern Oscillation predictions to multi-model ensemble forecast of the tropical Pacific sea surface temperature[J]. Chinese Journal of Atmospheric Sciences, 39: 767-776. DOI:10.3878/j.issn.1006-9895.1408.14181
|
智协飞, 赵欢, 朱寿鹏, 等. 2016. 基于CMIP5多模式回报资料的地面气温超级集合研究[J]. 大气科学学报, 39: 64-71. Zhi X F, Zhao H, Zhu S P, et al. 2016. Super ensemble hindcast of surface air temperature using CMIP5 multi-model data[J]. Transactions of Atmospheric Sciences, 39: 64-71. DOI:10.13878/j.cnki.dqkxxb.20150109001
|
中华人民共和国环境保护部. 2016. HJ 633-2012环境空气质量指数(AQI)技术规定(试行)[S].北京: 中国环境科学出版社, 2-3.
|
Ministry of Environmental Protection of the People's Republic of China. 2012. HJ 633-2012 Technical Regulation on Ambient Air Quality Index (on trial)[S]. Beijing: China Environmental Science Press, 2-3.
|