吴香华 陈以祺 官元红 田心童 华亚婕
摘要 针对传统时间序列模型无法有效预测模态混叠数据的不足,本文提出了一种基于CEEMDAN-SE-ARIMA的组合模型,并且对东北地区2016—2020年夏季降水量进行了实证分析。首先,基于完全自适应集合经验模态分解方法,将降水时间序列分解为多个本征模态分量,并根据不同分量样本熵的计算结果进行分量序列重构。然后,针对每一个重构分量,构建自回归移动平均预测模型。最后,将各分量的预测值进行叠加,得到组合模型的预测值。此外,还构建了ARIMA单一模型和其他组合模型,旨在与CEEMDAN-SE-ARIMA组合模型对比。结果表明:CEEMDAN-SE-ARIMA组合模型考虑了时间序列的模态混叠特征,能有效提高东北地区夏季降水时序模型的预测能力,具有良好的预测应用价值。预测结果较单一模型和其他组合模型均有所提高,MASE降低了0.02~0.91 mm,RMSE降低了0.80~130.49 mm,MAE降低了2.52~129.84 mm,MAPE降低了1.08~35.53 mm。CEEMDAN-SE-ARIMA模型在降水变率较小的西北部区域预测效果更好,对东南部区域的极值分布中心预测较为准确。
关键词 东北夏季降水; 模态混叠; CEEMDAN; 样本熵; ARIMA
全球气候变暖是目前气候变化的主要特征,直接影响到大气中水汽含量和降水结构的变化。在此背景下,与降水相关的极端天气事件频发,每年都会给我国造成重大的经济损失。因此,对降水进行科学准确预测,尤其是夏季汛期降水的变化,是目前亟待解决的问题(沈皓俊等,2020)。东北地区位于我国东北部,地处东北亚的核心位置,拥有高原、平原和山地3类地形单元,自南向北跨越暖温带、中温带和寒温带。复杂独特的气候特征和地理位置,导致东北地区夏季降水的成因与其他气候区有着本质区别,是我国较为典型的气候“脆弱区”之一(赵俊虎等,2020)。东北夏季降水一直是短期气候预测的重难点,对其进行预测研究具有重要的实际意义和必要性(廉毅等,2003;贾小龙和王谦谦,2006)。
目前,降水时间序列的预测方法主要有传统的移动平均法(Moving Average,MA)、自回归法(Auto Regressive,AR)、自回归移动平均法(Auto-Regressive Moving Average,ARMA)和基于机器学习的人工神经网络法(Artificial Neural Network,ANN)等(田俊武等,2005;刘莉和叶文,2010;陈沪生等,2019;余洋和万定生,2019)。然而,降水的随机性和复杂性(苏京志,2019)会大大降低ANN的收敛速度和预测精度,并且训练过程极易陷入局部最小值(贺玉琪等,2019)。MA、AR和ARMA等线性方法对数据的平稳性有较高要求,难以适应降水序列的非线性和非平稳性。相比于以上几种方法,差分自回归移动平均法(Auto Regressive Integrated Moving Average model,ARIMA)能够处理非平稳序列,在降水预测中应用广泛,且在短期降水预测中精度较高(李宁等,2019)。
由于降水受到水文、大气环流、季风、地形和人类活动等多方面的影响(王文等,2014),降水时间序列容易产生很强的非平稳随机波动,同时展现出模态混叠、多时间尺度等复杂特征(郭品文和郎丽玲,2017;陈国鼎等,2018;顾伟宗等,2018)。基于以上原因,传统时间序列方法的预测误差通常比较大。Huang et al.(1998)提出了一种处理非线性、非平稳时间序列的新方法——经验模态分解(Empirical Mode Decomposition,EMD)方法,该方法可以凭借数据自身的局部时变特征,自适应地分解时频,对序列进行平稳化处理。相比小波分析和傅立叶分解变换而言,EMD具有更好的时频分辨率和自适应的优点(李智强等,2020),并且打破了傅立叶和小波分析平稳、线性的前提局限(马佳佳等,2021),已经被成功且广泛地应用于水文时间序列的分析中。但是,EMD不可避免地容易产生本征模态函数(Intrinsic Mode Function,IMF)混叠现象,而模态混叠不仅使各时间尺度的IMF分量无法准确体现,甚至会导致个别IMF分量丧失物理意义。为了尽可能消除模态混叠问题,使分解产生的各IMF分量在物理上保持唯一性,Wu and Huang(2009)提出了集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)濾波方法,该方法在一定程度上抑制了模态混叠问题,并在气候预测中取得良好的效果。但是EEMD分解后的IMF分量噪声有残留,并且每一次需要主观选择加入不同幅值的白噪声(韩庆阳等,2015)。因此,Torres et al.(2011)提出了一种完全自适应集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN),该方法通过在每一阶段添加自适应白噪声,有效地克服了EEMD重构误差非零等问题,保证了分解的完整性,同时还减少了迭代次数,提高了计算效率(黄金等,2020)。
综上所述,传统方法和单一方法难以对复杂的非线性、非平稳降水序列进行准确度较高的预测(黄春艳等,2017)。因此,本文基于“分解-重构-集成”的思想,结合CEEMDAN分解完整性较好、ARIMA短期预测精度较高和SE重构效率较快的优势,提出了CEEMDAN-SE-ARIMA组合预测模型。利用1970—2015年6—8月东北地面气象观测资料建立组合预测模型,并通过独立检验期(2016—2020年6—8月)的观测资料评估模型的预测性能。为了验证CEEMDAN-SE-ARIMA模型的有效性,以独立检验期的评估指标为基准,与其他模型进行对比分析。该模型的提出可以为东北夏季降水预测和人工增雨效果检验的自然降水量估算提供一种新思路(王婉和姚展予,2009)。
1 资料和方法
1.1 研究区域和资料
东北地区指我国东北部的辽宁省、吉林省、黑龙江省和内蒙古东四盟(包括呼伦贝尔市、兴安盟、通辽市、赤峰市)构成的区域,地处欧亚大陆东端,东面和北面与朝鲜和俄罗斯两国接壤,南临渤海、黄海,与山东半岛隔海相望,地域辽阔且地形多样完整,地理位置为115.52°~135.09°E、38.72°~53.55°N。
东北夏季降水量预测所采用的资料来源于国家气象科学数据中心(http://data.cma.cn)提供的1970—2020年中国地面气候资料月值数据集。选用东北地区104个地面基本气象观测站及自动站的逐月观测数据,资料选取时段为1970—2020年夏季(6—8月)。将观测数据缺失间断以及类型不一致的站点去除,最终用于本研究的资料是100个气象站点的夏季累积降水数据。
1.2 研究方法
1.2.1 基于CEEMDAN的多尺度分解
CEEMDAN是目前最新的一种经验模态分解方法,该方法在IMF分量的分解过程中自适应地加入白噪声,有效地解决了EMD模态混叠和EEMD重构误差非零等问题,在保证分解完整性的基础上,节约了计算时间(王书平和魏晓萌,2017;陈璐,2019),尤其适合非平稳降水时间序列的分析处理。
CEEMDAN是经验模态分解,集成经验模态分解和互补集成经验模态分解的改进方法(朱利明等,2020),具体算法如下:
1.2.4 组合预测模型评估指标
综合以上理论分析,首先将夏季降水数据利用CEEMDAN信号分析方法进行分解和处理;其次利用SE熵值计算方法重构序列分量;然后对重构后的各个分量建立ARIMA预测模型;最后将预测值叠加,得到组合模型的预测值。
为了评估本文模型预测结果的优劣,引入平均绝对误差(MAE)、平均绝对缩放误差(MASE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)四种统计学指标来评价模型的预测性能。MAE通过放大预测误差较大的值,可以比较不同预测模型的稳定性;MASE用于比较不同尺度的时间序列的预测准确性;RMSE代表模型预测结果的标准偏差;MAPE不仅考虑了预测值和实测值之间的误差,还考虑了误差与实测值之间的比例,是一个衡量预测准确性的指标。
2 结果与分析
2.1 东北夏季降水分区
掌握东北地区不同区域夏季降水的一致性和差异性,有助于更加客观高效地评估组合模型的预测准确性、稳定性。因此,对东北近51 a夏季降水进行区划和区域代表性站点选取是非常有必要的。运用经验正交函数分解(EOF)分析东北地区夏季降水的主要空间振荡型及变化敏感区域(赵春雨等,2009;潘留杰等,2018;王丽娟等,2020),运用旋转经验正交函数分解(REOF)对降水量场进行客观区划(江志红和丁裕国,1994)。
本文对东北地区100个气象台站1970—2020年6—8月标准化的累积降水量做EOF分析。通过North准则检验(North et al.,1982),发现前5个空间主模态通过了95%置信水平检验,表明特征根误差范围不重叠,其分解得到的5个模态具有相对明确的物理意义信号。通过EOF分析发现:东北地区夏季降水既有全区一致(第一模态)的分布特点,也有南北反相(第二模态)的分布差异。为了进一步揭示东北地区夏季降水的地域特征,对EOF分析的前5个特征向量做REOF分析。表1列举了EOF和REOF前5个模态的方差贡献率和累计方差贡献率,可以看出前5个模态的累计方差贡献率超过了一半,为56.35%,故前5个模态的特征向量可以较好地解释东北地区夏季降水分布类型。
由REOF的空间分布(图2)可见,前5个空间主模态中的高值中心几乎涵盖了整个东北区域。结合色标尺,按照载荷分量绝对值大于0.16作为标准将东北地区夏季降水量分为5个区,分别为:第Ⅰ区域,即南部地区(辽宁和吉林东南部);第Ⅱ区域,即东北部地区(黑龙江东南部和吉林北部);第Ⅲ区域,即西南部地区(内蒙古东四盟南部、辽宁西部、吉林西北部);第Ⅳ区域,即东南部地区(黑龙江南部、吉林东部);第Ⅴ区域,即西北部(黑龙江北部、内蒙古东四盟西部)。结合东北夏季累积降水空间分布(图1)可知,东北西部地区夏季降水量较为匮乏,南部地区夏季降水量较为充沛,夏季降水量自东南向西北从700 mm逐渐降低至200 mm以下。因此,划分的5个区域在降水量空间分布上具有明显差异。
結合区划结果、气候特征和地理位置,本文选取了5个代表站点:瓦房店、绥化、索伦、白城和嫩江。瓦房店位于辽东半岛中西部,属于暖温带大陆性季风气候,夏季降水量的标准差为99.88 mm;绥化位于松嫩平原的呼兰河流域,属于中温带湿润气候,夏季降水量的标准差为91.41 mm;索伦位于大兴安岭南麓,属于温带大陆性季风气候,夏季降水量的标准差为99.59 mm;白城位于嫩江平原西部,属于中温带半干旱季风气候,夏季降水量的标准差为125.31 mm;嫩江位于松嫩平原连接大、小兴安岭山地的过渡地带,属于中温带亚湿润季风气候,夏季降水量的标准差为111.32 mm。相较而言,白城和嫩江的夏季降水量离散程度较大,瓦房店、绥化和索伦的离散程度较小。分别对5个典型站点进行组合模型的预测,预测模型的预测时效被设为1 a。
2.2 东北夏季降水预测及对比分析
以东北地区5个典型站点1970—2020年共 51 a的实测夏季降水量序列作为研究对象,分别采用单一ARIMA模型,基于EEMD、CEEMDAN的ARIMA预测模型和基于CEEMDAN-SE的ARIMA模型对东北夏季降水进行预测分析。为了更好地检验模型的外推能力,本文使用滚动预测的方式对模型进行训练和预测,即:分别用1970—2015年、1970—2016年、1970—2017年、1970—2018年和1970—2019年的夏季降水量资料构建预测模型,将2016—2020年的资料用于预测效果的检验。
2.2.1 降水时间序列的分解和重构
以瓦房店站为例,运用EEMD和CEEMDAN分解方法对夏季降水时间序列进行分解,两种方法均得到4个本征模态函数(IMFi,i=1,2,3,4)即不同时间尺度特征的子序列和一个趋势项RES(图3a、b)。两种分解方法的分量频率均逐渐降低,并且某些分量呈现出周期性。从趋势项RES能够看出,瓦房店站夏季降水有上升趋势。计算5个分量的样本熵,并将熵值接近的分量作为一组来重构,重构后的高频分量、低频分量和趋势分量如图3c所示。
2.2.2 降水时间序列的预测
完成以上降水时间序列的分解和重构以后,首先将各分量分别进行ARIMA预测,然后将各分量预测值叠加,计算未来一年的预测值。本文采用4个统计指标评估CEEMDAN-SE-ARIMA模型的降水量预测性能,并与单一ARIMA模型、基于EEMD分解的ARIMA模型进行比较,独立检验期的预测结果如图4所示,比较结果如表3所示。从预测结果可以看出:组合模型比单一的ARIMA模型预测效果好。特别地,由于ARIMA模型无法直接地识别出非平稳降水量时间序列的季节性、周期性等多时间尺度特征,从而导致模型在独立检验期的预测结果近乎同一数值,预测结果较差,这也从一个侧面反映出非平稳时间序列分解的重要性与必然性。此外,根据预测结果与实测值的相关性检验,CEEMDAN-SE-ARIMA模型在5个站点的相关系数分别为:0.90、0.89、0.84、0.62、0.89。可以看出,白城的相关系数较小(>0.6),这可能与白城夏季降水量较少,数据离散程度较大有关。除了白城外,模型在检验时段内的相关系数较高,普遍高于0.84,且均通过0.1的显著性检验。可以表明CEEMDAN-SE-ARIMA模型对东北夏季降水变化趋势的预测性能较为可靠,对降水预测具有一定的参考价值。
由表3可知,CEEMDAN-SE-ARIMA的性能最佳,其次是CEEMDAN-ARIMA和EEMD-ARIMA,最后是ARIMA。特别地,CEEMDAN-SE-ARIMA在瓦房店的效果最好,其次是绥化、索伦和嫩江,最后是白城。除此之外,在白城、索伦和瓦房店,不同预测模型的标准偏差和稳定性差异较小,偏差差异最小仅为24.68 mm,稳定性差异最小仅为17.60 mm;而绥化和嫩江的偏差差異和稳定性较大,偏差差异最大可达130.49 mm,稳定性差异最大可达129.84 mm。索伦、瓦房店和绥化不同预测模型的准确性差异较小,差异最小仅为7.42 mm,白城和嫩江差异较大,最大可达35.53 mm。由此可见,新的组合模型在降水量不同的区域效果提升程度不尽相同。
2.3 组合预测模型性能评估
科学可靠的性能评估是模型在实际预测应用中至关重要的前提。为了评估CEEMDAN-SE-ARIMA组合模型在整个东北地区的适用性和稳定性,利用东北地区100个气象站点的夏季累积降水数据,分别对各个站点构建CEEMDAN-SE-ARIMA组合预测模型,并从评估指标的统计特征以及实测值与预测值的空间分布两个角度对模型的预测性能进行分析。图5给出了该组合模型独立检验期(2016—2020年)各个站点的MASE、RMSE、MAE和MAPE箱线图。就中位数而言,MASE和MAPE分别为0.62 mm和25.93 mm,MAE和RMSE分别为69.24 mm和82.09 mm。除了个别异常站点外,其余站点对应的MASE均小于1.52 mm,MAPE均小于67.31 mm。总体来说,作为一种客观预测方法,CEEMDAN-SE-ARIMA组合模型对东北地区绝大部分站点的夏季降水预测准确性较高,预测性能较好,说明该模型具有一定的区域适用性和稳定性。
图6为独立检验期的实测值和预测值的空间分布对比。从图6可以看出各年实况与预测的雨带分布位置基本对应,大值中心走向基本一致。其中,西北部区域的预测效果最好,这可能是由该区域降水量较少,降水变率较小导致的;其次,组合模型对东部和南部区域的降水极值分布中心预测较为准确;最后,该模型对东北夏季降水量的空间分布特征有着较好的预测效果,但在具体数值的预测程度上略显不足。总体而言,CEEMDAN-SE-ARIMA组合模型在东北地区100个站点夏季降水预测中仍然有着良好的效果。
3 结论
本文构建了一个新的多尺度组合预测模型,首先基于CEEMDAN方法对站点夏季降水时间序列进行分解,其次计算分解得到的各本征模态分量的样本熵,根据熵值大小将相近的分量进行重构,然后对重构得到的新分量序列进行ARIMA建模,最后将各分量预测值叠加得到模型预测值。对东北地区5个典型站点夏季降水量进行预测分析和效果评估,并将该组合模型推广到东北地区其他站点,结果表明:
1)REOF分析将东北地区划分为南部、东北部、西南部、东南部和西北部5个夏季降水量变化特征区域。相对而言,第Ⅰ区域夏季降水量较多,第Ⅱ区域和第Ⅲ区域次之,第Ⅳ区域和第Ⅴ区域较少。
2)CEEMDAN方法能够有效地分解出降水的随机扰动响应、周期性响应和整体趋势响应。相较EEMD分解,能显著提高模型的预测效果。提高的程度在降水量偏少的地方比降水量偏多的地方要大,例如:绥化CEEMDAN-ARIMA模型的RMSE比EEMD-ARIMA模型降低了6.27 mm,而嫩江则降低了19.17 mm。
3)SE算法通过重构分量,不仅可以大大地减少预测计算量,而且也可以提高模型的预测准确性和稳定性。特别地,经过SE算法重构,模型的MAE降低了4.02~18.40 mm;MAPE降低了1.08~3.54 mm。
4)基于不同区域、不同气候类型的夏季降水序列,本文提出的CEEMDAN-SE-ARIMA组合模型与其他模型相比,预测准确性提高了1.08~35.53 mm,稳定性提高了3.33~129.84 mm。比较5个站点的MAE和MAPE,新模型在降水量较大的区域稳定性和准确性更好。
5)将CEEMDAN-SE-ARIMA组合模型应用到东北100个站点夏季降水预测中,绝大部分站点的预测性能较好。模型对东北地区夏季降水基本空间分布和雨带位置的预測较为准确,泛化能力较强。
参考文献(References)
陈沪生,周玉良,周平,等,2019.基于小波和ARIMA的黄山市年降水量分析及预测[J].南水北调与水利科技,17(5):50-55. Chen H S,Zhou Y L,Zhou P,et al.,2019.Analysis and prediction of annual precipitation in Huangshan City based on wavelet and ARIMA[J].South North Water Transf Water Sci& Technol,17(5):50-55.doi:10.13476/j.cnki.nsbdqk.2019.0109.(in Chinese).
崔金鑫,邹辉文,2020.基于CEEMDAN-MR-PE-NLE多频优化组合模型的碳金融市场价格预测[J].数学的实践与认识,50(3):105-120. Cui J X,Zou H W,2020.Carbon financial market price forecasting based on CEEMDAN-MR-PE-NLE multi-frequency optimization combined model[J].Math Pract Theory,50(3):105-120.(in Chinese).
陈璐,2019.基于LSTM模型的金融时间序列预测算法研究[D].黑龙江:哈尔滨工业大学. Chen L,2019.Research on financial time series forecasting algorithm based on LSTM model[D].Heilongjiang:Harbin Institute of Technology.(in Chinese).
陈国鼎,荆海晓,李小宝,等,2018.基于经验模态分解与传统水文分析法的降雨序列研究[J].水利水电技术,49(11):8-14. Chen G D,Jing H X,Li X B,et al.,2018.Study on rainfall time series based on empirical mode decomposition and traditional hydrological methods[J].Water Resour Hydropower Eng,49(11):8-14.doi:10.13928/j.cnki.wrahe.2018.11.002.(in Chinese).
顾伟宗,张莉,伯忠凯,等,2018.不同时间尺度上黄淮地区夏季降水异常成因及预测研究[J].大气科学学报,41(3):388-394. Gu W Z,Zhang L,Bo Z K,et al.,2018.Study on the causes and prediction of summer precipitation in the Huanghuai area on different time scales[J].Trans Atmos Sci,41(3):388-394.doi:10.13878/j.cnki.dqkxxb.20170405001.(in Chinese).
郭品文,郎丽玲,2017.ENSO与中国东部夏季降水异常关系的年代际变化[J].大气科学学报,40(4):463-472. Guo P W,Lang L L,2017.Interdecadal variation of the relationship between ENSO and East-China summer rainfall[J].Trans Atmos Sci,40(4):463-472.doi:10.13878/j.cnki.dqkxxb.20150117001.(in Chinese).
黄金,吴庆良,陈钒,2020.基于CEEMDAN-WPT联合去噪的灾后求救信号能量分布特征研究[J].南京理工大学学报,44(2):194-201. Huang J,Wu Q L,Chen F,2020.Study on energy distribution character about post-disaster rescue signal based on CEEMDAN-WPT denoising[J].J Nanjing UnivSci Technol,44(2):194-201.doi:10.14177/j.cnki.32-1397n.2020.44.02.010.(in Chinese).
贺玉琪,王栋,王远坤,2019.BRR-SVR月降水量预测优化模型[J].水利学报,50(12):1529-1537. He Y Q,Wang D,Wang Y K,2019.BRR-SVR optimization model for monthly precipitation prediction[J].J Hydraul Eng,50(12):1529-1537.doi:10.13243/j.cnki.slxb.20190479.(in Chinese).
黄春艳,韩志伟,畅建霞,等,2017.基于EEMD和GRNN的降水量序列预测研究[J].人民黄河,39(5):26-28. Huang C Y,Han Z W,Chang J X,et al.,2017.Prediction analysis of rainfall series based on EEMD and GRNN model[J].Yellow River,39(5):26-28.doi:10.3969/j.issn.1000-1379.2017.05.007.(in Chinese).
韩庆阳,孙强,王晓东,等,2015.CEEMDAN去噪在拉曼光谱中的应用研究[J].激光与光电子学进展,52(11):274-280. Han Q Y,Sun Q,Wang X D,et al.,2015.Application of CEEMDAN in Raman spectroscopy denoising[J].Laser & Optoelectron Prog,52(11):274-280.doi:10.3788/LOP52.113003.(in Chinese).
Huang N E,Shen Z,Long S R,et al.,1998.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc R SocLond A,454(1971):903-995.doi:10.1098/rspa.1998.0193.
贾小龙,王谦谦,2006.东北地区汛期降水异常的大氣环流特征分析[J].高原气象,25(2):309-318. Jia X L,Wang Q Q,2006.Analyses on general circulation character of precipitation anomaly in Northeast China flood season[J].Plateau Meteor,25(2):309-318.doi:10.3321/j.issn:1000-0534.2006.02.018.(in Chinese).
江志红,丁裕国,1994.近40年我国降水量年际变化的区域性特征[J].南京气象学院学报,17(1):72-78. Jiang Z H,Ding Y G,1994.Regional features of interannual variation of rainfall over China over the past 4 decades[J].J Nanjing Inst Meteorol,17(1):72-78.(in Chinese).
李宁,刘瑜,王大刚,2019.基于ARIMA和EEMD的东江流域季节降水预报研究[J].人民珠江,40(3):52-58,70. Li N,Liu Y,Wang D G,2019.Seasonal precipitation forecast study based on ARIMA and EEMD in the Dongjiang River Basin[J].Pearl River,40(3):52-58,70.doi:10.3969/j.issn.1001-9235.2019.03.010.(in Chinese).
李智强,邹红霞,齐斌,等,2020.基于EEMD-ARIMA的年降水预测拟合模型研究[J].计算机应用与软件,37(11):46-50,78. Li Z Q,Zou H X,Qi B,et al.,2020.A fitting model of annual precipitation prediction based on eemd-arima[J].Comput Appl Softw,37(11):46-50,78.doi:10.3969/j.issn.1000-386x.2020.11.008.(in Chinese).
刘莉,叶文,2010.基于BP神经网络时间序列模型的降水量预测[J].水资源与水工程学报,21(5):156-159. Liu L,Ye W,2010.Precipitation prediction of time series model based on BP artificial neural network[J].J Water Resour Water Eng,21(5):156-159.(in Chinese).
廉毅,沈柏竹,高枞亭,等,2003.东亚夏季风在中国东北区建立的标准、日期及其主要特征分析[J].气象学报,61(5):548-558,643. Lian Y,Shen B Z,Gao Z T,et al.,2003.The study of the on-set criterion and the date of east Asian summer monsoon in Northeast China and its main characteristic analysis[J].Acta Meteorol Sin,61(5):548-558,643.doi:10.3321/j.issn:0577-6619.2003.05.004.(in Chinese).
马佳佳,苏怀智,王颖慧,2021.基于EEMD-LSTM-MLR的大坝变形组合预测模型[J].长江科学院院报,38(5):47-54. Ma J J,Su H Z,Wang Y H,2021.Combinatorial prediction model for dam deformation based on EEMD-LSTM-MLR[J].J Yangtze River Sci Res Inst,38(5):47-54.doi:10.11988/ckyyb.20200705.(in Chinese).
North G R,Bell T L,Cahalan R F,et al.,1982.Sampling errors in the estimation of empirical orthogonal functions[J].Mon Wea Rev,110(7):699-706.doi:10.1175/1520-0493(1982)110<0699:seiteo>2.0.co;2.
潘留杰,张宏芳,陈小婷,等,2018.秦岭及周边地区夏季降水的主模态分析[J].大气科学学报,41(3):377-387. Pan L J,Zhang H F,Chen X T,et al.,2018.Dominant modes of summer precipitation in Qinling and surrounding areas[J].Trans Atmos Sci,41(3):377-387.doi:10.13878/j.cnki.dqkxxb.20161019001.(in Chinese).
Pincus S M,1991.Approximate entropy as a measure of system complexity[J].Proc Natl Acad Sci USA,88(6):2297-2301.doi:10.1073/pnas.88.6.2297.
沈皓俊,罗勇,赵宗慈,等,2020.基于LSTM网络的中国夏季降水预测研究[J].气候变化研究进展,16(3):263-275. Shen H J,Luo Y,Zhao Z C,et al.,2020.Prediction of summer precipitation in China based on LSTM network[J].Clim Change Res,16(3):263-275.doi:10.12006/j.issn.1673-1719.2019.067.(in Chinese).
苏京志,2019.降水时间随机性对月总降水量的影响[J].大气科学学报,42(1):109-116. Su J Z,2019.The influence of temporally-random precipitation on monthly total precipitation[J].Trans Atmos Sci,42(1):109-116.doi:10.13878/j.cnki.dqkxxb.20180929001.(in Chinese).
田俊武,尚松浩,孙丽艳,等,2005.山西潇河灌区参考作物腾发量和降水的随机特性[J].农业工程学报,21(10):26-30. Tian J W,Shang S H,Sun L Y,et al.,2005.Stochastic characters of reference evapotranspiration and precipitation of Xiaohe Irrigation Areas,Shanxi Province[J].Trans Chin Soc Agric Eng,21(10):26-30.doi:10.3321/j.issn:1002-6819.2005.10.007.(in Chinese).
Torres M E,Colominas M A,Schlotthauer G,et al.,2011.A complete ensemble empirical mode decomposition with adaptive noise[C]//2011 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).Prague,Czech Republic.IEEE,4144-4147.doi:10.1109/ICASSP.2011.5947265.
王丽娟,邓方俊,陈小素,2020.近45 a浙江连阴雨时空分布的环流特征及成因[J].大气科学学报,43(4):707-717. Wang L J,Deng F J,Chen X S,2020.Circulation characteristics and causes of time-space distribution of continuous rainy weather in Zhejiang Province over the past 45 years[J].Trans Atmos Sci,43(4):707-717.doi:10.13878/j.cnki.dqkxxb.20190513001.(in Chinese).
王书平,魏晓萌,2017.基于CEEMDAN分解的北京市电力消费预测研究[C]//第十九届中国管理科学学术年会论文集.南京:771-779. Wang S P,Wei X M,2017.Power consumption prediction of Beijing based on CEEMDAN decomposition[C].Proceedings of the 19th Chinese Conference on Management Science.Nanjing:771-779.(in Chinese).
王文,任冉,李耀辉,2014.基于EEMD的黃河中上游夏季降水预报方法的研究[J].气象科学,34(3):261-266. Wang W,Ren R,Li Y H,2014.Summer rainfall prediction in the upper and middle reaches of the Yellow River with EEMD method[J].J Meteorol Sci,34(3):261-266.doi:10.3969/2014jms.0004.(in Chinese).
Wu Z H,Huang N E,2009.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Adv Adapt Data Anal,1(1):1-41.doi:10.1142/s1793536909000047.
王婉,姚展予,2009.人工增雨统计检验结果准确度分析[J].气象科技,37(2):209-215. Wang W,Yao Z Y,2009.Accuracy analysis of statistical evaluation result in precipitation enhancement experiment[J].Meteor Sci Technol,37(2):209-215.doi:10.19517/j.1671-6345.2009.02.020.(in Chinese).
余洋,万定生,2019.基于WNN-SVM的水文时间序列预测方法研究[J].计算机技术与发展,(09):13-17,70. Yu Y,Wan D S,2019.Study on hydrological time series prediction method based on WNN-SVM[J].Computer Technology and Development,(09):13-17,70.(in Chinese).
杨斌,杨世海,曹晓冬,等,2019.基于EMD-QRF的用户负荷概率密度预测[J].电力系统保护与控制,47(16):1-7. Yang B,Yang S H,Cao X D,et al.,2019.Short-term consumer load probability density forecasting based on EMD-QRF[J].Power SystProt Control,47(16):1-7.doi:10.19783/j.cnki.pspc.181207.(in Chinese).
赵俊虎,熊开国,陈丽娟,2020.东北夏季降水预测技巧偏低的原因探讨[J].大气科学,44(5):913-934. Zhao J H,Xiong K G,Chen L J,2020.The causes of low predictive skills of precipitation in flood season in Northeast China[J].Chin J Atmos Sci,44(5):913-934.doi:10.3878/j.issn.1006-9895.1911.19132.(in Chinese).
朱利明,卓静超,邢世玲,2020.基于CEEMDAN-NAR-ARIMA组合模型的桥梁结构健康监测应变预测[J].科学技术与工程,20(4):1639-1644.Zhu L M,Zhuo J C,Xing S L,2020.Strain prediction of bridge structural health monitoring based on CEEMDAN-NAR-ARIMA combination model[J].Sci Technol Eng,20(4):1639-1644.(in Chinese).
赵春雨,王冀,严晓瑜,等,2009.东北地区冬季降雪的气候特征及其区划[J].自然灾害学报,18(5):29-35. Zhao C Y,Wang J,Yan X Y,et al.,2009.Climatic characteristics and regionalization of winter snowfall in Northeast China[J].J Nat Disasters,18(5):29-35.doi:10.3969/j.issn.1004-4574.2009.05.005.(in Chinese).
赵会茹,张士营,赵一航,等,2021.基于自适应噪声完备经验模态分解-样本熵-长短期记忆神经网络和核密度估计的短期电力负荷区间预测[J].现代电力,38(2):138-146. Zhao H R,Zhang S Y,Zhao Y H,et al.,2021.Short-term power load interval prediction based on CEEMDAN-SE-LSTM and KDE[J].Mod Electr Power,38(2):138-146.doi:10.19725/j.cnki.1007-2322.2020.0329.(in Chinese).
This paper proposes a combination model based on CEEMDAN-SE-ARIMA that aims to address the shortcomings of traditional time series models that cannot effectively predict modal aliased data.The proposed modelcombines the advantages of the complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN),the high short-term prediction accuracy of an auto-regressive integrated moving average model (ARIMA),and the fast efficiency of sample entropy (SE) reconstruction.The model is empirically analyzed for summer precipitation in Northeast China from 2016 to 2020.First,based on the fully adaptive ensemble empirical mode decomposition method,the precipitation time series is decomposed into multiple eigenmode components,and the component sequence is reconstructed according to the calculation results of the entropy of different component samples.Then,for each reconstruction component,an autoregressive moving average forecast model is constructed.Finally,the predicted value of each component is superimposed to obtain the predicted value of the combined model.Additionally,the ARIMA single model and other combined modelsare constructed to be compared with the CEEMDAN-SE-ARIMA combined model.The results show that the CEEMDAN-SE-ARIMA combined accounts for the time series modal aliasing characteristics,effectively improves the forecasting ability of the summer precipitation time series model in Northeast China,and has good forecast application value.Compared with the single model and other combined models,the forecast results are improved.MASE decreases by 0.02—0.91 mm,RMSE decreases by 0.80—130.49 mm,MAE decreases by 2.52—129.84 mm,and MAPE decreases by 1.08—35.53 mm.The CEEMDAN-SE-ARIMA model has a better prediction effect in the northwest region,where the precipitation variability is small,and the prediction of the extreme value distribution center in the southeast region is more accurate.
summer precipitation in Northeast China;modal aliasing;CEEMDAN;SE;ARIMA
doi:10.13878/j.cnki.dqkxxb.20210513001
(責任编辑:袁东敏)