• 谷歌scholor
  • 观点:1887

  • PDF下载:293

河流流量的时间序列建模与预测

Rashmi尼噶的1,Sohail Bux.2, Sudhir尼噶的1,投资者Pardasani1”栏目,米塔尔1和Ruhi Haque1

1曼尼特数学系,博帕尔,462 003印度。

2机械工程系,曼尼特,博帕尔,462 003印度。

DOI:http://dx.doi.org/10.12944/cwe.4.1.11

改变气候,人类干预到天然水流模式,随意城市化等,即使在开发溢流控制的结构措施的发展方面也是强烈洪水的原因。Kulfo River Basin位于埃塞俄比亚的相对干燥的南部地区,仍然采用丘陵地形和防渗土壤纹理地理改造。本研究的关注是模拟洪水集,以便开发洪水管理策略以减少灾难。将其视为随机过程,可以更好地表达自然水文现象和依赖随机变量的复杂性。利用随机Arima的每月径流数据预测Kulfo River的洪水(最大河流)预测,时间序列模型用于警告目的。对季节性变化的放电数据序列的分析表明,高阶ARIMA模型可能会产生三到六个月的预测结果。


随机;流模式;ARIMA模型;洪水;常年性河流

复制以下内容以引用本文:

Nigam R, Bux S, Nigam S, Pardasani K.R, Mittal S.K, Haque R.时间序列建模和河流流量预测。环境科学学报2009;4 (1):79-87 DOI:http://dx.doi.org/10.12944/cwe.4.1.11

复制以下内容以引用此URL:

Nigam R, Bux S, Nigam S, Pardasani K.R, Mittal S.K, Haque R.时间序列建模和河流流量预测。环境科学学报2009;4(1):79-87。可以从://www.a-i-l-s-a.com/?p=895


下载一篇文章(pdf)
引用管理器
发布历史


文章出版历史

已收到: 2009-03-10
接受: 2009-05-03

介绍

水文信息学的重点是应用先进的信息技术和统计工具,以更好地理解和管理水文现象。水文现象在本质上是周期性和随机性的。在水文信息学中,河流被认为是一种基于水的资产,其流动模式在很大程度上是随机的。河流既可以看作具有流动特性的一般对象,也可以看作具有自身独特特性的特殊对象。河流洪水管理所需的重要信息是关于河流过去和现在的径流和覆盖河流流域的治理降雨数据,再加上关于人类维度的派生信息,历史、社会学、法律、经济甚至政治方面(Patel和Shete, 2007)。

物理模型是估计洪水事件的最有效的方法,因为这些模型建立了物理知识,如洪水平原的尺寸、气象参数的变化、径流系数、粗糙度值、水头损失等。然而,当需要非常快速地预测流动模式时,例如,在预测情况中,或者当运行长时间序列时,或者需要蒙特卡洛分析时,那么基于物理的模型就很麻烦了(Beven, 2001)。现在有许多这样的情况,时间序列分析被用来预测河流中的这类极端事件。时间序列分析允许识别隐藏的确定性行为,从而理解问题中的因果关系(Schwartz和marcus1990)。单变量模型增加了对系统行为的理解。测量值的变化是过去几个月发生的时间过程的冲击(提供系统动态sheld常数的预期结果的偏差)的函数。使残差的相关性不超过5%的不显著水平,并尽可能将残差归一化。因此,拟合模型是更好的选择(Murray和Farber, 1982)。

本文试图用随机时间序列预测方法描述河流洪水的发生过程。特别强调了准确的洪水预报和预警,以便在必要时有效地管理洪水灾害。用于理解获取数据的建模形式是时间序列ARIMA建模。对获取和生成的信息进行分析的结果支持了管理现实世界、河流、环境和与之相关的人的决策。


研究区域及资料

研究了基于数据的随机分析方法在多年中型丘陵河流Kulfo的适用性。这条河横跨埃塞俄比亚南部的阿巴亚-查莫盆地。阿巴亚-查莫盆地集水区面积约1.64万平方公里,流域排水面积约3500平方公里。降雨模式大多是不确定的,使库尔福河流域频繁的洪水,尽管年平均降雨量数字。根据降雨强度的不同,这条河的响应时间约为6 ~ 8小时。

为了开发洪水预测模型,需要在与重大风险区域相关的每个子集水区至少有一套连续的流量测量,能够捕捉极端洪流量。此外,应保持关键信息的标准化记录,以促进快速应对洪水。为了简化研究,只选取两个水文变量进行分析。降雨资料由位于河流1公里范围内的气象站收集,并在阿坝亚湖附近的河流泄水点安装了雨量计,测量了河流流量。图1以可比形式给出了单个降雨月平均降雨量(MMR)和月平均流量(MMD)时间序列的时间图,以揭示MMD与MMR数据集的定量一致性。数据范围采用自1990年1月起至1998年底的逐月累计8年数据。

图1显示了对数据库质量和每个变量的独立程度的检查。从这些图中,我们推断数据的行为是标准化的,并且在数据中分布是均匀的,具有循环性质。降雨量和河流量之间的关系是线性的或非常接近线性的。1996年年底的观测数据有些不一致,即径流量和降雨量在数量上并不同时存在。其确切原因尚不能推断,可能是观测失误或大坝突然泄洪造成的。

图1:Kulfo River的降雨和径流(1990年1月 - 1998年12月)
点击这里查看图


模型开发方法

实时洪水预报可以使用统计、随机、确定性和软计算技术。当一种现象的发生和结果,如在自然过程中,是随机的或不确定的,这个过程的特征是随机的(Priyan和Dalwadi, 2007)。在水文现象中,降雨是主要的现象,而径流是其首要的相关结果。降雨和径流都是空间和时间的函数,并在地理和暂时(和季节性)上共变。因此,洪水也是降雨和径流的结果,可以智能地表示和预测使用历史径流数据的随机建模。随机模型能够很好地捕捉自然洪水的突然变化,但洪水数据的差异影响了预测结果。

按时间顺序观测的降雨和径流构成时间序列。应用Box - Jenkins方法可以分析随机时间序列水文现象的内在因果关系(Box and Jenkin, 1994)。Box- Jenkins方法使用了自回归整合和移动平均(ARIMA)建模的概念,其中因变量是滞后回归到自身并进行平滑,从而产生ARMA和相关的ARIMA和SARIMA模型(S代表季节回归时间序列)。这些模型适用于平稳序列,其中均值没有系统性变化(即序列已去训练),方差随时间不变(Kendall and Ord, 1992)。

表1:季节arima模型参数值
点击此处查看表格


通过估计自相关函数,分析了变量间的依赖程度。多党民主运动系列。这些结果在95%置信水平或两倍的标准偏差0.068(使用1/n½,其中n = 84)观测变量的总数。一般非季节性ARIMA模型可以写成

(11B2B². .pBpdzt= (1 -1B -2B²-..-B一个t


其中at为残差级数,B后移算子定义为BZt= Z.t - 1, B²Zt = Z2其中φ项和θ项分别表示p阶自回归和q阶移动平均过程的系数值。当某一个月的观测zt与上一年同期的观测有一定关系时,季节相关性将方程修正为:

(11B2B2年代..pBps年代Dzt= (1 -1B年代-2B2 s-..-BQset

其中et为正态随机偏差,季节性s = 12, Θ和Φ给出的项表示相应的Q阶和p阶的季节移动平均算子和自回归算子。因此,结合非季节方程和季节方程,得到了阶(p,d,q) x (p,d,q)的一般乘性季节ARIMA模型

pB年代pB年代Dzt(B年代) -(B)t

结果与讨论

模型开发过程

本研究的目的是首先基于Box-Jenkins方法确定一个合适的ARIMA模型。以来降雨,因此河流径流是一个季节性的现象,我们需要确定订单(p d q) x (p d q)季节性单变量模型并找出最适合季节性的程度,它提供了一个简洁的表示为随机组件和总考虑。最后,利用时间序列模型参数的最小二乘估计对河流流量进行预测。为了识别ARIMA模型参数(p, d, q)和(p, d, q),绘制了MMD时间序列的自相关系数(ACC)和偏自相关系数(PAC)的不同差分组合(d=0和d=1)和滞后。ARIMA模型构建过程的图形表示如图2所示。原始数据和差分数据已绘制,以检查MMD时间序列的平稳性。模型参数的辨识主要基于时间序列的ACC图和PAC图。Kulfo河的径流显示出很强的季节性模式,ACC和PACC图中也可以看到同样的情况,因此流型需要一个季节性模式。

图2河流MMD时间序列模型构建过程
点击这里查看图


对显著ACC和PAC图的分析表明,MMD序列存在一阶非季节性ARMA和三阶季节性ARIMA参数化。与95%置信限相比,很少有部分自相关(3)被发现是显著的。最终选定的库佛河月平均流量季节ARIMA预报模型为(p,d,q, p,d,q)S =(1,0,1,3,1,3)12。另一个ARIMA模型用不同的参数值尝试,不能得到令人印象深刻的预测。表1给出了季节和非季节情况下各种AR和MA参数的值,并给出了相应系数的标准误差(SE), t和p值。较小的SE系数和对应的t统计量的p值表明了系数估计的显著性和精确性。

图3:实际和模拟的月平均流量
点击这里查看图



将适当变换后的数据拟合到时间序列模型中,得到参数的最小二乘估计。来自单变量过程的残差用于最终选择完整的动态模型。对于模型拟合的每个迭代/阶段,模型充分性的标准是残差应该是独立的(即不存在或可忽略的自相关),模型具有简约性(参数最少)。残差也应该呈现对称分布(例如,正态分布)(Murray等人,1982)。拟合自回归参数的负值说明时间序列变量之间存在一种消去的关系,即它们的作用是降低流量值。

图4拟合arima模型的残差分析
点击这里查看图


预测

建立可靠和稳健分析的过程主要是建立预测不足的极端河流流量模型。这是考虑到这样一个事实,即计算模型仅限于理论分析有效和有足够的数据可用于适当的校准和验证的情况。以1997年1月为起点,预测12个月前的月径流量。从图3可以明显看出,所有12个月的预报结果都合理地接近实际的河流流量,并遵循平均值。即使像1997年10月那样出现了惊人的峰值,这些预测在捕捉径流模式方面也是相当公平的。预测误差在零均值两侧均呈下降趋势,预测值呈线性上升趋势。

图5拟合arima模型的散点分析
点击这里查看图


预测评估

通过应用数据本身的应用,有两种方法来评估模型结果的性能,首先使用已建立的统计公式,而另一个是随机的..剩余分析。后者的重要性是合理的,因为它强调判断内在的数据特征。随机方法的主要优点是,可以通过用于模型建设的相同方法来评估模型性能,并且可以容易地识别模型配方中的任何差异,以便建模者可以立即决定改进模型。前者适用于与自然过程相关的所有模型,在文献中得到充分解释。

表2:河流径流预报的统计评价
点击此处查看表格


初步统计评估

修正的Box-Pierce (Ljung-Box)卡方统计量、t检验和模型预测值的结果如下:

落后

12

24

36

48

卡方

10.4

24.9

42.2

56.3

自由度

3.

15

27

39

假定值

0.015

0.052

0.032

0.036


利用滞后和自由度(DF)对应的卡方值来判断拟合假设的准确性,较小的p值则表示模型拟合的充分性。

随机评价(残差分析)

残差(观测值与预测值/拟合值之间的差值)表示未被拟合模型解释的观测部分。拟合模型后,使用一组5个残差图进行残差分析:

  1. 异常的概率图。
  2. 残差相对于拟合值,
  3. 残差和数据的顺序
  4. 残差的直方图
  5. 残差与预测因子(MMD时间序列的ACF和PACF)。


拟合的时间序列模型由正常分布但恒定的残差表示,不作为响应变量的函数表现出任何模式(趋势,季节性,循环等)。径流数据的残余分析如图4所示,揭示了这一点

  • 残差直方图可以清楚地看出,大部分残差都集中在一个很小的零范围内。残差的很大一部分是负的,并且在很窄的范围内,表明模型适合拖拽数据的最优滤波。
  • 残差的正态概率图也证实了残差的集中趋势在±1.5之间,即95%以上的残差是正态分布且是常数,即它们作为响应变量的函数不呈现趋势。
  • 残差与数据顺序的曲线表明,大多数残留值均在±5%以至50°以下。
  • 残差与拟合值的图显示,约99%的残差值落在±5%内,残差的范围位于拟合值的10内。


对于一个最佳拟合的时间序列模型,残差应该是不显著的,它们的自相关应该是弱的95%置信范围内。残差自相关和偏自相关的曲线图清楚地显示,残差的ACF和PACF直到lag 12才占主导地位,即残差的ACF和PACF不显著,证实了拟合模型的适用性。残差分析表明残差序列表现为白噪声序列,拟合模型在观测范围内表现良好。

综合统计评价

模型评价分析从单变量分析开始。观测数据和模拟数据在标准差和偏度上的定量接近预测了模型预测的初步价值。配对观察和预测之间的散点图(图5)揭示了模型超出或不足预测的幅度和分布。

与一对明智匹配的观察的模型估计或预测的统计比较仍然是评估水文研究中模型性能的最基本方法之一。汉纳和昌(2004)和ASTM(2000)提出了一些全面的统计模型性能措施,包括分数偏压(FB),几何平均偏置(MG),归一化均方误差(NMSE),几何方差(VG),相关系数(R),协议指数和一系列观察范围内的预测分数(FAC2)。通过对象的详细讨论可以在NiGam提及,(2008)。平均误差或偏差是判断模型预测是否准确的基础。误差之间的一般关系为MBE≤MAE≤RMSE。

根据Oreskes等人(1994),自然系统的数学模型的评价(验证和验证)是不可能的,因为自然系统从来都不是封闭的,因为模型解总是不唯一的。这个过程的随机性导致了某种不可减少的固有不确定性。因此,模型只能通过几组观测和预测之间的良好一致性来证实或评估。

这些参数的数值在表2中给出了两种情况,首先具有真实预测,另一个用于均于2的均衡预测。这些标准提供了更多关于模型模拟中固有的系统和动态误差的更多信息。完美的模型将具有MG,VG,R和FAC2 = 1.0;和fb和nmse = 0.0。修改的性能值可归因于隐含的平均预测(博伊尔et al。,2000)。


结论

一阶自回归参数表明在随机分量中有很大程度的可变性和依赖性;在最小的流域中,一阶参数的支配性最高。另一方面,高阶持久性的值说明随机分量对过去事件的依赖性相当一致。结果表明,模拟值与观测值吻合较好。在前三个月,模拟值与实际值非常接近,并且过高预测,这是水文模型的理想结果。

从第3个月到第6个月,3个模拟值与实际径流的观测模式有很好的一致性,因此可以认为是肯定的模式贡献。6个月后,模拟值的模式是明智的,以捕获峰值流量以及过去的流的模式。但是,模型预测的数量结果是不一致的,由于预测不足的性质,不能用于预测目的。虽然残差研究在很大程度上证实了模型对12个月前预测的适用性,但考虑到预测值的实际需求,模型仅对6个月的预测具有公允性。

研究表明,ARIMA模型是模拟水文数据的一种合适的方法,由于水文数据往往具有随时间的自相关性,需要对其背后的动态进行合理的解释,而这是简单的统计预测方法如回归分析等无法做到的。Box-Jenkins方法考虑变量之间的自相关以及变量之间的滞后关系。如果我们在MMD序列中加入降雨数据的影响,即多变量方法,将有助于在时间序列分析中获得可靠的因果关系假设。


参考文献

  1. ASTM,“大气弥散模型性能统计评估的标准指南”,D6589,美国试验和材料学会,康肖霍肯,PA 19428-2959 (2000)
  2. 贝文,j.k.。”降雨径流模型- Primer,”John Wiley & Sons Ltd., Chichester, 319(2001)。
  3. Box, g.e.p., Jenkins, g.m.,和Reinsel, g.c.,“时间序列分析,预测和控制,”第三版,Prentice Hall, Englewood Cliffs(1994)。
  4. Boyle, d.p., Gupta, h.v.,和Sorooshian, S.,“改进水文模型校准:结合手动和自动方法的优点”,水资源,石油学报,2000,36(12):3663-3674。
  5. Hanna, S.R.和Chang, j.c.,“空气质量模型性能评估”。杂志气象学和大气物理学”(2004)87:167 - 196。
  6. 陈志强,“时间序列的预测”,《国际预测杂志》,(1992)4:532-533
  7. Legates, D. R.和McCabe Jr., G. J.,“在水文和水文气候模型验证中评估拟合优度测量的使用”,水资源,(1999) 35(1): 233-241。
  8. 默里,L.C.和FARBER,R.J.,“历史可见性数据库的时间序列分析”,大气环境(1982) 16 (10):2299-2308。
  9. Nigam, S., Kulshrestha, M., Mittal, S., and Singh, K.,“拥挤交通条件下空气污染物的计算模型”,“缓解发展中国家混合交通城市街道拥堵的最佳实践国际会议”,印度理工学院金奈,联合出版社pv . Ltd.,印度,(2008)389-400。
  10. Patel,N.R.和Shete,D.T.,“北古吉拉特地区Sabarkantha区连续日降雨数据的概率分布分析”,Elite Publishing House PVT发表的SVNIT,SVNIT,SVNIT,SVNIT。Ltd.,印度,(2007)86-93。
  11. Priyan,K.和Dalwadi,H.J.,“水文数据的统计分析:湄河流域研究,”精英出版社PVT发表的SVNIT,SVNIT,SVNIT,SVNIT。Ltd.,印度,(2007)16-23。
  12. 《伦敦的死亡率和空气污染:一个时间序列分析》,美国流行病学杂志,105年(1990年):1273 - 1281。
  13. 威尔莫特,《模型评估和比较的统计数据》,杂志地球物理学研究中,(1985) 90 (5): 8995 - 9005
    Creative Commons许可
    这个作品是根据知识共享署名4.0国际许可