• 谷歌scholor
  • 意见:2004年

  • PDF下载:552

月流程预测的不确定性分析

Majid Dehghan1,Bahram Saghafian1, Firoozeh Rivaz1和Ahmad Khodadadi3.

1技术与工程系,伊斯兰亚萨德大学,德黑兰,伊朗伊斯兰教大学科学和研究分公司。

2伊朗德黑兰Shahid Beheshti大学数学系。

DOI:http://dx.doi.org/10.12944/cwe.9.3.40

流流量预测是水资源规划与管理的重要因素。在本研究中,前向前人工神经网络(FFANN)用于每月流流程预测。考虑了三种情况进行建模。主成分分析(PCA)用于降低模型架构复杂性和输入数据减少。二十次统计标准用于评估模型性能。还用于量化预测的准确性,使用蒙特卡罗模拟进行不确定性分析。结果表明,该模型一般能够令人满意地预测每月流流时间序列。然而,模型在极端值下低估。此外,不确定分析表明,在第三种情况下,在前两个方案中正确地预测了每月流流时间序列的型号,而大多数预测值都会摆脱上置信区间。

streaflow;PCA,ANN;不确定

复制以下内容以引用本文:

王志强,王志强,王志强,等。月径流预测的不确定性分析。Curr World Environ 2014;9 (3) DOI:http://dx.doi.org/10.12944/cwe.9.3.40

复制以下内容以引用此URL:

王志强,王志强,王志强,等。月径流预测的不确定性分析。Curr World Environ 2014;9(3)。可以从://www.a-i-l-s-a.com/?p=7385


下载文章(PDF)
引用管理器
发布历史


文章出版历史

已收到: 2014-09-24
接受: 2014-10-30

介绍

河流流量预测是可持续发展的一个重要组成部分,是基于环境问题的。自20世纪中叶以来,它一直是研究人员的一个重要课题。不同的方法,如回归(Sun et al. 2014;Rehman and Saleem, 2014, Dehghani et al. 2014),概念(Jain and Srinivasulu, 2006;Xu et al. 1996)和intelligent(He et al. 2014;Liu et al. 2014;Sudheer et al. 2014)模型用于溪流流量预测。人工智能模型,特别是人工神经网络(ann),已经在许多研究中应用于河流流量预测。人工神经网络(ANN)是一种非线性黑箱统计方法(Kalteh, 2013)。人工神经网络适用于处理普遍存在于水文过程中的内在特征(Fajardo Toro, 2013)。 ANN is appropriate for the problems which the input is high dimensional, data are possibly noisy and not important to know the weights. Literatures in the last two decades show a high interest in using ANN for hydro logical processes, forecasting and different ANN architectures were used for this purpose. Most studies have been done by feed forward error back propagation(Karunanithi et al., 1994; Kisi, 2004). The standard back propagation algorithm (SBPA) has some problems including very low speed training convergence and easy entrapment in a local minimum (Haykin, 1999). The Levenberg-Marquite algorithm proposed as a training function to overcome these problems.

人工神经网络规划中存在的问题之一是网络结构复杂,导致网络结构复杂。Coulibaly et al.(2000)利用Stop Training Algorithm (STA)来解决这一问题。有可能找到导致网络结构简单的几个有效因素。输入选择是神经网络实现的关键步骤。缺乏相关的输入妨碍了网络应用程序将输入映射为观测到的流的近距离估计。如果ann中权值的个数在一定程度上大于训练ann时的样本个数,就可能造成“过拟合”(Haykin, 1999)。在大量输入变量的情况下,输入变量之间的相关性概率增大,人工神经网络很难找到最优的模型。因此,如果可能的话,它建议减少输入变量,即使这会导致一些信息被忽略。主成分分析(PCA)是一种合适的数据简化方法(Dehghani et al. 2014;Noori et al. 2011)。 PCA has been used widely in different environmental issues.

预测总是伴随着不确定性。这意味着预测值不会一直准确地发生它们会围绕预测值振荡。因此,研究与预测值相关的不确定性是环境过程预测中的一个重要问题。在过去的几十年里,不同的方法被用于不确定性分析(Dehghani et al. 2014;Zhao et al. 2011;Viola et al. 2009)。蒙特卡罗模拟是不确定性分析中最常用的方法之一。通过不确定性分析和置信区间的确定,可以使水资源决策者更好地了解未来早期的水资源,并根据这些信息进行决策。

本文结合上述解释,采用人工神经网络对月流量进行预测。并采用蒙特卡罗模拟法对预测值的不确定性进行了研究。在第2节和第3节中,分别描述了研究领域和方法。模型性能和讨论将在第4节中介绍,结论将在第5节中得出。

研究区域和资料

Great Karun盆地位于伊朗西南部(图1),面积为67112千米2在波斯湾的入口处。该盆地生产了伊朗25%以上的地表水资源,对该地区人类生活的农业、社会和环境方面产生了重大影响。
图1:伟大的Karun盆地边界
点击这里查看图

基于该盆地的高地表水潜力,为不同的用户提供水和发电,水文逻辑研究和水流预测对有效的水资源规划和管理至关重要。本研究的重点是大卡伦盆地内的德兹河次盆地。图2为研究区域及所选区域的水文站网。选择迪兹网支流的原因是,一些下游站的数据可能已经受到上游取水的影响。然而,在支流中用水量可以忽略不计。因此,德兹河水系的一部分,直到Sepiddasht水电站被指定为研究区域。
图2:研究区边界
水文测量站的位置

点击这里查看图

本研究共对7个水电站进行了研究。参照图2,该站分别是Rahimabad、Dorudtire、Sepiddasht、Chamchit、Moruk、Daretakht和Dorudmarbere。所有台站都有1955年至2009年共648个月的流量数据。表1是所有水文测站的月流量统计。流量变异系数在1和1.95之间振荡。这是地中海气候盆地中水流的典型特征,这使得预测成为一项具有挑战性的任务。

表1:研究的水文测量站的月流量统计

统计数据

Rahimabad

莫鲁克

Dorodtire

Daretakht

Dorodmarbere.

Chamchit

Sepiddasht

最大(CMS)

41.86

53.70

156.89

82.16

197.17

76.57

123.68

分钟(CMS)

0.01

0.00

0.37

0.00

0.74

1.05

2.00

意思是(CMS)

5.37

4.39

15.45

3.45

9.21

7.34

18.60

标准偏差(CMS)

5.38

6.92

19.86

6.72

13.07

7.50

19.26

变异系数

1.00

1.58

1.28

1.95

1.42

1.02

1.04



方法

人工神经网络

ANN的习惯结构由三层神经元组成:输入层、隐藏层和输出层(Haykin, 1999)。神经元的反应是根据一个激活函数,基于所有输入的加权和。本研究采用前馈网络,因为前馈神经网络已被证明比其他范式具有计算优势(Hornik et al., 1989)。通过分裂验证过程,采用反向传播算法对网络进行训练。可用数据分为三个集:训练集、验证集和测试集。训练集用于拟合ANN模型权重,验证以选择提供最佳泛化水平的模型变体,测试集用于根据剩余数据评估所选模型。神经元的数量在2到6之间是通过试验和错误选择的。将所有的输入和输出变量标准化为[0.1,0.9]量表(Rajurkar et al., 2004):




其中x是输入变量,x最小值和X.最大限度输入变量和x的最小值和最大值n为标准值。

神经网络中需要确定的权值总数为,(Ninp. +1x hid + (N隐藏x1 + 1)对于一个隐藏层。这基本上解释了各层神经元之间的所有连接。隐藏层中的神经元数量增加了需要拟合的连接数量和权重。这个数目不能无限制地增加,因为可能会出现需要拟合的连接数目大于可用于训练的数据对数目的情况。虽然神经网络仍然可以训练,但这种情况在数学上是不确定的。在数学上,不可能确定比可用数据点更多的拟合参数。

在本研究中,使用了一个基于单隐层前馈神经网络的模型。采用BP算法对网络进行训练。BP算法本质上是一种梯度下降技术,使网络误差函数最小化(Haykin, 1999)。

主要成分分析

主成分分析(PCA)是一种识别数据中模式的方法。这是一个强大的工具,可以减少数据的高度,特别是当数据集高度相关时。输入变量被更改为独立的PC,即输入变量的信息在PC中的最小损耗呈现(Helena等,2000; Noori等,2011)。由下面的等式指定的PC。



在Z代表PCS,a特征向量和X是相关的吗也是输入变量。这一信息通过求解方程(3)得到(Johanson and Wichern,1982)。

| R - Iλ|= 0(3)

式中,I为单位矩阵,R为方差协方差矩阵,为特征值。通过这些特征值,我们可以得到特征向量。Camdevyren et al. (2005), Noori et al. (2011), Helena et al. (2000), Dehghani et al.(2014)等给出了该方法的细节。

模型评价

由于没有单一的评价标准,应用多标准评估ANN技能是很重要的(Dawson et al., 2002;Kumar et al., 2005)。道森等人(2007)总结了一些评价统计数据,这些数据可以通过Hydrotest网站(http://www.hydrotest.org.uk)上的一个基于web的工具箱Hydrotest进行计算。我们应用了12个标准来评估模型的性能。

不确定性分析

为了确定流流预测中的不确定性,在Marce等人介绍的蒙特卡罗框架中实施了ANN建模程序。(2004)。Monte-Carlo仿真涉及从概率分布中重复产生随机参数,然后计算输出的统计信息。在本研究中,引导用于重新采样。输入数据库随机重新尝试,无需更换1000次,维护校准(培训和验证)和测试集之间的比率。由于这种置信区间提供了比与模型相关的预测范围的其他统计值提供更多信息,因此报告了95%的估计置信区间(Noori等,2010C)的情况下,估计的置信区间找到建造分布的2.5和97.5百分位数(Noori等,2009)。

结果与讨论

对于溪流流量预测,考虑了三种情景(表2)。在第一种情景中,每月的溪流流量预测使用Rahimabad和Moruk溪流作为输入。在第二种情景中,利用Sepiddasht站上游的所有水文测站,预测Sepiddasht站的流量。

表2:方案和输入激发器

输入

目标站

场景数量

Rahimabab,Moruk.

Dorudtire

1

Rahimabad、Moruk Dorudtire,

Dorudmarbere、Daretakht Chamchit

Sepiddasht

2

个人电脑

Sepiddasht

3.


在第三种场景中,对第二种场景的输入使用PCA,降低数据的高维性。结果表明,第一个PC复制了84%的方差数据。因此,我们选择第一个PC作为第三个场景的输入。

对于神经网络建模,流流时间序列分为三部分。最后120个月的河流流量分配用于测试,100个月用于验证,其余数据用于训练,然后将模型应用于时间序列。图3 - 5为试验阶段水流的神经网络建模。从图中可以看出,该模型在试验阶段具有较好的性能,特别是对于Dorudtire站而言。然而,人工神经网络模型低估了,特别是在极端值。

图3:观测和预测的月流量
在第一个场景的测试阶段的时间序列

点击这里查看图

图4:每月观察和预测
流流时间序列在测试阶段
第二种情况

点击这里查看图

图5:每月观察和预测
流流时间序列在测试阶段
第三个场景

点击这里查看图


测试阶段的均值、最小值、最大值的观测值和预测值如表3所示。结果表明,模型在最大值和均值上被低估,在最小值上被高估。

表3:测试阶段观测和预测时间序列的月流量统计

预测

观察到的

意思(CMS)

最低(cms)

最大(cms)

意思(CMS)

最低(cms)

最大(cms)

场景数量

12.88

0.62

50.6

9.27

0.4

71.6

1

15.43

2.81

52.28

19.4

2

106.1

2

16.26

8.63

31.31

3.


通常,该模型在Dorudtire站执行更好。模型在所有场景中正确地遵循观察时间序列模式。这是时间序列建模中最重要的因素之一。对于更多调查,对测试阶段计算12个统计标准(表4)。粗体和斜体值显示出更好的性能。
表4:测试阶段对应的统计标准
的月流量预测在各种情况下

点击此处查看表格

前七个标准是关于建模误差估计的。基于这些标准,该模型在Dorudtire车站的性能最佳。对于一个完美的模型来说,这七个参数为零。RAE包括相对于总绝对误差(如果预测只是观测值的平均值)所产生的总绝对误差(Dawson et al. 2007)。RAE值在第一个和第二个场景中更好。剩下的四个指标,包括R、IoAd、CE和PI在其他场景中对于第一个场景有最好的值。在不同情景下波动在0.67和0.92之间。然而,R对观测数据集和模型数据集之间的加性差异和比例差异不敏感,因此,即使模型值与观测值在量级和变异性上存在很大差异,也可以得到较高的值。因此,为了更好地进行判断,我们使用了Nashe-Sutcliffe系数(CE),该系数对观测和建模的均值和方差的差异很敏感。PI为持久性指数,与CE非常相似。 IoAd is used to calculate the index of agreement. In overall the model performance is appropriately acceptable in all scenarios.

通过估计预测的置信区间来量化预测的准确性的实际方法。更广泛的间隔,越小是预测的准确性,反之亦然。Monte Carlo仿真进行了用于在不同场景中设定用于流流预测的上下置信带。95%置信区间的结果显示在图6至8中。


图6:置信区间
第一个情景流程预报

点击这里查看图

图7:流的置信区间
第二个方案的流量预测

点击这里查看图

图8:流的置信区间
第二个方案的流量预测

点击这里查看图


结果表明,在第一种情况下,所有的预测值都在置信区间内。结果表明,在第一种情景下,人工神经网络能较好地预测月流量。在第二个场景中,所有的预测值都在置信区间内,而在第三个场景中,大量的预测值都在置信区间外。在第三个情景中,75%的预测值处于置信区间,表明模型在预测径流方面表现不佳。大部分预测值都在上界外,说明模型不能很好地预测上界。

结论

本研究利用人工神经网络对伊朗Karin盆地的月流量进行了三种情景下的预测。并进行了不确定性分析,预测了置信区间。结果表明,该模型能较好地预测月径流量,但在某些情况下存在高估或低估的情况。然而,有一些考虑。基于统计标准,模型在第一和第二情景下表现良好,而在第三情景下表现较差。结果表明,该模型对输入质量敏感,信息越多,性能越好。因此,使用pc作为输入,模型会丢失一些信息,模型的性能会比其他场景差。反之,使用PC作为输入降低了模型的复杂性。第一和第二种方案的差异可能是由于Seppiddasht水电站上游的取水。除了统计准则外,不确定性分析也为河流流量预测提供了良好的评价。 Monte Carlo simulation which is used in this research is a powerful tool for uncertainty analysis and performed well in the confidence interval prediction.

参考
  1. Camdevyren H., Demyr N., Kanik A., Keskyn S.(2005)。利用多元线性回归模型中的主成分评分预测水库叶绿素a。生态学报,2018,36(5):581-589。
  2. Coulibaly P.,Anctil F.,Bobee B.(2000)。每日水库流入预测使用人工神经网络停止训练方法。J.水文,230:244-257。
  3. 陈勇(2002)。人工神经网络技术在长江流域流量预测中的应用。二聚水分子。地球系统。科学。6: 619 - 626。
  4. Dawson CW, Abrahart RJ,见LM(2007)水文测试:一个基于网络的评估指标工具箱,用于水文预报的标准化评估。环绕。模型。Softw 22:1034 - 1052。
  5. Dehghani M.,Saghafian B.,Nasiri Saleh F.,Farokhnia A.,Noori R.(2014)。利用人工神经网络和蒙特卡罗模拟的流水干旱预报的不确定性分析。int。j。Climatol。,34:1169-1180。
  6. Dehghani M., Saghafian B., Rivaz F., Khodadadi A.(2014)。利用动态时空模型的月流量预测。Stoch环境风险评估。, DOI 10.1007 / s00477 - 014 - 0967 - 3。
  7. Fajardo Toro C.h.,Meire S.G.,GalvezJ.F.,Fdez-Riverola F.(2013)。一种河流流量预测的混合人工智能模型。应用软计算13:3449-3458。
  8. 微积分,年代(1999)。《神经网络:综合基础》(Neural Networks: A Comprehensive Foundation)。“2n艾德,普伦蒂斯霍尔。新泽西。
  9. 何震,闻旭,刘辉,杜军(2014)。人工神经网络、自适应神经模糊推理系统和支持向量机在半干旱山区河流流量预测中的比较研究。中国科学:地球科学,2019,39(4):457 - 461。
  10. 海伦娜,B.,帕尔多,R.,维加,M.,巴拉多,E.,费尔南德斯,JM。,费尔南德斯,L.(2000)。基于主成分分析的冲积含水层(西班牙Pisuerga河)地下水组成的时间演变水资源研究34:807-816。
  11. Hornik K., Stinchcombe M., White H.(1989)。多层前馈网络是一种通用的逼近器。神经网络,2(5):359-366。
  12. 基于人工神经网络和概念技术的流场模型分解方法。中国科学(d辑:地球科学)
  13. 约翰逊R.A.,WICHERD.W.(1982)。应用多元统计分析,Prentice Hall。
  14. kalteh,上午。(2013)。每月河流流量预测使用人工神经网络和支持向量回归模型与小波变换耦合,电脑和地球科学,54:1-8。
  15. Karunanithi,N.,Grenney,W.J.,Whitley,D.和Bovee,K。(1994)。“河流预测的神经网络。”Chine EngineeIrng计算。,8:201-220。
  16. Kisi,O.(2004)。“利用人工神经网络河流模型。”水文工程杂志。,9(1),60-63。
  17. Kumar D.N.,Raju K.S.,Sathish T.(2005)。河流流量预测使用经常性神经网络。Wat。res。管理。,18:143-161。
  18. 刘Z.,周P.,陈G.,Guo L.,(2014)。评估耦合离散小波变换并支持每日和每月流流量预测的向量回归。J.水文,DOI:10.1016 / J.Jhydrol.2014.06.050。
  19. Marce R, Comerma M, Garcia JC, Armengol J.(2004)。估计时变人类影响下流域河流营养负荷的神经模糊建模工具。湖沼与海洋学方法。2:342-355。
  20. Noori R, Abdoli MA, Farokhnia A, Abbasi M.(2009)。结果小波变换- anfis和小波变换-神经网络混合预测固体废弃物产生的不确定性。专家系统与应用36(6): 9991 - 9999。
  21. A.,Ghafari Gousheh M.(2011)。使用PCA,Gamma测试和每月流流程预测的转发选择技术评估输入变量测定的SVM模型性能。J.水文,401:177-189。
  22. Rajurkar, m.p., Kothyari, U.C.和Chaube, U.C.(2004)用人工神经网络建模日降雨-径流关系。j .二聚水分子。, 285, 96 - 113。
  23. Rehman S.u.,Saleem K.(2014)。使用IOHLN和Niño4的组合模型对天鹅沿海河流流的预报计划。亚太地区大气科学杂志,50(2):211-219。
  24. Sun A.Y.,Wang D.,Xu X.(2014)。使用高斯进程回归每月流流预测。J.水文,511(16):72-81。
  25. Sudheer c.h., Maheswaran R., Panigrahi B.K., Mathur S.(2014)。基于混合SVM-PSO模型的月径流预测。神经计算与应用,24(6):1381-1389。
  26. Viola F.,Noto,L.V.,Cannarozzo,M.,La Loggia G.(2009)。使用胶水方法与短暂集水区内的日常流式预测。地球物理和化学,A / B / C,34(10-12):701-706。
  27. 徐,彭译葶。, Seibert J., Halldin, S., 1996。NOPEX区域水平衡模型:月水平衡模型的开发与应用。中国科学(d辑:地球科学)
  28. 赵涛,蔡旭,杨东(2011)。径流预测的不确定性对水库实时运行的影响。水资源科学进展,34(4):495-504。
创造性的公共许可证
这个作品是根据知识共享署名4.0国际许可