涉及异常异常数据对设计洪水幅度的影响
Bagher Heidarpour.1,Bahram Saghafian1*和苏德戈兰2
1伊朗德黑兰伊斯兰阿扎德大学土木工程系,科学和研究分部。
2沙荣理工大学土木工程系,沙回伊朗。
通讯作者电子邮件:b.saghafian@gmail.com.
DOI:http://dx.doi.org/10.12944/cwe.10.2.38
术语“异常值”通常用于指单个数据点,这些点似乎从其他数据的趋势显着地离开。异常值分为三种类型:不正确的观察,从基本上与其他最大值的现象具有基本相同的现象,以及由不同现象产生的罕见事件产生的罕见事件。首先在完整的数据系列(包括异常值)上进行泛频分析,然后在删除异常值的系列上进行。结果表明,遗漏的异常数据不影响概率分布功能(Log-Pearson IIDI III),但在3320(M)的10000年返回期内设计放电减少了60%3./ s)到1340(m3./ s)。此外,利用美国水资源委员会(WRC)提出的方法和HEC-SSP软件,将离群数据与其他系统数据组合,并对统计分布参数进行修改。利用WRC方法,估计10000年的洪水相当于1907年(m3./ s)通过将异常值指定为200年回报期并修改Log-Pearson类型III分布的参数;这比涉及异常值的场景减少了约43%。
复制以下内容以引用本文:
Heidarpour B,Saghafian B,Golian S.涉及卓越异常数据对设计洪水幅度的影响。2015年Curr World Environ; 10 Doi:http://dx.doi.org/10.12944/cwe.10.2.38
复制以下内容以引用此URL:
Heidarpour B,Saghafian B,Golian S.涉及卓越异常数据对设计洪水幅度的影响。Curr World Environ 2015; 10(2)。可从://www.a-i-l-s-a.com?p=797/
文章出版历史
已收到: | 2014-11-24 |
---|---|
公认: | 2015-06-14 |
介绍
洪水量用于液压结构的设计,它们受水文事件的影响,考虑到结构安全,寿命,损坏等因素。此数量也称为设计洪水。计算大型水坝的设计洪水被认为是大坝工程研究中最重要的步骤之一。通过通过构建它们获得的利润和优化利用率来比较坝故障的损坏显示了选择洪水的高灵敏度,以保持水坝的稳定性。提出了几种方法来计算设计洪水。最重要的方法是频率分析,区域分析,降雨 - 径流模型,实证关系,洪水围护曲线和使用历史洪水。
由于大于水库和溢洪道放电的减缓能力,坝体失效最常见的原因之一被认为是逾越工程。若干报告表明,41%的大坝失效事故是由大坝溢洪道的低容量引起的(Bouvard 1988)。3.众多其他报告和文章报道,大坝因立交桥垮塌的风险至少有30%;此外,通常30%到40%的报告大坝的失败是由于立交桥(Hagen 1982)。7.总体而言,从1950年到1990年的100个大坝故障中的40个事件是由于大坝概要(ICOLD 1997)。13
大坝施工现场中录制的最大洪水的统计和信息在设计洪水估算中起着决定性作用。同时,在进行任何形式的计算之前,我们应该对信息的准确性充满信心,我们应该密切确定每个记录数量的重量和值 - 作为所需时间范围内的实际尺寸 - 并尽可能地指定其位置。然而,遗憾的是,在某些情况下遗忘了登记统计的价值和位置;使用常用技术来计算所有信息的所有信息和具有不同返回时段的洪水。因此,所获得的数字(设计泛滥)与案例研究流域没有一致性,并且在洪水中建造洪水的大规模混凝土结构的成本可能是应该为虚构和虚构的事故支付的财房溢价。
观察到的数据可以显着影响设计估计。目前的研究旨在确定异常日期在估算设计洪水方面的作用。在这方面,使用洪水频率分析的洪水估计一次通过完整数据系列进行一次,另一个时间在删除异常的系列上。然后通过将来自其他系统数据的异常数据组合并从所选分布修改统计分布参数,比较与各种返回周期相对应的洪水幅度。
材料和方法
案例研究
Tamer流域位于伊朗里海海岸线东南部,面积约1531平方公里。它是格列斯坦流域的主要子流域之一。这个地区位于东经55°30 '至56°4 '和北纬37°24 '至37°48 '之间。图1显示Tamer地下集水区及其排水网络图。
|
异常数据
异常值数据是单个数据点,似乎从其他数据的趋势显着地离开。它们通常分为三组:1)通过收集误差和/或数据登记2的观察,自然因素的观察结果3)由坝体失效等不自然因子(运输2004)进行的观察结果。16高离群洪水和历史洪水都被认为是异常大洪水,前者是在系统登记期间观测到的,后者是在系统登记期间以外观测到的。系统记录可直接用于洪水频率分析。非系统记录不能使用,除非能提供额外的信息,将它们与所有洪峰的人口联系起来(IACWD 1982)。11
根据1982年美国水资源协会给出的提案,如果数据的偏差系数大于0.4,则应进行大值的异常试验。如果数据的偏差系数小于-0.4,则应为小值进行异常测试,如果偏斜系数在-0.4和0.4之间,则应为大型和小值进行异常测试(IACWD 1982)。11虽然已经提出了许多方法来检测异常数据,但它们都不是普遍接受的(Garcia 2012)。4.
对于被认为是离群数据的峰值流量,应进行必要的测试,以避免在统计表的第一次计算中由于将数据转移到不同形式或在计算机中而可能出现错误。然后,将以前的数据与历史数据或邻近地区的数据进行比较。根据美国水资源协会(Water Resources Association of America)的说法,如果现有的数据表明,一个离群值数据可以作为长期的最大数据接受,那么可以将其作为历史数据考虑。低于下限值的数据应从最大流量数据集中剔除。然后根据剩余的数据选择合适的分布(IACWD 1982)。11
洪水频率分析
洪水频率分析是设计大坝、桥梁、涵洞、供水系统和防洪设施等设施的重要工具。这包括水文统计和概率领域的大部分研究活动。水利工程中水工建筑物规模的大小和造价的高低直接关系到所需洪水的选择。如果所选洪水大于平均洪水,则所建建筑物将会更大、更巨大、更坚固。因此,施工成本将会增加。洪水频率分析的主要目的在于获得可测量事件的重现期(事件发生的概率),并估计一个特定重现期的事件的震级,通常大于记录事件的长度(Hamed和Rao 1999)7.;风筝1977年13).在一些水工建筑物上,估计洪水流量和罕见事件(如洪水和暴雨)的重现期被认为是最重要的设计因素之一(霍斯金和沃利斯,1993)。9.
频率分析中最重要的因素之一在于长而准确的数据系列的可用性。Hosking和Wallis(1993),10辛格(1998),15Hame和Rao(1999),7.格里迪斯和斯特德廷(2007年)5.深入研究了洪水频率分析,强调严重洪水发生的概率是基于有限数据的外推,数据序列长度短或数据缺失导致常规统计方法的洪水外推存在相当大的不确定性。由小样本洪水数据得出的估计可能与不合理或不切实际的因素有关。
正常功能,双参数日志正常,三参数对数正常,Pearson II型,Log-Pearson型III(LP-III),双参数伽玛和Gumbel是最广泛使用的连续概率分布功能flood frequency analysis to find the magnitude of a flood event corresponds to a specific return period, i.e. a probability of occurrence. The integral of probability distribution function (PDF) yields the cumulative distribution function (CDF).
利用矩量法(MOM)和最大似然法(MLM)等方法计算统计分布参数。矩量法比较简单。然而,结果不太准确,尤其是在数据数量较少的情况下。概率分布函数的参数通过将样本矩(m)到概率分布函数矩。最大似然法更准确。然而,这是非常耗时和复杂的(Hamed和Rao 1999)。7.
利用一组拟合优度检验如Kolmogorov-Smirnov和Chi-square来判断概率分布模型与观测数据的拟合程度。如果拟合相当可接受,则将选择分布进行进一步分析。可接受分布的排名基于两个统计量,即平均相对偏差(MRD)和均方相对偏差(MSRD),公式1和2解释。MRD和MSRD最小的分布与观测数据拟合最好。
x一世代表了我th观察到的数据,表示x的估计值一世, n表示数据数,m表示分布参数数(Adeyemo and Olofintoye 2014)1.
使用系统数据集成异常值数据
为了将上面的异常值与历史洪水数据或其余的数据集成在一起,美国水资源委员会提出的方法被应用于修改统计分布的参数,例如,偏差的平均值,方差和系数。没有遵循异常值数据的这些修改是使用公式3到6执行的
点的经验似然性,p(i)用weibull关系修正如下:
其中W表示权重因因子,H表示历史或卓越的洪水记录周期(年),S表示系统数据记录周期(年),n表示相对于年份(n = s + h),k表示的总数据记录周期历史洪水的数量,x表示流量数据的日志,代表
修改平均值,δ2表示修改的差异,表示修改的偏差系数。在图2中,系统和历史时期的洪水数据状态的示例(英格兰JR等人。2003)。3.
|
结果与讨论
在这项研究中,研究了位于研究区域的出口区域的Tamer virthical站的年瞬间最大流量。该站位于坐标59Â|29/30.//东部经度和37Â|28/30.//北纬在海拔132米处。图3显示了在统计年度统计岁月内驯化液流量表中最大瞬时流速的变化。
图3:年最大瞬时时间序列 山顶泛洪在罗马水文站 点击这里查看图 |
根据异常值测试结果‣£与观测流量(783 m)之间比较大的差异3./s),次之最高流量(230米3.(2007 - 2008年/s),其比值约为3.4,将给定站的最大流量视为离群数据(Heidarpour et al., 2015)。8.表1包含在考虑完整系列和删除异常数据之后的正常和自然对数值的跨度和自然对数值中的跨瞬间最大洪水数据的统计特性。
表1:塔尔马水文站年最大洪水资料统计特性
范围 |
所有观察数据 |
移除异常值数据后 |
||
问: |
ln(q) |
问: |
ln(q) |
|
数量的数据[N] |
40 |
40 |
39 |
39 |
最低 |
3.04 |
1.11 |
3.04 |
1.11 |
最大 |
783. |
6.66 |
257 |
5.55 |
中位数 |
45.3 |
3.81 |
42 |
3.74 |
的意思是 |
87.19 |
3.69 |
69.35 |
3.62 |
方差 |
17083.98 |
1.826 |
4466.075. |
1.637 |
标准偏差 |
130.706 |
1.3513 |
66.8287 |
1.2791 |
偏见偏斜 |
3.942 |
-0.173. |
1.015 |
-0.362 |
偏见峰氏症 |
21.291 |
2.224 |
3.212 |
1.951 |
变异系数[CV] |
1.5 |
0.366 |
1.06 |
0.354 |
偏斜系数[CS] |
4.255 |
-0.187 |
1.098. |
-0.391 |
峰度系数(Ck) |
24.850. |
2.596 |
3.764 |
2.287 |
|
在洪水频率分析中涉及离群数据的影响
在洪水频率分析中,使用完整的数据系列分析了一年一度的瞬时最大洪水的频率。接下来,通过删除异常值来了解异常值在估算不同返回时期的设计洪水方面的角度来执行泛频分析。为了考试数据质量,使用一些统计测试来检查随机性,使用综合频率分析(CFA)软件(Pilon和Harvey 1994)检查随机性,数据独立性和同质性。14然后利用水文频率分析软件(HYFA)进行洪水频率分析。该软件用七个频率分布函数拟合数据。然后,采用矩量法和极大似然法估计概率分布参数;计算了不同回收期的参数。然后,采用拟合优度卡方检验、平均相对偏差(MRD)和均方相对偏差(MSRD)确定合适的分布(Hemmadi et al., 2007)。9.
表2:完整的估计洪水不同的返回期 系列和去除异常数据后(m3/s流量) 点击此处查看表格 |
|
表3为Tamer水文站年瞬时最大流量不同回潮周期的频率分析结果。根据这些结果,LP-III分布的平均相对偏差(mean relative deviation, MRD)和均方相对偏差(mean square relative deviation, MSRD)值最低,因此在卡方拟合优度检验接受的其他分布中,LP-III分布是最佳的概率分布。
表3:不同回归期离群值数据的敏感性分析(流量m3./秒)
异常值数据的返回期(年) |
退货期(年) |
||||||
20. |
50 |
100. |
200. |
500 |
1000 |
10000 |
|
50 |
327. |
526 |
717. |
946. |
1314 |
1647. |
3147. |
80 |
300 |
471. |
630 |
816. |
1108. |
2365 |
2469 |
100. |
292. |
454. |
603. |
776 |
1045 |
1279. |
2269 |
150 * |
281 |
431. |
567. |
724. |
964 |
1170 |
2021 |
200. |
275 |
420. |
550. |
699. |
925. |
1119. |
1907 |
250 |
272 |
413 |
540 |
684. |
902 |
1088 |
1840年 |
300 |
270 |
409 |
533 |
674. |
887 |
1069 |
1797 |
400 |
267 |
403 |
525 |
662. |
869 |
1044. |
1744年 |
500 |
265 |
400 |
520 |
655 |
858 |
1033. |
1713. |
700 |
263 |
396 |
514 |
647 |
846. |
1013. |
1677 |
1000 |
262 |
394 |
510 |
641 |
836. |
1001. |
1651 |
从结果来看,离群值虽然没有改变所选统计分布的类型,但影响了洪水估算的结果,特别是在不同重现期。然后,将观测到的离群数据与Tamer水文站的其他洪水数据取相同的值,可估算出重现期为10000年的瞬时最大洪水为3320 m3./ s使用LP-III分布。如果删除异常值,那么10000年的洪水值将减少到1340米3./ s(约60%减少)。
利用频率分析中系统数据合并异常数据的结果
使用美国陆军工程兵团开发的HEC-SSP 2.0版统计软件,在频率分析中整合离群数据和剩余系统数据。这个软件的原始和试用版本是在2006年提供的。该软件以美国水资源委员会B17公报为基础,可用于水文数据的统计分析。本研究使用的是2010年发布的新版软件。该版本增加了一些功能,如洪水和降雨频率分析,日流量频率分析,持续时间分析,由两个独立来源合并的图表分析(USACE 2010)。17
由于研究区域缺乏历史数据,采用敏感性分析对观测到的离群值指定一个回归期。为此,利用HEC-SSP 2.0软件进行了洪水频率分析,考虑了异常值的不同重现期。敏感性分析结果和不同重现期的估计流量如表3所示。由上表可知,当对离群数据采用200年及以上的重现期时,这些重现期的洪水值变化不明显。因此,频率分析结果对200年以上回归周期的敏感性较低。结果表明,异常值(洪水量级为783 m3./ s)可视为200年。图4示出了当不同返回期被分配给异常值数据时,使用1000和10000返回时段的设计泛洪的变化。图5示出了不同返回期的观察和估计流速,使用异常值的集成和系统数据集成在Tamer viher ructoric站中具有95%置信区间的估计流速。
结论
在这项研究中,使用两种分析方法,通过删除异常值数据来研究异常值对洪水频率分析的影响。结果表明,尽管消除了异常值数据不影响所选概率分布的确定(LP-III分布),但除去异常数据减少了洪水流量减少了60%的返回期限;从3320米到3./s至1340米3./ s。在整合具有系统数据的异常数据时,使用了美国水资源委员会和HEC-SSP 2.0软件提出的方法。在这种方法中,洪水估计为1907米3./■通过将200年返回期申请到异常值以及校正LP-III的分布参数来获得10000年的返回期。然后,与观察到的异常值相比,该值减少了43%,所以观察到的异常值与其他洪水相同。
参考文献
- Adeyemo J.,Olofintoye O.,优化的傅立叶近似模型,用于估算Vanderkloof大坝,南非的月度流流程发展 - 概率,面向设计的数字和进化计算之间的桥梁.288: 293 - 306(2014)。
- Bouvard M.,设计洪水和运营防洪,问题的一般报告。63:166(1988)。
- 英格兰J., Jarrett R., Salas J.,利用历史和古洪水数据的矩估计的数据比较,水文杂志。278:172 - 96(2003)。
- Garcia F.,测试数据系列中异常值的测试。Rio de Janeiro,Brazi,Rio De Janeiro的潜在浩杰西大学L(2012)。
- Griffis,V.W.,Stedinger J.R.,2007年。与公告17的洪水频率分析的演变,作者:王莹,水文工程杂志CHINESE。12(3):283-297(2007)。
- 重新评估设计洪水和大坝安全。议程, (1982年).
- 哈米德·K,拉奥·阿尔洪水频率分析, CRC出版社(1999)。
- 洪涝灾害观测中异常值的检测(以Tamer流域为例),最新科学研究杂志4(3)(2015)(接受)。
- Hemmadi K., Akhood-Ali AM。, Behnia正义与发展党。那Arab DR., The Role of Updating Statistical Series in Assessment of Design Flood, a case study of Jareh Storage Dam,伊朗民间管理科学与工程。1(2)(2007)。
- HOSKing JRM。,Wallis JR。,一些有用于区域频率分析的统计数据,水资源研究.29:271-81(1983)。
- 那确定洪水流量的指南,公告17b,美国地质调查,水数据协调办公室,enton,va。(1982)。
- 那水坝临时和永久防洪成本,印度大坝委员会,中央灌溉和电力委员会(1997)。
- 风筝GW。,水文中的频率和风险分析, Fort Collins, colorado, Water Resources Publications.224 (1977)
- Pilon P., Harvey K.,统一频率分析(CFA),版本3.1。参考手册。环境加拿大,渥太华(1994)。
- 辛格,五,水文学中基于熵的参数估计.卷。30:Springer(1998)。
- 运输A.,极端洪水分析指南,民事项目分公司,埃德蒙顿,阿尔塔(2004)。
- USACE。,HEC-SSP 2.0版,统计软件包。水资源研究所,水文工程中心(2010)。
这个作品是根据Creative Commons attage 4.0国际许可证.