• 谷歌scholor
  • 意见:1510

  • PDF下载:372

与最大流量估算精度相关的水文区划

乔Tavakkoli1赛义德·哈什姆·侯赛尼2

1伊朗伊斯兰阿扎德大学土木工程系,Torbat-e-Jam分校。

2伊朗伊斯兰阿扎德大学托尔巴特-e-Jam分校自然资源部。

DOI:http://dx.doi.org/10.12944/CWE.9.3.41

为了便于从盆地与统计数据转移到没有统计数据的盆地的数据,通常使用水文区域化。可以通过将区域划分为均匀区域来执行高效的数据传输。在本研究中,采用聚类分析方法将不同的水文区域分成均匀区域。使用因子分析,确定了独立变量,如面积,年平均降雨,平均高度和盆地坡度。基于簇分析方法的均匀性试验,确定了两个水文均匀区域。使用洪水标记和多元回归方法,获得了该区域和均匀区域的两种模型。将使用模型进行准确性和性能评估与研究区域的三个控制区域和最大值放电进行比较。相对平均绝对误差索引用于比较。结果表明,均匀区域的确定系数较高,标准误差低于模型。此外,返回期增加时,r2而SE值也增加。均匀区域的相对误差模型之间的比较结果表明,均匀区域的误差量小于整个区域的误差量。该研究对估计较长返回期值估计估计较少的数据的限制,以及案例研究的同类区域模型也是如此。

聚类分析;同质性;区域分析;分类

复制以下引用这篇文章:

刘志刚,李志刚。基于水文区划的最大流量估算。Curr World Environ 2014; 9(3)DOI:http://dx.doi.org/10.12944/CWE.9.3.41

复制以下内容以引用此URL:

刘志刚,李志刚。基于水文区划的最大流量估算。Curr World Environ 2014;9(3)。可以从://www.a-i-l-s-a.com/?P=7366.


下载一篇文章(pdf)
引用管理器
发布历史


文章出版历史

收到: 2014-08-30
接受: 2014-10-28

介绍

水文区划通常用于将水文信息从有统计数据的流域转移到未测量的流域,所开发的区域模型也可以成功地用于估算未测量站点的水流持续时间曲线(E.A. Baltas, 2012)。将区域划分为均匀区域可以更有效地进行数据传输。确定不同方面的同质性,在反应相同的水文事件中形成水文同质区。均匀区域最重要的应用之一是区域流动分析。为了提高多个气象站水文统计的充分性和准确性,需要提高流量估算模型的准确性。虽然提出的回归模型具有较高的相关系数,但并不期望使用这些模型对流量的估计总是准确的。这是由于区域化期间犯下的错误(ICOLD, 1988)。研究人员研究了使用流分析确定均匀区域的重要性及其对提高估计精度的影响(Davoodi, 1998)。一些研究人员指出,应根据气候特征、地理范围、政治边界和高度位置来划定同质地区(murphy, d.e., 1977和Anil Kumar Kar, 2012)等。另一方面,其他研究人员利用水文响应和流域特征作为划分同质区域的基础(Strupczewski, 2001)等。 In the present study, cluster analysis and factor analysis were performed for the separation and homogenization of homogeneous regions. A statistical model estimates the stream flows parameters, basin variables define the watershed characteristics. If a regionalization method is prosperous, strong relationships between stream flows properties and basin variables can be realized (Shin-Min Chiang, 2002), etc.

研究区域

Khorasan Razavi盆地研究区位于伊朗东北部。流域总面积为118,854平方公里。盆地位置包括北纬36.2980度和东经59.6058度的地理坐标。在地质方面,该地区有两个独立的构造单元,包括Hezarmasjed - Koppe Dagh沉积区和Binalood沉积区。根据Demarton方法将气候分为干旱和半干旱两种类型。图(1)显示了研究区域的位置。

图1:呼罗珊·拉扎维省水文站位置
点击这里查看图


方法

该方法是通过研究、文献资料、分析和推理得出的。因此,对于所需要的信息,采用的是水文站数据。进而利用因子分析确定聚类分析分类中最重要的因子。这些区域是可分类的同质群。并利用SPSS软件进行数据分析。

该方法包括以下主要步骤:

  1. 检查整个盆地的均匀性
  2. 优先选择变量,
  3. 应用聚类方法,
  4. 采用指数洪水法进行特征总结
  5. 研究了回归期流量与地形的关系
  6. 区域分布选择


审查统计方法

选择最合适的区域频率分布


在数据测试和水文站重建之后,对这些水文站的最大流量进行了洪水频率分析。使用Pearson II型、Pearson log III型、2个gamma参数、3个log-正态参数、2个正态和log参数的统计分布函数,使用HYFA软件(HYFA是一种可用于统计分析的统计软件,水文研究中的曲线拟合和统计分布)。

表1:解释的总方差

加载
成分
初始特征值 旋转平方和
全部的 方差
百分比
累积
百分比
全部的 方差
百分比
累积
百分比
区域 6.581 54.839 54.839 4.401 36.675 36.67
年平均降雨量 1.966 16.385 71.233 2.766 23.05 59.72
平均身高 1.313 10.491 82.164 2.536 21.137 80.86
Gravilius系数 1.083 9.023 91.871 1.239 10.32 91.187
24小时降雨 0.371 3.09 94.276.
净河坡 0.268 2.235 96.512
河坡 0.213 1.779 98.29
盆地的长度 0.088 0.734 99.025
所有水道长度 0.043 0.354 99.379
主要河流长度 0.036 0.302 99.681
盆地坡度平均 0.029 0.242 99.922

表2:varimax旋转矩阵
点击这里查看表格


因子分析与独立变量的选择

在主成分分析中,因子分析是一种用于数据简化的多元方法。同样,基本的思想是表示由更少的变量组成的一组变量。在这种情况下,它们被称为因子。因子分析是为区间数据设计的,虽然它也可以用于顺序数据(例如分配给李克特量表的分数)。因子分析中使用的变量之间应该是线性相关的。因子分析模型可以用代数表示为:如果有p个变量X1 X2…,则变量i可以写成m个因子F的线性组合1F2,…F在其中,如上所述m
X=一个I1F1+一个I2F2+ ... + a即时通讯F+ e我 …(1)

其中一个是变量I和E的因子加载(或分数)是变量X的一部分吗这是无法用因素来“解释”的。因子分析有三个主要步骤:

  1. 计算初始因素载荷。
  2. 因子旋转
  3. 因子得分的计算。


在一些统计包(例如SPSS)中实际上是在开始时进行的。第二种方法,选择超过1的特征值,可能是最常见的。最终分数通常使用基于回归的方法(Manly,B.f.j.,2005)来计算。

图2:四变量分层聚类结果(树状图)
点击这里查看图


聚类分析方法

DeCoursey(1973)、DeCoursey and Deal(1974)、mosley(1981)、Acreman and Sinelair(1986)、Burn(1989)、Lim and Lye(2003)、Shin-Min Chiang等人(2002)、Chavoshi and Soleimani(2009)、Anil Kumar Kar(2012)已经在同质区域使用了聚类分析。DeCoursey(1973)和DeCoursey- deal(1974)使用聚类分析来确定同质区域。这种方法也被称为Decoursey修正法(Wiltshire, s.e., 1986)。聚类分析搜索和组织信息,以确定因素组。每个组内因素的某些方面是相似的,与其他组的因素没有不同之处。如果这些区域有非常相似的数量属性,这些区域将被认为是“n”维空间,彼此非常接近。研究这些区域的相似性,以测量它们之间的距离。该方法提供了一种被称为接近系数或相似系数的测量方法。基于这个系数,可以总结出两个领域之间的相似性(Tasker, G.D, 1982)。聚类分析包括以下步骤:

  1. 相似性测度的选择(本研究采用因子分析法);
  2. 数据标准化,使所有参数具有相同的单位;
  3. 测定参数之间的欧几里德距离;和
  4. 选择一种确定类别的方法(这里应用了聚类分析,使用累积类来确定同质区域)。


表3:均匀区域和全区域流量中位数无量纲量

One hundred./ Q2 50/ Q2 25/ Q2 10/ Q2 5/ Q2 2/ Q2 地区
3.538 3.139 2.753 2.212 1.714 1 均匀的区域(我)
3.793 3.341 2.888 2.271 1.776 1 均匀的地区(2)
3.538 3.139 2.573 2.212 1.714 1 整个地区

注:Qn为n年回收期放电

表4:全区和同质区指数洪水模型

地区 模型 R2 SE
整个 Q2 = 64.86 + 0.1632 a 0.796 0.24
均匀(我) Q2 = 33.17 + 0.1681 a 0.801 0.22
同质(ii) Q2 = 178.34 + 0.1371 a 0.94 0.182

注:Q2为两年还原期流量(m3/s), A为区域面积(km2)

表5:全区最大瞬时流量的多元回归模型

R2 SE 模型 返回时间(年)
0.88 0.17 2= 480.9 + 0.154a - 0.151 h 2
0.88 0.18 5975.884a - 0.321 h 5
0.87 0.2 10= 1303.45 +0.38 a - 0.439 10
0.86 0.19 25 = 1725.9 + 0.51 a - 0.594 25
0.8 0.2 502048.614A - 0.716小时 50
0.73 0.21 One hundred.= 2237 + 0.722 a - 0.841 One hundred.

注:Qn为n年重现期最大瞬时流量(m3/s), A为区域面积,H为区域平均高度(m)

洪水指数方法

采用区域洪水分析的洪水指数法,总结了区域特征。在实施洪水指数法之前,指定了均匀面积。

在应用指数洪水法之前,必须先识别出同质区域,然后对用户基期进行最多的统计周期。对用户基站的选择和重建时间进行了不完全统计,编制了均匀区域内所有基站的频率曲线。最后,进行同质性检验,然后将不同的回流时间流量值除以年平均回流流量。收集了所有站点的比值,并确定了每个重现期的上述比值的中位数。根据每个回归周期的中位数比,绘制区域频率曲线。随后进行回归,得到年平均流量和流域面积之间的区域模型(Telori A., 1996和Chavoshi S., 1997)。

表6:第一次最大均匀区域瞬时流量的多元回归模型

R2 SE 模型 返回时间(年)
0.87 0.17 Q2 = 1085 + 0.126 a - 0.372 h 2
0.89 0.17 Q5= 1856+0.216 a - 0.63 h 5
0.88 0.18 Q10 = 2335 + 0.277 a - 0.79小时 10
0.86 0.19 Q25= 2915+ 0.355 a - 0.981 h 25
0.82 0.19 Q50= 3335+ 0.413 a - 1.12 h 50
0.75 0.24 Q100 = 3752 + 0。47 a - 1.25 h One hundred.

注意:QN是N年回报期的最大放电(M3 / s),a是均匀区域区域,H是面积的平均高度(m)

多元回归方法

使用这种方法,提出了不同返回时段和盆地地貌特征的放电之间的关系而不是绘制的盆地年每年平均均衡,(Honarbakhsh,1993)。一般多元回归关系如下:

T= F(一个一个BbCc,......... z.z), (3)

问在哪里T是洪水洪水;A,B,C,...,Z是盆地特性的独立变量的参数;a,b,c,...,z是从多元回归分析获得的恒定值(Telori A.,1996和Chavoshi S.,1997)。

本文建立了流域特征与概率分布参数的回归方程。经过频率分析,得到各站的适宜参数。从而形成了重要区域概率分布参数估计的回归方程(Fotouhi A. 2004, murphy, d.e., 1977)等。结合盆地特征,得到了不同区域无统计或有限统计的分布参数。因此,问t由得到的分布进行计算。

结果与讨论

该研究目的是制定区域模型,以描述水文均匀区域参数和所选模型的地理学变化特性。此外,为了使同性化区域模型导致更准确的估计回报的最大年度返回的变化随时间而异。

方差分析

本研究采用SPSS软件对选定地区的17个变量进行因子分析。这些变量包括流域的各种特征,如面积、周长、平均坡度、主溪坡度、平均水位、平均降雨量、24小时最大降水量、排水密度、重力系数、霍顿系数、米勒系数、最大水位和最小水位。每个度量单位都不同于其他变量。因此,为了准确比较变量,所有的单位都被标准化了。因子分析的初步结果比较复杂,没有给出最佳的解决方案。为了使各因子的方差最大,以最大方差旋转因子轴,直到操作结果成为一个独立的因子。基于旋转因子载荷进行因子识别。采用回归估计方法,得到车站因子得分矩阵。为了限制因素的数量,采用Kaiser-Meyer-Oklin (KMO)抽样充分性测度,确定所选因素数量的比例。基于反图像相关矩阵去除不必要的变量。 To measure the discrimination for these variables, which are correlation matrix diagonal elements, the measure of sampling adequacy (MSA) was utilized. In this method, variables with the lowest MSA value are eliminated by considering the significance level of correlation coefficient matrix among variables. In eliminating variables, KMO statistics and variance percentage should be considered. The elimination of a variable will probably increase or decrease KMO value and percentage of variance (Fotouhi A., 2004). After selecting the required variables, factor analysis was conducted. Necessary variables were selected based on the value of KMO = 0.721. KMO is a statistic which tells whether you have sufficient items for each factor. It should be over 0.7. The Bartlett’s test is used to check that the original variables are sufficiently correlated. This test should come out significant (p < 0.05) — if not, factor analysis will not be appropriate (Rencher A.C., 2002). Subsequently, factor analysis was conducted based on the selected variables. Eigenvalues and percentage of variance factors are shown in Table (1). According to Table (1) extracted factors account for 91% change from the previous variable. As can be seen in the table, the first factor is a greater role in the total variance. This is being satisfied factor analysis of parameters (Anil Kumar K., 2012), etc.

桌子。7:多变量回归模型的最大均匀区域瞬时放电

R2 SE 模型 返回时间(年)
0.904 0.17 Q2 =217.44 + 0.134 a 2
0.89 0.18 Q5 = 332 + 0.264 a 5
0.908 0.17 Q10 =371.5 + 0.367 a 10
0.9 0.18 Q25 = 392.7 + 0.513 a 25
0.87 0.22 Q50 = 391.5 + 0.632 a 50
0.76 0.25 Q100 = 379 + 0.759 a One hundred.

注:Qn为n年重现期最大瞬时流量(m3/s), A为均匀区域面积(km2)

使用48因素的因子分析为程度为4组,即每个因素的贡献如下:具有特征值25的第一因素,本身计算并解释了59%的方差。具有特征值25的第二因素能够计算和解释59%的方差。第三个因素:这个因素为6,特征值为25,约59%的方差解释。第四个因素:具有特征值2,解释6%的方差,有3个因素。

一旦计算出初始因子载荷,就对因子进行旋转。这样做是为了找到更容易解释的因素。旋转的目标是试图确保所有变量只在一个因素上有高负荷(Manly B.F.J., 2005)。换句话说,最大方差旋转是一种因子结构通过最大化数据矩阵列的方差提供一个简单模型的方法。在本研究中采用方差旋转的调查结果将因子减少为4个因子。同时,由于不能确定方差,将具有鹰特定值小于1的因子剔除。从表中可以看出,第一个因素对总方差的影响较大。其最大旋转矩阵如表(2)所示。

聚类分析

为确定研究区均质区域,采用层析聚类方法进行聚类分析。过去的特征是面积参数、年平均降雨量、平均流域高度和河网坡度。采用最大相似系数为15的层次聚类方法。这导致了两个同质区域的确定。由变量组成的树状图如图(2)所示。集群1与集群2的19个变量和12个变量一样。层次聚类方法定义了不同变量下理想的流域划分。

在本研究中,通过聚类分析,完成了两个同质区域的洪水指数方法。整个区域和均质区域的流量中位数无量纲量如表(3)所示。区域洪水频率公式的推导需要以下两种关系:

  1. (Qt/Qm)与回归周期T的关系
  2. 年平均洪水与流域特征的关系。


因此,根据三个对数正态分布参数,调整相关回归周期的无量纲中值,绘制其他区域频率曲线。利用这条曲线,进行无量纲中值插值,以指定其他回归周期。利用流域参数对两年洪水进行了建模。最终得到的全区域和均相区域指数洪水模型如表(4)所示。因此,将两年重现期的值与五年重现期无量纲流量的中值相乘,得到洪水模型五年重现期指数(表3)。

图3多元回归方法下全区域与同质区域相对误差平均值比较
点击这里查看图


多变量回归

当选择的变量数量较大时,将考虑少量但有效的变量组进行进一步分析,而不是全部使用变量。在这方面,多元回归可以更适合选择变量的确切数量。应该再次选择自变量,考虑到潜在的物理过程和与因变量的良好相关性。提出了一种水文区划方案,用于对本文所测流域进行分类。为了估计未经测量的地点的河流流量,一个回归方程,如(Shin-Min Chiang, 2002)等。

图4洪水指数法全区域与均匀区域相对误差平均值比较
点击这里查看图


整个区域重现期为2,5,10,25,50和100年的最大瞬时流量估算模型如表(5)所示,均匀区域的最大瞬时流量估算模型如表(6)和表(7)所示。

利用聚类分析方法确定均匀区域是区域洪水分析的第一步。Ouarda(2001)确定了研究区域的特征,包括主河道长度、主河道坡度和年平均降雨量。此外,Honarbakhsh(1993)指出,影响洪水的最重要的参数是以下的物理特征:面积、平均高度、平均流域坡度、年降雨量和基于洪水区域分析的流域长度。在输入变量中,采用第一因子分析法确定了面积、年平均降雨量、流域平均高度和主河道地面坡度4个因子为均质化的重要因子。这四个因素的方差达到了91.18%。在下一步,利用聚类分析评价盆地的同质性,确定了两个同质区。在四个主要变量的基础上,提出了两种类型的模型:一种适用于整个区域,另一种适用于均匀区域。与整体模型相比,均匀区域获得了较高的判定系数和较小的标准误差。这些区域也表现出较高的回归期R2和SE值。在此基础上,研究了各模型在同质区域和整个区域的相对误差。 Figures (3) and (4) present the average relative error determined by multivariate regression and flood index methods in the whole region and homogeneous regions, respectively.

已经进行了一些研究,重点是水文均质区在提高区域分析模型的性能和精度方面的重要性。在本研究中,与整体区域模型相比,创建同质区域的重要性和必要性非常明显。一般而言,均质化使流域内不同变量的影响增大。因此,模型的精度会更高。然而,均匀化可能会导致变量值的降低,这可能是由于数据离散度的增加。由表(4)、(5)、(6)、(7)可知,整个区域的SE值大于同质区域的SE值,R2值小于SE值。此外,同质区域模型比整体模型更有效。因此,利用控制站数据对比多元回归模型(图3)与洪水指数模型(图4)的相对误差,均匀区域相对误差小于整个区域。

结论

本研究将Khorasan Razavi流域划分为两个均匀的洪水集群,并展示了优先变量如何影响集群过程。使用17个变量中的4个变量来降低变量的维数,并没有对同质性和聚类形成产生显著影响。在没有统计数据的情况下,将水文数据转移到流域,往往会进行区域化。将区域划分为均匀区域,可以更有效地进行数据传输(区域对水文事件的响应相同)。本研究还表明,回归模型具有较高的校正系数,尽管该模型并不总是准确的。因此,在研究工作中,与整体模型相比,均匀区域具有较大的确定系数和较小的标准误差,从而可以提高模型的精度。

参考

  1. Acreman, M.C, and Sinclair, C.D,排水盆地的物理特征分类:在苏格兰洪水频率分析中的应用,J。二聚水分子.(阿姆斯特丹),84(3-4);365-380,(1986)。
  2. Anil Kumar Kar, N. K. Goel, A.K. Lohani和G.P. Roy,使用优先变量的聚类技术在区域洪水频率分析中的应用——Mahanadi盆地的案例研究,水文工程学报(第3期),17个;213 - 223,(2012)。
  3. 《希腊西部水能潜力区域模型的开发》,全球巢日报》14;442 - 449,(2012)
  4. 应用于区域洪水频率的聚类分析,J.水重新。Plann。管理。115(5);567 - 582,(1989)。
  5. 查沃希·萨塔尔,干旱半干旱地区瞬时最大流量区划,硕士学位论文,伊斯法罕理工大学土木工程系,(1997)。
  6. 达瓦·丽阿里阿·Akbar,伊朗中央盆地的不同因素与洪水排放之间的调查关系。德黑兰大学土木工程系的论文(1998年)。
  7. 欺骗,D.G.,客观区域化峰值流速,洪水和干旱,Proc。,2。Symp。在水文中,E. F. Koelzer和K.Mahmood,EDS。,水资源出版物,柯林斯堡,CO,395-405,(1973)。
  8. 德库西,D.G.和迪尔,R.B,多元分析的一般方面及其在水文问题中的应用。Proc,计算机协会。《统计水文学》,美国农业部农业研究局,华盛顿特区,47-68,(1974)。
  9. Fotouhi Akbar和Fariba Asghari, SPSS软件的统计分析,第一版,德黑兰科学出版出版社,(2004)。
  10. Honarbakhsh Afshin,纳马克湖流域洪水的区域分析,德黑兰大学流域管理系硕士论文,(1993)。
  11. ICOLD,埃及水坝的设计洪水和Barragesn,16届大会,Q63R55,埃及,(1988)。
  12. Lim,Y.H.和Lye,Lye,Lye(2003),马来西亚沙捞越中未凝固盆地的区域洪水估计,二聚水分子。科学。J。,48 (1);79 - 94,(2003)。
  13. Kjeldsen, T.r.和J.C. Smithers,使用指数洪水方法对南非夸祖鲁-纳塔尔省的区域洪水频率分析,《水文255、194 - 211(2002)。
  14. 曼利,B.F.J,多元统计方法:初级读本,第三版,查普曼和霍尔,(2005)。
  15. 莫斯利,M。新西兰水文区域的划定,j .二聚水分子。(阿姆斯特丹),49 (1 - 2);173 - 192,(1981)。
  16. murphy, D.E., E. Wallance和L.J. Lane,地貌参数预测西南地区水文特征,资源公报,13 (1);217 - 238,(1977)。
  17. 基于典型相关分析的区域洪水频率估计,杂志水文、254、157 - 173(2001)。
  18. 多变量分析方法,第二版,威利,(2002)。
  19. Rezaei Abdulmajid,《应用回归分析导论》,第一版,伊斯法罕科技大学出版社,(1997)。
  20. 蒋新民,蔡廷贵,黄志明,流域水文区划,I:方法论研究,水资源规划与管理学报(第3期),128;1(3)、3-11(2002)。
  21. Strupczewski, W.G.和Z. Kaczmarck,边洪水频率建模的非平稳方法²²加权最小二乘估计,《水文、248;143 - 151,(2001)。
  22. Tasker, g.d.,水文区划比较方法,水资源通报,18 (6);965 - 970,(1982)。
  23. Telori Abdulrasoul,洪水发生或加剧的有效因素,专门洪水河流的程序,伊朗水力协会(1996年)。
  24. 威尔特郡,s.e.,区域洪水频率分析ÉÉ:同质性统计,水文科学杂志,31 (3);321 - 333,(1986)。
Creative Commons许可
这个作品是根据Creative Commons attage 4.0国际许可证