• 谷歌scholor
  • 观点:1664

  • PDF下载:244

神经网络利用神经网络预测Shahid Rajayi Temusterial镇治疗厂的效率

哈比卜Pakrou1,赛德帕克鲁1, nas Mehrdadi2以及穆罕默德·贾瓦德·阿米里2

1土木工程 - 环境,阿拉斯国际校园,伊朗。

2土木工程â€" Environmental, University of Tehran, Iran。

通讯作者邮箱:pakrou1352@ut.ac.ir.


DOI:http://dx.doi.org/10.12944/CWE.10.Special-Issue1.108

在本研究中进行了预测Shahid Rajayi工业城镇处理厂的效率。从治疗厂的实验室收集数据。对候选输入和治疗设备输出执行相关系数,以分析治疗设备的输入和输出并选择适当的输入。使用前向神经网络为每个输出COD,BOD和TSS开发输入 - 输出建模。在该建模中使用5个BOD输入,COD,TSS,pH和温度。Levenberg-Marquardt算法用于训练神经网络。具有五个输入的神经网络的比较表明,在现有数据的数量低于训练神经网络的情况下,我们应该使用神经网络结构中的最小可能数量的输入。


相关性分析;神经网络;建模;效率;处理工厂

复制以下内容以引用本文:

Pakrou H, Pakrou S, Mehrdadi N, Amiri M. J在Shahid Rajayi工业城镇处理厂利用神经网络预测效率。Curr World Environ 2015;10号特刊(2015年5月特刊)。DOI:http://dx.doi.org/10.12944/CWE.10.Special-Issue1.108

复制以下内容以引用此URL:

Pakrou H, Pakrou S, Mehrdadi N, Amiri M. J在Shahid Rajayi工业城镇处理厂利用神经网络预测效率。Curr World Environ 2015;10号特刊(2015年5月特刊)。可从://www.a-i-l-s-a.com?p=700/


下载文章(PDF)
引用管理器
发布历史


文章出版历史

已收到: 2014-11-25
接受: 2014-03-15

介绍

今天,工业和技术在每个国家都有特殊而重要的地位。一个国家的经济大多与它的工业和技术生产有关。虽然工业领域的发展带来了特权,但也给社区带来了严重的问题(Fahimi, 2000年)。其中一个问题是工业单位活动导致的污水排放(Chalkesh Amiri, 2010)。由于工业污水处理不当会对环境造成不良影响,因此对工业污水进行更全面的处理就显得尤为重要(Khosravi et al., 2013)。由于有机物质和矿物的存在,工业污水在环境中处置时会耗尽地表水和地下水(Metcalf, 2003年);因此,优化和改善污水处理厂的现状在环境领域中占有重要的地位。这就是每一个改进都需要在当前情况和新情况下进行评估的地方(Khosravi et al., 2013)。然而,由于工业单元的复杂性,常规方法无法对系统的效率和性能进行预测。因此,使用诸如模糊逻辑和人工神经网络等人工智能方法可以简化这种评估(Dogan, 2008),甚至可以预测系统的性能(Guclu & Dursun, 2010)。 Therefore, the present study is trying to predict the efficiency of industrial Sullage treatment plant of Shahid Rajayi town using the neural network method.

方法和材料

在用真实数据建模时,存在的一个主要问题是是否存在误差小、噪声小的正确数据。本文首先介绍了工业污水的标准取样方法。在数据有误差或噪声的情况下,使用稳健的建模方法是至关重要的。然后,我们将研究在这些网络中所使用的神经网络和训练方法,以建模Rajayi的工业处理厂。

工业污水取样的标准方法

提供本标准的目的是确定一种工业污水取样的方法,在这种方法中,已制定了某些原则来统一不同的取样方法,并且该方法适用于一般尺度,可能适用于特殊条件。抽样的主要目的是让一个小的工业污水,污水的代表真正的属性,实现这个目标的最基本的因素是:取样,取样的时间和频率,保持样品的组成,直到测试的时间。

模型的输入

污水的输入指标,即神经网络的输入,是分析污水处理厂性能的有效参数,以评价和提高污水处理厂的性能。污水的规格,如污水所包含的任何东西,以及温度和参数,如BOD和COD,都是这些影响因素。

神经网络

建模是进行决策和预测环境事件的合适工具之一,环境事件通常被表示为具有数学关系的概念模型。环境过程和现象大多依赖于许多变量,它们之间存在复杂的关系,导致预测的准确性和有效性存在误差(Taherion, 2006)。

人工神经网络可以更好地预测治疗系统的性能。这种预测通常依赖于时间数据的存在。工业污水处理厂具有一定的关键参数,可用于实现污水处理厂的性能。这些参数包括:BOD、悬浮物和COD。大多数文献将这些参数用于人工神经网络应用于工业处理厂的建模。

在人工神经网络中传播信息从输入层开始。网络在培训数据上修改其自身重量,这些培训数据是根据调整后的培训原则使用的;为了确定权重以产生输入输出映射并具有最低可能的错误。此过程被命名为培训。在成功完成培训阶段之后,应通过一系列独立测试评估训练模型的性能。神经网络的结构由层数,每个层中的神经元数,刺激函数(每个神经元的输出控制器),训练方法,重量校正算法和型号种类(Hamoda等,1999)。

Levenberg-Marquardt Trainingalgorithm

Levenberg-Marquardt训练算法具有非常高的收敛速度,因为它不需要解决Hessian矩阵并由Jacobian矩阵逼近。该算法是由于其学习能力和高效率(Russell和Norvig,2003)。

预测的准确性通常是通过提供网络以前没有面对过的数据来评估的,即网络在均方根误差(RMSE)、概化(R)时的能力。为此,采用相关系数准则对所设计网络的平均绝对百分比误差(MAPE)和平均绝对误差(MAE)进行评价。

公式1

在这,n为预测次数;Y行为为实际观测值;真正的观测值;Y美东时间为预测值;E²行为是真正观察价值的平均值;和è².美东时间是从模型中提取的预测值的平均值(Mehdipour和Shokouhiyan,2012)。

人工神经网络,定义与原则

神经网络的重量需要预处理。选择权重效果使网络在减少误差和它收敛的方式下实现一般区域状态。时期或时间段是基于训练向量或预定点的周期。

数据表示(数据归一化)是神经网络中一个非常重要的问题。赫克特-尼尔森建议在训练过程中使用两组不同的数据。其中一个用于调整权重,另一个用于计算一些时间步骤中的误差。如果第二个训练集上的误差继续下降,则训练是连续的。当训练集中的误差开始增加时,网络开始记忆训练模式(在MATLAB的神经网络工具箱中称为验证)。因此,训练部分将停止(科纳尔,1999年)。

停止标准可以定义为阻止培训的标准。当验证误差增加一定数量的迭代时,训练停止,重量和态度返回到最小验证错误(Matlab Help,2002)。

编码和MATLAB神经网络工具箱

开发模型由Matlab软件,2013年从Mathworks Co.完成了代码,该代码是在求解器中编写的,以便自动搜索,这为培训的函数创造了神经元数量的预定区域的训练功能的人工神经网络隐藏的层等。这里使用预先开发的神经网络与书面代码一起使用,以自动生产人工神经网络,以便获得更准确的结果。神经网络工具箱是一个用户友好的GUI,可用于在特殊区域创建一些型号。

结果

这里由塔德里茨的Shahid Rajayi工业处理厂的收集数据开发了一种模型,以预测输出睡眠的质量。数据将首先解释数据的统计分析,其结果将在后面提出。本节的所有分析和神经网络的培训是由Matlab软件和神经网络工具箱完成的。

数据分析

输入输出数据

从塔德里兹的Shahid Rajayi镇治疗厂获得了144个数据。这些数据在神经网络的培训,验证和测试中同时使用。这些数据包括BOD,COD,TS,PH和输入SULLAGE的PH和温度以及输出SULLAGE的TSS,BOD和COD。

相关分析

相关系数是用于确定一个定量变量与另一个定量变量之间的类型和程度的统计工具。相关系数是用于确定两个变量之间的相关性的标准之一。相关系数显示了关系的强度以及关系类型(直接或反向)。该系数在1到-1之间,并且在两个变量之间无关系的情况下等于零。两个随机变量x和y之间的相关性定义如下:

formul5

其中,E是期望值算子,cov表示协方差,corr是相关系数的一种广泛使用的替代符号。

为了选择合适的输入来预测TSS、BOD和COD,需要对候选输入和输出变量进行相关性分析。因此,对输入污水的BOD、COD、TSS、pH、温度与输出污水的TSS、BOD、COD进行相关性分析。

箱线图

本节中介绍了输入和输出数据的框图。盒子图可能有助于分析我们想要模型的系统的输入和输出。图1显示了5个候选输入的盒子图。从该图可以看出,与其他变量相比,对pH和温度的输入的分布非常低,并且可以忽略不计。通过预处理数据并将其归一化在1到1之间,此问题是可解放的,并且将在下一节中讨论。

图2显示了处理厂产出的箱形图。COD的分布大于其他变量。

图1所示。输入候选数据的箱线图


图1:输入候选数据的框图
点击这里查看图

图2.输出候选数据的框图


图2:输出候选数据的框绘图
点击这里查看图

数据预处理

在权值更新过程中进行处理,特别是在使用非线性传递函数时,根据所使用数据在神经网络中的分布情况,在准备数据后进行模型开发,分配等变量权值。数据的预处理是通过将输入和输出数据分配到范围[0,1]或[- 1,1]来完成的。对所有数据点进行如下转换:

对于区间[0,1]:

惯例5.

每个数据变量都应使用具有非线性传递函数的输入数据的标准化进入神经网络模型中,例如logsigtansig并且重量平等。因此,数据应分别由间隔(5)和(6)中的等式(5)和(6)缩放,分别在[0,1]和[-1,1]中。

建模的过程

在Shahid Rajayi Industrial Town的治疗厂中记录的实验室数据用于对治疗厂的输入和输出进行建模。在删除不完整和重复数据后,提取144个输入和输出记录。此数据量随机划分为三个集。传输神经网络的输入无关紧要,因为建模是静态的,并且使用的神经网络(馈送前向神经网络)只能做静态映射。因此,将数据划分为三组培训,验证和测试是合适的。培训集中的现有数据用于培训网络。60%的数据用于培训,验证的20%和20%的神经网络测试中的20%。输入SULLAGE的参数(BOD,COD,TS,温度和pH)用于预测污水的质量参数。

通过五个输入开发模型

本节利用BOD、COD、TSS、pH和输入污水温度五个输入,建立了输出污水水质参数(BOD、COD和TSS)的预测模型。我们在这里使用神经网络,专门用于预测每一个输出参数。和上一节一样,这些神经网络也被命名为从1到3,分别预测BOD、COD和TSS。

网络一号有五个输入

该部分中的神经网络号是预测治疗厂的输出叠层的BOD。这里得到的最佳预测涉及一种具有两个隐藏层的网络,其由第一个隐藏层的10个神经元组成,并且在第二隐藏层中的15个神经元组成。使用更多的神经元或更多层来找到输入和输出之间的未知关系似乎是合理的,关于输入数量增加的事实。另一方面,这里获得的结果和值非常依赖于初始重量函数,并且每个训练显着变化。因此,可以通过更多运行和更多的试验和错误来达到更好的结果。图3显示了培训期间Levenberg-Marquardt算法的训练参数。MSE函数的值也如图4所示,选择为操作功能。从该图可以看出,训练已经在10时段停止,并且从时段4获得了最佳结果。

图3。Levenberg—Marquardt算法在训练5个输入的网络1时的训练参数


图3:Levenberg-Marquardt算法在训练5个输入的网络1时的训练参数
点击这里查看图

图4。MSE的操作功能,用于对5个输入的网络1进行训练、验证和测试


图4 MSE对5个输入的网络1进行训练、验证和测试的运行函数
点击这里查看图

图5给出了神经网络1预测输出BOD的实际结果与预测结果的对比,以观察网络的性能。

图5:对比5个输入的网络1中,处理厂的BOD实际输出(RED)和预测(BLUE)


图5:对比5个输入的网络1中处理厂的实际BOD输出(RED)和预测(BLUE)
点击这里查看图

网络二号有五个输入

网络2通过获得5个输入来预测输出COD。为了避免冗余,这里只提供回归分析和比较结果。图6显示了该网络的回归分析结果。在这个测试中,网络的R值是0.717。图7显示了处理厂预测输出COD与实际记录值的对比。这些结果表明,具有5个输入的网络2的性能是正确的。训练后的网络在本节有两个隐藏层,每层分别包含10个和7个神经元。

图6。预测输出COD与训练、验证和测试步骤中COD的真实值在网络2 5个输入处的回归分析结果


图6:预测输出COD的回归分析结果以及带有五个输入的网络编号2中的训练,验证和测试步骤中COD的真正值
点击这里查看图

图7。网络号处实际输出COD (RED)与预测值(BLUE)的比较2带5个输入


图7:网络中的真实输出COD(红色)和预测值(蓝色)的比较。2带5个输入
点击这里查看图

有五个输入的三号网络

最后,建立了预测输出TSS的网络3。这个网络利用了一个隐藏层。这个网络中隐藏层的大小包括22个神经元。该网络在测试段得到的R为0.86。图8显示了回归分析的结果。结果的比较也显示在图9中。这张图表明TSS的输出值预测的准确性很高。

图8.在网络号3中的TFF中预测和实际输出的回归分析结果,网络编号3中的测试阶段有五个输入


图8:具有五个输入的网络号3中的TFF预测和实际输出的回归分析结果,具有五个输入
点击这里查看图

图9.具有五个输入的网络号3中真实输出TSS(红色)和预测值(蓝色)的比较


图9:具有五个输入的网络号3中真实输出TSS(红色)和预测值(蓝色)的比较
点击这里查看图

R值如表1所示。

表1:5个输入时的R值

TSS.

鳕鱼

菩萨

平均

五个输入

0.862

0.717

0.744

0.774

讨论和结论

本研究开发了一个人工神经网络来预测大不里士的Shahid Rajayi工业城镇处理厂的污水输出质量(BOD、COD和TSS)。该模型基于前馈神经网络和反向传播误差训练方法以及Levenberg-Marquardt算法。从工业处理厂的实验室收到了144份数据。首先对数据进行统计分析,然后经过预处理后交给神经网络。采用输入污水BOD、COD、TSS、pH、温度5个输入进行预测,作为神经网络模型的输入。研究结果表明,所开发的神经网络具有足够的准确性来预测产出污水的质量。根据这项研究的工作和获得的结果,现有的数据似乎是非常噪声和有误差。因此,强烈推荐使用神经网络对处理厂过程进行建模。

参考

  1. 基于神经网络黑箱模型的污水处理厂性能预测研究,环境管理杂志83(3), 329 - 338。(2007)
  2. Arsi Vala,废水处理,由Ahmadreza Yazdanbkhsh,Kazem Nadafi,Fardabeh Bull翻译。(1993)
  3. Chalkesh Amiri, M.,《水处理原理》,埃斯法汉,阿尔坎出版社。(2010)
  4. DOGON,E。e。一种。“人工神经网络在估算废水处理厂的应用”,“环境的进步,27(4),439-445,(2008)
  5. Farahani,L. M.,Urban Sepage SludgeManagement计划(案例研究:Ghods Town的治疗厂),《环境, 30岁。(2001)
  6. Guclu D.和Drsun,S。“大规模废水处理的人工神经网络建模”,BioProcess Biosyst Eng., 33, 1051-1058, (2010)
  7. Holubar, P。,等。36: 2582-2588。(2002)
  8. 《提高稳定塘污水处理厂的效率和经济赋权》,第二次规划与环境管理会议.(2012)
  9. Khosravi,S.Panjeshahi,M. H.和Ataei,A。“在废水处理厂中环境绩效的量化和优化的应用,”j .的(火用),12,(1),119-138,(2013)
  10. Mogens Henze,废水处理化学和生物工艺,Ahmadreza Yazdanbakhsh, Mostafa Leili, Ali kulivand译,哈菲兹出版社。(2007)
  11. 蒙扎维,M.,《城市废水》,第一版:废水收集,第八版,德黑兰,德黑兰大学出版社。(1998)
  12. 马迪普·托尔哈贝,张海涛,张海涛,刘志强,利用人工神经网络研究输入冗余对工业污水处理厂污水COD预测精度的影响。第六届全国环境工程学术会议.(2012)
  13. Mehdipour torghabeh,A.,Shokuhiyan,M.,使用人工神经网络的工业处理厂的性能评估,第六届全国环境工程会议与展览.(2012)
  14. 马迪普·托格贝,张建平,张立新,利用人工神经网络估算工业废水处理厂污水TSS浓度,第七届全国土木工程大会,锡斯坦和俾路支斯坦大学Zahedan.(2013)
  15. 梅特卡夫,E.污水工程处理与回用,4版,麦格劳希尔,(2003)
  16. Rodriguez,M.J。,j.b.,se'rode。评估城市饮用水系统残留氯的经验线性和非线性建模。环境建模与软件.14(1): 93 - 102。(1999)

创造性的公共许可证
这个作品是根据知识共享署名4.0国际许可