神经网络和统计模型确定马赞达兰省郊区道路日交通量的效率评价
Sepideh Gholampour Shahab Aldini1*, Shahriar Afandizadeh Zargar2以及赛义德·穆罕默德·赛义德·侯赛尼3.
1伊朗德黑兰伊斯兰阿扎德大学交通工程系,科学和研究分部。
2伊朗科技大学土木工程系,伊朗。
3.伊朗科技大学工业工程系教授。
DOI:http://dx.doi.org/10.12944/CWE.10.Special-Issue1.28
了解目前的交通量常常是交通规划人员所关心的问题之一。了解当前交通量对于反映未来交通系统的性能具有重要作用。交通研究基于对当前情况的观察和解释。由于目前的观察不能代表未来状态,因此应通过确定的条件进行预测。年平均日交通量是规范中提到的交通量指标之一。固定或非固定自动计数器用于计算此卷。在伊朗,道路维护和运输组织负责通过不同的方式进行每日清点。在本研究中,利用从马赞达拉省选定轴线收集的数据建立交通量预测模型。它由数据、线性和对数回归模型以及神经网络模型拟合。
复制以下引用这篇文章:
Zargar S. A, Aldini S. G. S, Hoseini S. M. S.评价神经网络和统计模型的效率,以确定马赞达兰省郊区道路的日交通量。Curr World Environ 2015;10号特刊(2015年5月特刊)。DOI:http://dx.doi.org/10.12944/CWE.10.Special-Issue1.28
复制以下内容以引用此URL:
Zargar S. A, Aldini S. G. S, Hoseini S. M. S.评价神经网络和统计模型的效率,以确定马赞达兰省郊区道路的日交通量。Curr World Environ 2015;10号特刊(2015年5月特刊)。可以从://www.a-i-l-s-a.com?p=668/
文章出版历史
收到: | 2014-11-31 |
---|---|
接受: | 2014-11-04 |
介绍
旅行速度的预测是本研究的主要数据。人们经常讨论如何指定在特定区域和条件下发生的行程,而引入了新的方法来预测行程。建模是研究者模型用来发现数据中嵌入的特定关系的最重要的方法。直接预测技术是那些试图预测频率体积作为模型的技术;例如,数学模型和间接方法通过调用交通解决方案中的四级模型来预测出行需求。
本研究共分为五个部分:第一部分着重于对本研究的干扰。随后,对著名作家的作品和相关书籍进行了回顾。
在第三部分,研究人员讨论了参与者和工具,用来检验假设。第四部分介绍了线性回归模型和对数回归模型的建立以及神经网络的建立。
研究的结束将通过得出结论来完成。
相关文献综述
对于预测年平均日交通流量(AADT)(因此使用交通量)的要求非常高,它被分为两组:
第一组与一系列估计当前交通量的研究有关,第二组与试图预测交通量的调查有关;例如,在1983年Neveu[1]利用人口参数如:汽车拥有量,家庭数量和专业人员数量来预测交通量。1998年,Mohammad和[2]等人利用多元回归,如人口、路线类型、到类似路线的可达性和干线路线的里程,以建立估计交通量的模型。
Zaho和Chang[3]在2001年通过计算线路数量、土地利用、线路类型和社会经济条件,生成了一个多元回归模型。2000年,Seaver[4]利用从乔治亚州80个地区收集的数据来估计郊区路线的交通量。他利用42个主成分分析参数来寻找有效参数;在接下来的步骤中,他使用回归聚类来识别相似的组,最后他为每个回归聚类找到一个最有效的流量估计模型。
方法
所提出的估算体积模型的结构如图1所示。如图所示,我们首先回顾了之前的研究,提取了与交通预测相关的变量,然后使用线性回归和日志回归的方法构建模型,最后对模型进行研究。
图1:交通量预测过程 点击这里查看图 |
“回归”一词是弗朗西斯·高尔顿在19世纪创造的,用来描述一种生物学现象。这种现象是,高大祖先的后代的身高有可能向正常的平均水平回归(这种现象也被称为向平均水平回归)。对于Galton来说,回归只有这个生物学意义,但他的工作后来被Udny Yule和Karl Pearson扩展到更一般的统计背景。Yule和Pearson的工作假设响应和解释变量的联合分布为高斯分布。这一假设在R.A.费雪1922年和1925年的作品中被冲淡了。Fisher假设响应变量的条件分布是高斯分布,但联合分布不一定是
回归模型用于描述数据、估计参数和预测等目的。
回归模型包含以下变量:
- 未知参数,记为β,可以表示一个标量,也可以表示一个矢量。
- 自变量X。
- 因变量Y。
在不同的应用领域,使用不同的术语来代替因变量和自变量。
回归模型将Y与X和β的函数联系起来。
Y≈f (x, β) (1)
要进行回归分析,必须指定函数f的形式。有时这个函数的形式是基于关于Y和X之间关系的知识,而不依赖于数据。如果没有这样的知识,则选择一个灵活或方便的f形式。许多进行回归分析的技术已经发展起来。熟悉的方法,如简单线性回归。形容词简单指的是这种回归是统计学中最简单的回归之一。它是最实用的,就像多元线性回归。简单线性回归以使误差最小化的方式拟合直线。关系2是一个线性函数。
y=a±bx(2)
在这个关系式中,a和b分别代表常数和斜率。在多变量或组合的情况下,线性回归可以表示为一般形式:
Y = β0 + β1x1 + β2x2+…+ βp-1xp- 1+ε (3)
其中x1, x2,…,xp-1为自变量,β0, β1,
线性回归
多元线性回归试图通过对观测数据拟合一个线性方程来模拟两个或多个解释变量和一个响应变量之间的关系。每个自变量x的值都与一个因变量y的值相关联。
y =β0+β1x1+β2x2(4)
假设对数回归模型的正态对数Yi服从正态分布,均值为µ,方差为σ^2。换句话说,假设给定函数服从正态对数分布。
Lnμ=β0+β1Lnxt1+β2Lnxt2+ ... β一个Ln (5)
假设对数回归模型的正态对数Yi服从正态分布,均值为µ,方差为σ^2。换句话说,假设给定函数服从正态对数分布。
通过最小二乘法计算得到β系数为线性回归。这是一个经典的模型,由因变量的对数与预测器或自变量q之间的多重线性关系得到。
神经网络
将神经网络引入多层结构,由有向图上的多层神经元(包括输入、隐藏或中心和输出)组成,每一层都与下一层完全连通。它经过各种算法的训练来执行各种操作。本研究的目的是将神经网络应用于非线性回归,它是执行MLP网络的这种功能的最佳选择。
操作包括网络训练,然后测试网络的训练数据和非训练数据。解决方案策略用于根据现有数据进行决策,以引入所需的输出。神经网络本身不需要遵循特定的操作规则,而需要一系列的数据进行训练。为了建立神经网络模型,我们使用了Matlab软件。
制作模型
出行率预测是交通规划的一线数据,具有一定的复杂性。各种各样的讨论,经常围绕着特定区域和特定条件的旅行次数进行讨论;此外,还提出了多种预测移动速度的方法。建立模型是发现嵌入到当前数据中的已确定关系的最重要的技术。
模型中的因变量和自变量
在建立交通量预测模型时,需要用到几个变量。这些变量可以分为以下几类:
经济变量包括家庭平均收入、汽车拥有量等。
社会变量包括人口、就业率等。
交通变量包括车道数、速度等。
环境变量包括土地使用,获取可用路由
本研究的主要变量包括人口、就业率、学生人数、燃料消耗量、家庭数量、病床数量和家庭平均收入。事实上,研究轴的数据是通过机械计数装置收集的,这些装置记录在马赞达拉省道路维护和运输组织以及过去5年研究轴的统计年鉴中。还应该提到的是,由于报告中的矛盾,遗漏了包括家庭数量、家庭平均收入和就业率在内的变量;因此,人口、就业率、学生人数和燃料消耗是本研究的变量。
相关系数是描述两个变量之间关系的方向和值的数学表示。为了检验相关性,使用了不同的系数,其中简单的皮尔逊相关就是其中之一。皮尔逊相关检验用于从其他线性和强相关变量中选择最有效的变量。因此,车辆交通量被视为因变量,其他变量则为自变量。我们使用SPSS软件建立了线性模型,并对其处理数据的能力进行了测试。
车辆交通量为Y,人口为X2,床位为X3,消耗量(1000立方米)为X4。
我们首先利用Sig系数,即P- value,计算因变量与其他变量的相关性,验证数据的正态性。
在研究的这一阶段,测试的显著性水平为.005(皮尔逊测试中该值为.005或.001),低于该值的参数可能与因变量相关。
根据所看到的显著性水平,交通量与消费、病床与人口之间的相关性低于0.005,而就业率之间的相关性不存在,因此我们省略了这个变量,继续做模型。最后我们得到了理想的模型如下:
V:车辆交通量
Po:人口
圣:学生
Hb:病床数
傅:消费
数据收集
事实上,研究轴线的数据是通过马赞达兰省道路养护运输组织的自动交通计数器和研究轴线近5年的统计年鉴进行收集的;它也可以在该组织的网站上找到。
此外,通过雇佣一个观察者记录指定时间内的交通流量,我们确定了交通量的值,然后从总交通量中减去交通量,得到一个基于出发地到目的地的车辆交通量的模型。
由于访问所有数据的限制,在轴线流量中重要的几个参数可能不会全部包括在内。在本研究中,没有考虑出发地和目的地的社会经济特征,如人口、病床数量、学生和燃料消耗等,对交通进行研究,分析趋势和预测未来情况。
萨里至格姆沙赫尔轴线,作为伊朗郊区交通量第二名,选择了一条分离的双车道,长22公里。事实上,Sari到Ghaemshahr的过程在这项研究中也被考虑到了。
巴博勒到格姆沙赫尔轴线是本研究要研究的一条分离的双车道公路,但我们只考虑巴博勒到格姆沙赫尔的过程。这条轴是20公里。
Sari到Neka Axis是一条分开的双车道公路,有待调查。大约20公里。我们在本研究中考虑了Neka到Sari的过程。在这项研究中最后一个被调查的轴是Babolsar到baboll大约20公里它是一个分开的双车道公路。
4-3回归法分析自变量之间的关系,得到因变量。这种关系遵循一个函数。函数的形式和类型是根据预测的精度来确定的,我们选择误差最小的函数作为目标函数。
建立线性回归模型
首先对数据进行线性回归模型。中的相关数据
这种状态是24小时内通过特定点的双向状态,我们将在下表中演示结果。该表由模型变量、系数统计量和p值组成,p值是模型统计量的汇总。确定变量显著性的置信水平为95%。表1为模型拟合结果
表1:线性回归拟合结果
模型 | 计算系数 | 西格。 | |
B | |||
1 | (常量) | 10499.308 | .059 |
芋泥 | 组织 | .143 | |
Hbi | -26.471 | .097 | |
Sti | 1.431 | .071 | |
优质黄麻 | 107.405 | .010 | |
Poj | 措施 | .106 | |
Hbj | 28.460 | .045 | |
Stj | -1.022 | .033 | |
Fuj | -53.232 | .055 |
表2:模型总结 单击此处查看表格 |
由模型计算出的校正R平方显示出因变量与自变量之间的线性合适关系;换句话说,模型(具有计算系数的变量)约占因变量的90%。另外,需要注意的是,模型是由f统计量验证的。的一般形式对应关系6。The following points mentioned in the table can be interpreted as:
v = 6255.2 + .001Po - 8.4 Hb + 184.432 Fu + 0.167 St (6)
表3:线性回归模型拟合结果
模型 | Unstandardized系数 | T | 西格。 | |
B | ||||
2 | (常量) | 2.648 | 1.236 | .242 |
LnPoi | .017 | .380 | .711 | |
LnHbi | .282 | 1.494 | .163 | |
LnSti | -.067 | -.535 | .603 | |
LnFui | .574 | 4.220 | 措施 | |
LnPoj | .009 | .220 | .830 | |
LnHbj | .356 | 2.795 | .017 | |
LnStj | .178 | .816 | .432 | |
LnFuj | -.155 | -.820 | .430 |
最终的形式是
V = 47165 + 1242.31 LnPo - 80.4 LnHb + 12582.86 LnFu + 30.246St (7)
神经网络模型的建立
输入包括人口数据、病床数量、学生数量、专业人员数量和燃料消耗。为了获得合适的结构,编码网络在不同神经元数量的中心层运行,以最小的误差达到最佳的结构。最好的网络结构是5-20-1-1或5个输入,20个神经元在第一中心层,1个神经元在第二中心层。
图2:输出 点击这里查看图 |
在第二种状态下,我们选择了被研究的轴线旋转的城市,以调查移动的频率。上图显示了网络的设置和结构,而对于城市的数量,数据的数量在增加。网络的结构被认为是5-20-1-1,而利用代码编写来执行软件。如图所示,该软件重复了567次,以找到对少数数据可以接受的理想答案
表4:模型总结
模型 | R | R平方 | 调整R平方 | 标准:估计的误差 | 变化统计 | Durbin-Watson | ||||
R平方变化 | F变化 | df1 | df2 | 团体。F变化 | ||||||
1 | .993a | .957 | .977 | .07600 | .957 | 101.453 | 8 | 11 | 组织 | 1.424 |
表5:制作模型的结果
方法 | R2 | |
访问频率 | 线性回归 | .905 |
对数回归 | .904 | |
神经网络 | , 949年 | |
运动的频率 | 线性回归 | .898 |
对数回归 | .922 | |
神经网络 | , 864年 |
结论
在这项研究中。我们提出了人工神经网络和回归。
回归在大多数研究领域中都具有较强的实用性。制作模型和回归的输出是两种高级回归,如线性回归和对数回归。根据数据的类型和数量选择两个模型。线性模型R2为0.905,对数模型R2为0.941,第2个线性模型R2为0.898,第2个线性模型R2为0.922。事实上,虽然数据的数量有限,但结果是可以接受的,也就是说,我们拥有的数据越多,我们就越享受精确度。人工神经网络支持的第一个状态的R2为.949,第二个状态的R2为.864,表明神经网络具有支持各种数据的能力。
结果表明,该模型具有较高的识别精度。这就是为什么马赞达兰省的这种路线被用于省内的汽车交通,也被用于省间的汽车交通。
结果表明,人工智能功能可以有助于改善预测和预测,但需要注意的是,人口数量的增长可以帮助研究人员提高模型的可靠性。无论如何,人工神经网络比基本方法和典型方法更有效。
参考
- Neveu, A.,预测农村交通的快速反应程序,《交通研究记录》,944华盛顿特区:交通研究委员会,(1983)。
- Mohamad, D., Sinha, K.C., Kuczec, T. and Scholer, C.F.,乡村道路的年平均日交通预测模型,“交通研究记录,1617,华盛顿特区:交通研究委员会。(1998)。
- 赵飞、钟绍文,“基于地理信息系统和回归模型的交通影响因素研究”,《交通运输研究记录》,1769年,华盛顿特区:交通研究委员会,(2001)。
- 西维尔,W.L.,查特吉,A.和西维尔,M.L.,乡村道路交通量的估计,《交通研究记录》,1719年,华盛顿特区:交通研究委员会,(2000)。
- 郑勇,郑,郑,M.K.,韩立德,基于支持向量回归的AADT预测,田纳西大学土木与环境工程系,TN 37996,美国,(2008)。
- Witten, I.和Frank, E.,数据挖掘:实用机器学习工具和技术,怀卡托大学,汉密尔顿,新西兰(2010)。
- f·高斯。理论组合为观测误差最小值。(1821/1823)
- 高尔顿F。主席讲话,H节,人类学(高尔顿在本文中使用了“回归”一词,讨论了人类的身高。),(1885年)。
- 尤尔,G. Udny,《论关联理论》。j .皇家集权。Soc。(布莱克威尔出版)60(4):812-54,(1897)。
- 皮尔森,K. Yule, G.U. Blanchard, N.,李,A.,《祖先遗传的法则》。生物计量学(生物计量学信托)2(2):211-236,(1903)。
这个作品是根据知识共享署名4.0国际许可.