时间:2022-08-24 03:51:43
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇人工神经网络,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
1.1GPS台站数据GPS时间序列由中国地壳运动观测网络提供[10],这些GPS站在解算过程中扣除了固体潮、海潮、极潮的影响.本文选取的是华北平原区域内BJFS、BJSH、JIXN、TAIN、ZHNZ台站的数据,为了得到更理想的GPS时间序列数据,本文对这72个月的GPS数据进行预处理工作,包括:线性拟合去除趋势项、剔除噪声数据以及小波分解保留长周期信号[11].
1.2GRACE数据本文采用的GRACE重力卫星数据是由美国德克萨斯大学空间研究中心提供的高精度Level-2RL05版本的GRACE重力场前60阶球谐系数(2005年1月~2010年12月)[12].在此基础上,根据Blewitt[13,14]、Wahr[15]的结果推导由GRACE时变重力资料解算的陆地水储量,如公式(1)所示。
1.3CPC水文模型数据研究表明,地表水储量可以忽略[7],所以研究区陆地水储量变化可以用式(2)表示。示土壤水分引起的陆地水储量变化,来自CPC水文模型.通过式(2)可获得地下水储量的变化值.以BJFS台站为例,如图1所示,绿色线表示GRACE解算的陆地水储量,红色线表示CPC水文模型解算的土壤水储量,蓝色线为地下水储量.由于GRACE解算的陆地水储量在解算过程中扣除了背景场的影响,因此本文对72个月的降水量、地下水埋深以及GPS测站的地表形变数据做同样的处理.
2研究方法
2.1人工神经网络算法原理BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传递.在前向传递过程中,输入信号从输入层经隐含层逐层处理,直至输出层.每一层的神经元状态只影响到下一层神经元状态.若输出层不能满足期望的输出要求,则转入反向传播,根据预测误差调整网络权值和阈值,从而使得BP神经网络预测输出不断逼近期望输出[16].其拓扑结构如图2所示.X1,X2,…,Xn是BP神经网络的输入值,Y1,Y2,…,Ym是BP神经网络的预测值,ωij和ωjk为BP神经网络权值.
2.2基于BP神经网络的地表垂直负荷形变量模拟
2.2.1指标选取地表负荷形变是由地表流体质量(包括大气、陆地水等)重新分布引起的不同尺度变化.因此将GRACE解算的水储量作为一个输入因子.此外,分析华北平原地表负荷形变的成因,认为地下水超采对该区的地表负荷形变有一定影响.为此将地下水埋深作为BP神经网络模型的一个输入因子.降水量与地表负荷形变量间存在一定关系,一方面降水的增多会相对减少对地下水的开采,另一方面在降水过程中浅层黏性土吸水后表现出一定的膨胀性,因此将历年的降水量也作为一个输入因素[17].为了探求不同水储量作为输入因子时模型的模拟精度,本文结合来自CPC水文模型的土壤水储量,将解算出的地下水储量作为另一个输入因子.
2.2.2样本训练与网络设置为消除网络输入、输出变量的量级、量纲不同对网络识别精度的影响,对各个变量进行归一化处理。上式中:P为原始输入数据,Pmin,Pmax分别为原始数据的最小值和最大值,Pn为归一化后的数据.隐含层采用正切Sigmoid函数,输出层采用Purelin函数,训练函数采用贝叶斯正则化算法.网络的主要参数训练目标goal=0.001,学习率为0.05,性能函数采用msg均方误差函数.
3结果与讨论
3.1模型精度验证
3.1.1样本训练精度运行建立的人工神经网络模型,训练21次达到训练目标.R2平均值为0.892,说明模型训练精度较高.如图3所示为将陆地水储量作为输入因子训练网络后的5个台站模拟结果.图中蓝色线为GPS台站的实际观测形变量,红色虚线为用人工神经网络模拟出来的型变量.
3.1.2模型模拟精度由于地表垂直负荷形变实际观测结果与拟合结果均为等间隔的月尺度数据且没有明显规律,因此采取后验差检验法对模型进行精度分析。采用后验差检验法对结果进行精度分析,检验结果如表2所示,5个台站后验差比值C<0.5,小误差概率P>0.80,R2平均值为0.806,依据预测等级表,网络模型精度较高.
3.2不同水储量输入对精度的影响将不同水储量输出的15组模拟结果进行后验差检验,结果如表3、图4(以BJSH为例)所示,当以陆地水储量(TWS)作为输入时,5个台站的后验差比值C<0.5,小误差概率P>0.80,R2为0.901,相关性较好,模型模拟精度较高.当以地下水储量(GWS)和土壤水储量(SWS)作为输入时,均方差C>0.65,小误差概率减小,R2为0.555和0.290,模拟精度属于勉强.说明在利用人工神经网络模拟地表负荷形变量时,陆地水储量作为模型输入因子时模型模拟效果最好,地下水储量对地表负荷形变的影响比土壤水储量大.
4结论
关键词:人工神经网络;信息处理;风险评估
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)06-1285-02
Research on the Application of Artificial Neural Network
LI Hong-chao
(China University of Petroleum (East China), Qingdao 266580,China)
Abstract: Artificial neural networks are part of an integrated artificial intelligence, it is proposed is based on research of modern neuroscience. With the continuous development of artificial neural networks, and their use more widely. This article first analyzes the basic concepts and features of artificial neural networks, from six aspects of information, medicine, psychology and other details of the application of artificial neural networks.
Key words: artificial neural network; information processing; risk assessment
1 人工神经网络
人工神经网络,英文名为“Artificial Neural Network”,简称ANN,它充分分析大脑神经突触联接的结构特点,对其进行模拟,然后进行信息处理。简单来说,人工神经网络就是对人脑结构、人脑功能的模仿。它的特点有很多,比如非线性、非局限性、非常定性、非凸性等。这些特点铸就了人工神经网络的各种功能,促进了它的应用。
2 人工神经网络的应用
随着人们对人工神经网络的不断研究,人工神经网络的作用越来越大,给人们提供了更好的服务,下面就以人工神经网络在信息领域、医学、经济领域、控制领域、交通运输、心理学六个方面分别介绍其应用。
2.1 信息领域
人工神经网络在信息领域的应用分为两个方面,一个是信息处理,一个是信息识别。
1)信息处理
由于现代信息的多样化和多变性的特点,信息处理就变得复杂起来,人工神经网络可以对人的一部分思维能力进行模仿甚至代替,解决传统信息处理的困难。在通常情况下,人工神经网络可以自动诊断问题,开启问题求解模式。另外,人工神经网络系统的容错性能高,当其连接线遭到破坏,自身的组织功能还是可以保持它的优化工作状态。因此,军事系统充分利用这一优势,在其电子设备广泛应用人工网络信息系统。
2)模式识别
这项功能的理论基础有两个,一个是贝叶斯的概率论,另一个是申农提出的信息论。模式识别主要是分析和处理存在于目标体上的各种形式的信息,然后在处理和分析的基础上对目标体进行描述、辨认等过程。随着人工神经网络在模式识别中的应用,传统的模式识别逐渐被取代。随着模式识别的发展,已经逐渐应用到语音识别、人脸识别、文字识别等各个方面。
2.2 医学领域
人体是非常复杂的,在医学中,想要弄清楚疾病的类型、疾病的严重情况等,仅仅依靠传统的望闻问切诊断方法是远远不够的,医学的发展需要运用新技术。人工神经网络应用于医学中,可以分析生物信号,观察信息的表现形式以及研究信息的变化规律,将这三者的结果进行分析和比较,从而掌握病人的病情。
1)生物信号的检测与分析
在医学诊断中,医生基本上都是通过对医学设备中呈现出来的连续波形进行分析。人工神经网络中有一套自适应的动力学系统,该系统由一些数量庞大的简单处理单元互相连接。因此,它具有多种功能,比如Massively Parallelism,即所谓的巨量并行,分布式存贮功能以及强大的自组织自学习功能等。用常规处理法处理生物医学信号分析非常困难,而人工神经网络的功能可以有效解决难题,其在生物医学人脑检测与处理中的应用非常广泛,比如分析电脑信号,对心电信号进行压缩处理,医学图像的识别等,在很大程度上促进了医学的发展。
2)医学专家系统
对于传统的专家系统而言,其工作原理基本上就是先由专家根据自己多年的医学经历,总结自己的经验和所掌握的知识,以某种规则的形式将这些经验和知识存储在电脑中,建立一个专家的知识库,然后借助逻辑推理等方式开展医疗诊断工作。但是,随着专家知识的不断增长和经验的日益丰富化,数据库的规模会越来越大,极有可能产生知识“爆炸”的现象。同时,专家在获取知识的过程中也会遇到困难,导致工作效率低下。人工神经网络中的非线性并行处理方式解决了传统专家系统中的困难,在知识推理、自组织等方面都有了很大的提高,医学专家系统也开始逐渐采用人工神经网络系统。
在医学领域中,麻醉和危重医学的研究过程中,存在很多的生理方面的分析与检测工作,人工神经网络系统有良好的信号处理能力,排除干扰信号,准确检测临床状况的相关情况,有力促进了医学的发展。
2.3 经济领域
经济的快速有效增长是基于人们对市场规律良好的掌握和运用以及对经济活动中的风险评估,及时应对和解决,这样才能保障经济活动的快速发展。人工神经网络应用于经济领域,主要有预测市场价格和评估经济风险两个方面。
1)预测市场价格的波动情况
商品的价格主要是由市场的供求关系和国家宏观调控来变化的。国家的宏观调控是客观存在的,我们可以在遵循国家宏观调控的前提之下分析市场的供求关系,从而预测商品的市场价格。在传统的统计学方法中,在预测价格波动时因其自身的局限性,难以做出科学的判断。人工神经网络可以有效处理不完整数据和规律性不强的数据,它是传统统计方法所不能达到的。人工神经网络系统基于市场价格的确定机制,综合分析影响商品价格的因素,比如城市化水平、人均工资水平、贷款情况等,将这些复杂的因素综合起来,建立一个模型,通过模型中的数据显示,科学预测商品的市场价格波动情况,有效利用商品的价格优势。
2)评估经济风险
经济风险,即Economic Exposure,它指的是由于经济前景的一些不确定因素,导致经济实体出现重大的经济损失。在处理经济风险的时候,做好的措施就是防患于未然,做好评估和预测,将经济风险扼杀在萌芽时期。人为的主观判断经济风险具有一定的可靠性,但是也存在很多的不足。将人工神经网络系统应用于评估经济风险,可以有效弥补人为判断风险的不足。人工神经网络先提取具体风险来源,然后在此基础上构建出一个模型,这个模型一般要符合实际情况,通过对模型的研究,得出风险评价系数,最终确定有效的解决方案。
2.4 控制领域
随着人工神经网络的不断发展,人们开始研究其在控制领域的应用。比如现在的机器人的摄像机控制、飞机控制等。它主要是通过控制图像传感器,再结合图像表面的非线性关系,进行计算和分析,另外,它还可以将图像传感器瞄准到处于运动状态中的目标物上。
2.5 交通运输
交通问题具有高度的非线性特点,它的数据处理是非常庞大和复杂的,这与人工神经网络有很大的吻合性。就目前来讲,人工神经网络应用到交通领域有模拟驾驶员的行为、分析交通的模式等等。
2.6 心理学
人工神经网络是对人脑神经元的信息处理能力的模拟,本身就带有一定的抽象性,它可以训练很多的认知过程,比如感觉、记忆、情绪等。人们通过对人工神经系统的不断研究,多个角度分析了其认知功能。就目前来看,人工神经网络可以分析人的认知,同时对认知方面有缺陷的病人进行模拟,取得了很大的进步。当然,人工神经网络应用于心理学领域也存在很多的问题,比如结果精确度不高、模拟算法的速度不够等,这些都需要人们持之以恒的研究。突破这些难题,促使人工神经网络有效应用于心理学领域。
3 结束语
综上所述,随着人工神经网络的不断发展,它特有的非线性适应能力和自身的模拟结构都有效推动了其应用范围。我们应该不断运用新技术,不断完善人工神经网络的功能,拓宽其应用范围,促进其智能化、功能化方向发展。
参考文献:
[1] 毛健,赵红东,姚婧婧.人工神经网络的发展及应用[J].电子设计工程,2011(12).
[2] 林和平,张秉正,乔幸娟.回归分析人工神经网络[J].吉林大学学报:信息科学版,2010(3).
[3] 李雷雷.人工神经网络在建筑工程估算中的应用研究[D].华北电力大学,2012.
【关键词】自适应距离保护 人工神经网络 BP算法
一、引言
距离保护长期以来一直是复杂电网中高压输电线路最重要的也是应用最广泛的保护方案。这种保护有许多独特的优点,如能瞬时切除输电线80%~90%范围内的各种故障。但是有许多原因会影响阻抗的测量精度,从而影响测量阻抗的计算,使测量阻抗为短路阻抗与附加阻抗之和,从而会引起误动或者拒动。
基于这些问题,本文提出了人工神经网络。近年来,人工神经网络(ANN)逐渐得到电力系统研究人员的高度重视和广泛研究。人工神经网络是由众多的神经元广泛互联而成的网络。人工神经网络以其具有自学习、自适应、较好的容错性和优良的非线性逼近能力,广泛应用于模式识别和模式分类等方面。
本文所采用的三层前向神经网络的学习算法为反传学习算法,即BP算法,学习过程采用反向传播法。
二、基于人工神经网络的距离保护模型
BP网络模型也即多层前向网络(Multi-layer Feedforward Neural Network,MFNN),因其训练算法采用反向传播算法,也即BP算法。由于这种算法在本质上是一种神经网络学习的数学模型,所以,BP算法也通常暗示着神经网络的拓扑结构是一种无反馈的多层前向网络。
人工神经网络是由大量简单的基本元件——神经元相互连接而成的自适应非线性动态系统。一般而言,只要采用三层神经网络,而且对各层神经元数目不加限制,则可在模式空间构成任意复杂程度的几何图形,从而对任意复杂的对象进行分类。
人工神经网络含有输入层、输出层以及处于输入输出层之间的中间层。中间层有单层或多层,由于他们与外界没有直接联系,故也称为隐层。在隐层中的神经元也称隐单元。隐层虽然和外界不连接,但是他们的状态则影响输入输出之间的关系。BP网络的结构的每一层连接权值都可以通过学习来调节,它的基本处理单元(输入层)除外通常为非线性输入输出关系。
三、神经网络的训练及检验
本文通过EMTP仿真的数据预处理中得出了这两个子网络的权值和阀值矩阵中,用一些不同于训练样本的检测样本(本文在故障检测与选相子网络是用40组进行训练,13组进行检测的;对故障定位子网络是用35组进行训练,14组进行校验的)。每一个子网络的隐含层节点的数目,是在训练过程中根据最快的收敛速度和最好的精度标准通过多次采用不同的隐含层节点数目进行训练,反复比较,根据实际的收敛效果和计算精度来选择确定的。其中,故障检测与选相子网络(ANN1)的隐含层数目取为42个,故障定位子网络(ANN2)的隐含层数目取为33个。
在确定了两个子网络的隐含层以后,开始对故障检测和选相子网络(ANN1)和故障定位子网络(ANN2)采用BP算法进行训练。经过对子网络的多次训练,其训练过程是收敛的,其训练速度也是令人满意。
下面将2个子网络的部分训练样本、检验样本及检验结果。
在对第一个、第二个子网络故障检测与选相子网络其训练过程过程是收敛的,其训练速度也是令人满意的。
下面是子网络ANN1的训练样本和训练样本及检测样本。故障类型有:内部故障,A相接地、内部故障,B相接地、内部故障,C相接地、内部故障,两相短路、内部故障,两相接地短路、内部故障,三相短路。理想输出:1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,1;0,0,0,1;0,0,0,1。检验结果:
0.9985,0.0378,0.0838,0.0230;0.0315,0.9988,0.0607,0.0121;0.1004,0.1718,0.9980,0.2715;0.2815,0.0499,0.0614,0.9864;0.2496,0.3688,0.0370,0.9798;0.0197,0.0551,0.0187,0.9981。
从上面可以清楚的看出,故障检测和选相子网络在各种故障情况下都能正确反映故障,并启动保护和正确选相。
在第二个子网络训练过程也是表明故障定位子网络ANN2也是收敛的,其训练速度也是令人满意的。
下面是故障定位子网络ANN2的训练样本和检验样本及结果举例。当故障点线路全长线路全长83%,故障类型分别为单相接地、两相故障、三相故障时,其理想输出为1、1、1;当故障点线路全长线路全长87%,其理想输出为0、0、0。检测结果:当故障点线路全长线路全长83%,输出:0.9867、0.9827、0.9572。当故障点线路全长线路全长87%,输出:0.1758、0.1820、0.1602。
从上面数据可以看到,故障定位子网络距离保护经过训练以后,基本能够正确的识别故障点位置。
四、结论
本论文针对传统距离保护在系统发生振荡和系统经过过渡电阻发生故障时,可能会误动或拒动等,因此,提出了基于BP人工神经网络自适应距离保护原理由两个相互独立的子网络来实现,即故障检测与选相子网络和故障定位子网络。两个子网络组成一个并行处理系统,经过大量的训练样本进行训练,投入实际运行线路中,根据本身需要提取输电线路的运行参数,对电力系统运行状态进行判断。研究结果表明,用人工神经网络实现最复杂的保护原理——距离保护是可行的,而且具有显著的优点。
参考文献:
[1]贺家李,宋从矩.电力系统继电保护原理(第三版)[M].北京:中国电力出版社,2001.
关键词:人工神经网络;前馈神经网络;递归神经网络
中图分类号: TP183 文献标识码: A 文章编号: 1673-1069(2017)06-165-2
1 绪论
人工神经网络(Artificial Neural Network, ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。ANN通过模仿人类大脑的结构和功能,并借鉴生物神经科学的研究成果,实现对信息的处理,是一种新兴的交叉学科,不但推动了智能化计算的应用和发展,同时也为信息科学和神经生物学的研究方法带来革命性的变化,现已成功应用于脑科学,认知科学,模式识别,智能控制,计算机科学等多个领域。
在实际应用中,人工神经网络的选取通常包括适当的神经网络模型,合理的网络结构及快速有效的网络参数训练算法[1]。而针对某一特定网络模型,ANN的研究主要集中在结构的调整和训练算法的改进两个方面。所谓神经网络训练,也就是网络参数的学习和调整,是一个反复调节节点之间权值和阈值的过程,其学习可以分成三类,即有监督学习(Supervised learning),无监督学习(Unsupervised learning)和强化学习(Reinforcement learning),本文基于有监督和无监督学习进行分类,分别分析了前馈神经网络的特点及研究现状、递归神经网络的特点及研究现状。
2 前馈神经网络
2.1 前馈神经网络的特点
前馈神经网络的主要种类包括:感知器,线性神经网络,BP网络,径向基网络(RBF)等。其训练算法主要采用梯度下降法(Gradient descent),包括:误差反向传播算法(Back Propagation, BP),改进的BP算法,Levenberg-Marquardt法(LM)等。前馈神经网络具有学习简单,收敛较快等优点,因此在实际应用中,一般选取三层或以上的网络结构,神经网络的任意逼近定理指出,训练合适的多层前馈神经网络能够以任意精度逼近任意连续函数[2]。当网络结构已知的情况下,训练前馈神经网络的本质就是确定最优权值和阈值的方法,前馈神经网络的训练方式一般采用网络理想输出和实际输出的误差作为权值调整信号,解空间一般是多峰函数,由于训练过程中很容易陷入局部极小,因此网络的训练目标就是求解一组最优的权值,使误差达到最小。
传统的误差反向传播算法由于为网络的训练提供了简单而有效的实现途径,目前已成为研究和应用最广泛的有监督学习算法。但BP算法存在许多问题,例如在多层网络中收敛较慢且容易陷入局部极小,而且不能对多个网络进行同时训练[3]。改进的BP算法有多种形式,主要有通过附加动量和学习率的引入改进BP网络的自适应能力等方法,附加动量方法虽然在一定程度上改善了易陷入局部极小的问题,仍然存在收敛速度较慢的问题。调整学习率方法通过将学习率限制在一定范围内自动调整,虽然能够提高网络收敛速率,但对权值的改变和影响并不大,仍然导致误差较大问题。LM法具有训练时间段,收敛速度快的优点,但由于LM法需要计算误差的Jacobian矩阵,这是一个复杂的高维运算问题,需要占用大量系统存储空间,同时,LM也存在易陷入局部极小的问题[4、5]。
2.2 前馈神经网络的研究现状
在传统的神经网络训练过程中,预估校正法或者经验选择是最常被使用的网络结构选取方式[6]。在训练和优化网络权值和阈值过程中,训练算法在上述分析中已知,存在着容易陷入局部最优并且难以跳出的缺点,因此误差函数要求必须是连续可求导的函怠R虼耍这些权值训练方法常和进化算法等全局搜索算法相结合。使用全局搜索算法的全局搜索能力帮助网络跳出局部极小。在编码时采用实数编码,克服二进制编码受到编码串长度和精度的限制。例如,Sexton等人用一种改进的遗传算法优化前馈神经网路权值,结果表明改进的算法使网路训练精度得到显著提高[3]。Abbass通过将传统BP算法和差分进化算法相结合,提出了一种的新的权值训练方法并用于乳腺癌的预测实验,取得较好结果[7]。Iionen等人使用差分进化算法对前馈网络的权值进行训练和优化,将优化结果与其他几种基于梯度下降的网络训练方法比较,结果表明该方法具有较好的精度[8]。更多研究成果表明,将DE、PSO应用于网络权值在线训练和优化具有明显优势,这些改进方法也成功应用在了医学和工程技术等领域[9、10]。
此外,多种优化算法相结合也被证明是有效的。例如,在文献[11]中,作者提出了一种DE和LM相结合的神经网络快速训练方法。Liu等人提出一种粒子群算法(Particle Swarm Optimization, PSO)和共轭梯度算法相结合的混合算法,并将其应用于神经网络的权值优化[12]。在优化过程中,首先确定网络结构,然后使用PSO的全局搜索能力获得最后权值组合,最后使用传统方法进行权值微调,取得较好结果。在文献[13]中,作者采用相反方式将基本PSO和传统BP算法相结合使用,首先用BP算法对网络权值进行计算,然后使用PSO对网络结构固定的权值进行优化和改进。有学者提出一种具有控制参数自适应选择能力的差分进化算法,用于训练前馈网络,并将该方法用于奇偶分类实验中,将实验结果与几种其他方法进行比较得知,提出的方法具有更好的准确性。Epitropakis等人在训练离散Pi-Sigma神经网络实验中,采用一种分布式离散差分进化算法和分布式离散PSO算法相结合的方式。该离散网络仍然是一种多层前馈网络,在输出层,通过将神经元求积的方式获得输出,作者认为这种整数权值的离散方式更适合用于硬件实现[14]。在离散化权值方面,Bao等人的工作表明,通过采用一种可重建的动态差分进化算法,可以有效用于训练固定结构的网络权值。
在不同领域中,任务往往各不相同,因此针对不同的动态系统,不同类型的递归网络的也相继被提出并得到研究,使之成为人工智能界的研究热点之一。因其具有独特的优化能力,联想记忆功能,递归神经网络已引起AI界极大的研究和关注,并成功应用于多种模式识别问题,例如图像处理,声音辨识,信号处理等。
4 结论
本章分析和研究了神经网络的两种主要类型,前馈型和递归型,并对其特点进行了分析。前馈网络的主要特点是计算简单,运算方便,缺点是耗时较长,容易陷入局部极小;递归网络的特点是具有动力学特性和联想记忆特性,但使用时需要注意稳定性和收敛性,且对初始状态具有高度敏感特性。针对两类神经网络的特点,可通过多种优化相结合的方法解决收敛较慢且容易陷入局部极小问题,应用参数学习训练算法和网络结构优化算法对递归网络进行适当的调整,以应用于具体问题。
参 考 文 献
[1] N. Garcia-Pedrajas, C. Hervas-Martinez, J. Munoz-Perez. COVNET: a cooperative coevolutionary model for evolving artificial neural networks [J]. IEEE Transaction on Neural Networks, 2003, 14(3): 575-596.
[2] K. Hornick, M. Stinchcombe, H. White. Multilayer feedforward networks are universal approximators [J]. Neural Networks, 1989, 2: 359-366.
[3] R.S. Sexton, R.S. Sriram, H. Etheridge. Improving decision effectiveness of artificial neural networks: a modified genetic algorithm approach [J]. Decis Sci, 2003, 34(3):421-442.
[4] 商琳, 王金根, 姚望舒,等. 一N基于多进化神经网络的分类方法[J]. 软件学报, 2005, 16(9): 1577-1583.
[5] S.U. Ahmed, M. Shahjahan, K. Murase. Injecting chaos in feedforward neural networks [J]. Neural Process Lett, 2011, 34(1): 87-100.
[6] Serkan Kiranyaz, Turker Ince, Alper Yildirim, et al. Evolutionary artificial neural networks by multi-dimensional particle swarm optimization [J]. Neural Networks, 2009, 22: 1448-1462.
[7] H.A. Abbass. An evolutionary artificial neural networks approach for breast cancer diagnosis [J]. Artificial Intelligence in Medicine, 2002 , 25 (3) : 265-281.
[8] J. Iionen, J.K. Kamarainen, J. Lampinen. Differential Evolution Training Algorithm for Feed-forward Neural Networks [J]. Neural Processing Letters, 2003, 17(1) : 93-105.
[9] D.M. George, P.P. Vassilis, N.V. Michael. Neural network-based colonoscopic diagnosis using on-line learning and differential evolution [J]. Applied Soft Computing, 2004, (4) : 369-379.
[10] B. Liu, L. Wang, Y.H. Jin, et al. Designing neural networks using hybrid particle swarm optimization [C]. Lecture Notes in Computer Science. Berlin : Springer , 2005 : 391-397.
[11] 王刚, 高阳, 夏洁. 基于差异进化算法的人工神经网络快速训练研究 [J]. 管理学报, 2005, 2 (4) : 450-454.
[12] L. B. Liu, Y. J. Wang, D. Huang. Designing neural networks using PSO-based memetic algorithm [C]. in: Proceedings of the Fourth International Symposium on Neural Networks (ISNN’07), 2007, pp. 219-224.
关键词:神经网络;非线性回归网络;ARIMA模型
中图分类号:TP393 文献标识码:A 文章编号;1009-3044(2017)07-0162-03
1介绍
预测股市指数及其趋势已被认为是时间序列预测中最具挑战性的应用之一。根据现有提出的有效市场理论,股价遵循随机路径,实际上不可能根据历史数据制定特定的长期预测模型。ARIMA和ANN技术已经成功地用于建模和预测金融时间序列。与作为复杂预测系统的ANN模型相比,ARIMA模型被认为是更容易的训练和预测技术。神经网络的一个重要特征是能够从他们的环境中学习,并通过学习在某种意义上提高性能。其中一个新的趋势是专门的神经结构与学习算法的发展,提供替代工具用来解决特征提取,信号处理和数据预测等问题。近年来,在使用ARIMA模型进行金融时间序列预测的金融数据分析领域中进行了一系列研究。Meyler等人使用ARIMA模型来预测爱尔兰通货膨胀。Contreras等人使用ARIMA方法预测第二天的电价。FxJiger等人用于ARIMA模型来预测在土耳其通过燃料一次能源的需求。Datta使用相同的Box和Jenkins方法预测孟加拉国的通货膨胀率。A1-Zeaud已经使用ARIMA模型来建模和预测银行部门的波动率。
本文的结构如下。在本文的第二部分,我们简要介绍ARIMA模型进行预测。接下来,给出了旨在预测特定股票收盘价的外部输入的非线性自回归网络。应用于数据预测的基于ANN的策略是针对ARIMA模型进行分析的,并且在文章的第四部分中描述了这些模型的比较分析。关于报告的研究的结论在本文的最后部分提出。
2RIM模型
自回归积分移动平均(ARIMA)模型和Box-Jenkins方法是一种统计分析模型。它主要用于时间序列分析的计量经济学和统计学。ARIMA模型使用时间序列数据来预测系列中的未来点。非季节性ARIMA模型由ARIMA(p,d,q)表示,其中p,d,q是非负整数,它们分别是自回归(AR),集成(I)和移动平均(MA)的参数。
(1)
(2)
(3)
可以使用ARMA过程开发的预测技术的扩展来解决预测ARIMA过程的问题。预测ARMA(p,q)过程中最常用的方法之一是用于计算最佳线性预测变量(Durbin-Levison算法,创新算法等)的递归技术类。在下面我们描述使用创新算法的递归预测方法。
3用于预测股票收盘价的基于ANN的模型
具有旨在预测特定股票的收盘价的外部输入的非线性自回归网络的过程如下所示;
我们假设Yt是时间z时刻的股票收盘价。对于每个时刻t,我们用Xt=(Xt(1),Xt(2),…,Xt(n)表示与Yt显著相关的指标的值的向量,即在Xt(i)和Yt之间的相关系数大于某一阈值。
我们研究中使用的神经模型是一个动态网络。直接法用于建立股票平仓值的预测模型,具体描述如下。
(4)
(5)
(6)
所考虑的延迟对训练集和预测过程具有显著影响。我们使用相关图为我们的神经网络选择适当的窗口大小。我们需要消除部分自相关函数(PACF)在统计上不相关的滞后。
具有外部输入的非线性自回归网络(NARX)是一个递归动态网络,反馈连接包含网络的多个层。NARX网络的输出可以被认为是某个非线性动态系统的输出估计。由于在网络训练期间实际输出是可用的,所以产生串并联架构,其中估计输出被实际输出替代。这个模型的优点有两个方面;一方面,在训练阶段中使用的输入更精确,另一方面,由于所得到的网络具有前馈结构,因此可以使用静态反向传播类型的学习。
NARX网络在这里用作预测器,预测公式如下:
(7)
在图1中描述了该串并联神经网络的示例,其中d=2,n=10并且隐层中的神经元的数量是24。
隐藏层和输出层中的神经元的激活函数可以以多种方式定义。在我们的测试中,我们采用逻辑函数(8)来模拟属于隐藏层的神经元的激活函数,并且单位函数对属于输出层的神经元的输出进行建模。
(8)
在训练步骤之后,串并联架构被转换为并行配置,以便执行多级提前预测任务。相应的神经网络架构如图2所示。我们使用标准性能函数,由网络误差的平均和确定。取消数据分割过程以避免提前停止。
用于更新权重和偏差参数的网络训练函数对应于具有反向传播算法的自适应学习速率变体的梯度下降。在下面,我们考虑基于梯度的学习算法的类,其一般更新规则由下式所以:
(9)
在本文中我们用E来表示误差函数,该误差函数根据训练集合上的平方差误差函数的和来定义。具有自适应学习速率的基于反向传播梯度的算法通过使误差函数最小化而产生。
为了提供基于准牛顿法的正割方程的两点近似,在每个时期定义的学习速率为;
(10)
在这种情况下,基于梯度的学习方法可能超过最佳点或者甚至发散。
4实验结果
我们用样本数据集测试了模型。样本是在2009和2014之间的每周观察量的一组变量S。集合S包含来自证券交易所的SNP股票的开盘价,收盘价,最高价和最低价,以及从股票市场的技术和基础分析获得的七个指标。
相关图显示,对于所有变量,PACF函数在第二滞后之后立即下降。这意味着所有变量的窗口大小可以设置为2。在我们的测试中,我们使用200个样本用于训练目的和100个样本用于数据预测。
神经网络参数基于以下过程确定:
1.初始化NN的参数。
2.使用6000个时期中的训练样本集训练NN。
对于已经训练的数据,根据MSE测量计算的总体预测误差小于某个阈值。
在我们的测试中,阈值设置为0J 001。如果我们用T=(T(1),T(2),…,T(nr)表示目标值的向量,并用(P(1),P(2),…,P(nr))表示其条目对应于预测值的向量,则MSE误差测量由:
(11)
使用上述技术获得的结果报告如下。对已经训练的数据预测计算的总体预测误差为0.000 35。在已训练的数据上计算的回归系数和数据拟合在图3中示出。在已经训练样本的情况下的网络预测与实际数据在图4中示出。在新数据预测上计算的总预测误差为0.001 2。在图5中示出了在新颖镜那榭鱿碌耐络预测与实际数据。
我们用基于神经网络的方法和ARIMA预测方法进行比较分析。首先,我们使用自相关函数(ACF)和部分自相关函数(PACF)来确定时间序列是否稳定。在平稳时间序列的情况下,ACF迅速衰减。由于ACF的计算值表明函数衰减非常缓慢,我们认为考虑的时间序列是非稳定的。为了调整ARIMA模型的差分参数,分别计算了一阶和二阶差分序列。由于在使用一阶差分系列的情况下,ACF的值非常小,我们得出结论,ARIMA模型的差分参数应设置为1。
基于以下标准调整与AR(p)和MA(g)过程相关的ARIMA模型的参数:BIC(贝叶斯信息准则)的相对小的值,调整的R2(确定系数)的相对高的值和相对小回归标准误差(SER)。根据这些结果,从上述标准的角度来看,最佳模型是ARIMA(1,1,1)模型。我们得出结论,最佳拟合模型是ARIMA(1,1,0)和ARMA(1,1,1)。
在使用ARIMA(1,1,0)模型的情况下,对新数据预测计算的总体预测误差为0.007 7,而在使用ARIMA(1,1,1)模型的情况下为0.009 6。预测的结果如图6所示。
关键词:模糊控制;人工神经网络;人脸识别
中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)16-3904-03
随着人工智能技术的飞速发展,机器视觉已经成为当前人工智能研究领域的一大热点,很多国家的研究人员都开展了对机器视觉的研究,其中以机器视觉识别人脸最为困难,这主要是因为人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,如何让计算机通过机器视觉高效率的识别人脸,成为当前机器视觉和智能机器人关键技术领域的技术难题。
随着模糊逻辑控制算法和人工神经网络算法的发展,对于机器视觉识别人脸特征的算法也有了新的发展,目前多数研究算法所采用的人脸识别从实现技术上来说,主要可以分为以下几个类别:
1) 基于人脸几何特征进行的识别算法,该算法运算量较小,原理简单直观,但是识别率较低,适合应用于人群面部的分类,而不适宜于每一个人脸的识别。
2) 基于人脸特征的匹配识别算法,这种算法是预先构建常见的人脸特征以及人脸模板,构成人脸特征库,将被识别的人脸与特征库中的人脸进行逐一比对,从而实现人脸识别,该算法识别效率较高,但是应用有一定局限性,只能够识别预先设立的人脸特征库中的人脸模型,因此人脸特征库就成为该算法实现的技术关键。
3) 基于统计的人脸识别算法,该算法将人脸面部进行特征参数的划分,如两眼距离大小,五官之间距离等,通过构建统计特征参数模型实现对人脸模型的识别,该算法识别率较高,但是算法实现起来运算量比较大,且识别效率较低。
4) 基于模糊逻辑的人脸识别算法,这一类算法主要结合了模糊逻辑和神经网络能够自我训练学习的机制实现对人脸的识别,识别率较高,且算法运算量适中,但是算法的原理较难理解,且模糊逻辑控制规则的建立存在一定技术难度。
本论文主要结合模糊人工神经网络方法,将其应用于计算机人脸识别,以期从中能够找到有效可靠的人脸识别方法及其算法应用,并以此和广大同行分享。
1 模糊逻辑及人工神经网络在图像辨识中的应用可行性分析
1) 人脸识别的技术难点
由于计算机只能够认识0和1,任何数据,包括图像,都必须要转化为0和1才能够被计算机识别,这样就带来一个很复杂很棘手的问题:如何将成千上万的带有不同表情的人脸转变为数字信号并被计算机识别。由于人的面部带有表情,不同的人具有不同的脸,而不同的脸具有不同的表情,不同的表情则具有不同的面部特征,因此这些都成为了计算机识别人脸特征的技术难点,具体来说,人脸实现计算机识别的主要技术难度包括:
① 人脸表情:人有喜怒哀乐等不同表情,不同的表情具有不同的面部特征,因此如何分辨出不同表情下的人脸特征,这是首要的技术难点;
② 光线阴影的变换:由于人脸在不同光线照射下会产生阴影,而阴影敏感程度的不一也会增加计算机识别人脸特征的难度;
③ 其他因素:如人随着年龄的增长面部特征会发生些微变化,人脸部分因为装饰或者帽饰遮挡而增加识别难度,以及人脸侧面不同姿态也会对计算机识别带来技术难度。
2) 模糊人工神经网络在人脸辨识中的应用可行性
如上分析所示,计算机识别人脸,需要考虑的因素太多,并且每一种因素都不是线性化处理那么简单,为此,必须要引入新的处理技术及方法,实现计算机对人脸的高效识别。根据前人的研究表明,模糊人工神经网络算法是非常有效的识别算法。
模糊理论和神经网络技术是近年来人工智能研究较为活跃的两个领域。人工神经网络是模拟人脑结构的思维功能,具有较强的自学习和联想功能,人工干预少,精度较高,对专家知识的利用也较少。但缺点是它不能处理和描述模糊信息,不能很好利用已有的经验知识,特别是学习及问题的求解具有黑箱特性,其工作不具有可解释性,同时它对样本的要求较高;模糊系统相对于神经网络而言,具有推理过程容易理解、专家知识利用较好、对样本的要求较低等优点,但它同时又存在人工干预多、推理速度慢、精度较低等缺点,很难实现自适应学习的功能,而且如何自动生成和调整隶属度函数和模糊规则,也是一个棘手的问题。如果将二者有机地结合起来,可以起到互补的效果。
模糊逻辑控制的基本原理并非传统的是与不是的二维判断逻辑,而是对被控对象进行阈值的设计与划分,根据实际值在阈值领域内的变化相应的产生动态的判断逻辑,并将逻辑判断规则进行神经网络的自我学习,逐渐实现智能判断,最终实现准确的逻辑判断。相较于传统的线性判断规则,基于模糊规则的神经网络是高度复杂的非线性网络,同时由于其广阔的神经元分布并行运算,大大提高了复杂对象(如人脸)识别计算的效率,因此,将模糊神经网络算法应用于人脸的智能识别是完全可行的。
2 基于模糊人工神经网络的人脸识别方法研究
2.1 基于模糊神经网络的人脸识别分类器设计
1) 输入、输出层的设计:针对模糊神经网络层的输入层和输出层的特点,需要对识别分类器的输入、输出层进行设计。由于使用BP神经网络作为识别分类器时,数据源的维数决定输入层节点数量,结合到人脸的计算机识别,人脸识别分类器的输入输出层,应当由人脸特征数据库的类别数决定,如果人脸数据库的类别数为m,那么输入、输出层节点数也为m,由m个神经元进行分布式并行运算,能够极大提高人脸识别的输入和输出速度。
2) 隐藏层结点数的选择:由于一般的BP神经网络都是由3层BP网络构成:输入层,隐藏层和输出层,隐层的数量越多,BP神经网络越复杂,那么最终能够实现的运算精度就越高,识别率也就越高;但是随着隐层数量的增加,随之而来的一个突出的问题就是神经网络变的复杂了,神经网络自我训练和学习的时间变长,使得识别效率相对下降,因此提高精度和提高效率是应用模糊神经网络的一个不可避免的矛盾。在这里面向人脸识别的分类器的设计中,仍然采用传统的3层BP神经网络构建人脸识别分类器,只设计一层隐层,能够在保障识别精度的前提下有效的保障神经网络学习和训练的效率,增加人脸识别的正确率。
3) 初始值的选取:在设计了3层BP神经网络的基础上,需要确定神经网络的输入初始值。由于模糊神经网络是非线性的,不但具有线性网络的全部优点,同时还具有收敛速度快等特点,而初始值的选取在很大程度上影响神经网络的学习训练时间的长短,以及是否最终能够实现收敛输出得到最优值。如果初始值太大,那么对于初始值加权运算后的输出变化率趋向于零,从而使得神经网络自我学习训练趋向于停止,最终无法得到收敛的最优值;相反,我们总是希望初始值在经过每一次加权运算后的输出都接近于零,从而能够保证每一个参与运算的神经元都能够进行调节,最终实现快速的收敛。为此,这里将人脸识别的初始值设定在[0,0.2]之间,初始运算的权值设定在[0,0.1]之间,这样都不太大的输入初始值和权值初始值能够有效的保证神经网络快速的收敛并得到最优值。
如果收敛速度太慢,则需要重新设置权值和阈值。权值和阈值由单独文件保存,再一次进行训练时,直接从文件导出权值和阈值进行训练,不需要进行初始化,训练后的权值和阈值直接导入文件。
2.2 人脸识别的神经网络训练算法步骤
1) 神经网络的逐层设计步骤:神经网络需要按层进行设计,构建信号输入层、模糊层以及输出层,同时还要构建模糊化规则库,以构建神经网络模糊算法的完整输入输出条件。具体构建人脸识别的神经网络层可以按照下述步骤执行:
Step 1,构建信号输入层,以视觉摄像头为坐标原点构建人脸识别坐标系统,这里推荐采用极坐标系统构建识别坐标系,以人脸平面所处的角度与距离作为信号的输入层,按照坐标系的变换得到神经网络信号输入的距离差值和角度差值Δρ,Δθ,作为完整的输入信号。
Step 2,构建模糊化层,将上一层信号输入层传输过来的系统人脸识别信号Δρ与Δθ进行向量传输,将模糊化层中的每一个节点直接与输入信号向量的分量相连接,并进行信号矢量化传输;同时在传输的过程中,根据模糊化规则库的条件制约,对每一个信号向量的传输都使用模糊规则,具体可以采用如下的隶属度函数来进行模糊化处理:
(1)
其中c ij 和σij分别表示隶属函数的中心和宽度。
Step 3,构建信号输出层,将模糊化层经过模糊处理之后的信号进行清晰化运算,并作为最终结果输出。
关于模糊规则库的建立,目前所用的方法都是普遍所采用的匹配模糊规则,即计算每一个传输节点在模糊规则上的适用度,适用就进行模糊化规则匹配并进行模糊化处理,不适用则忽略该模糊规则并依次向下行寻找合适的模糊规则。当所有的,模糊规则构建好之后,需要对每条规则的适用度进行归一化运算,运算方法为:
(2)
2) 人脸的识别算法按如下步骤执行:
Step 1:一个样本向量被提交给网络中的每一个神经元;
Step 2:计算它们与输入样本的相似度di;
Step 3:由竞争函数计算出竞争获胜的神经元,若获胜神经元的相似度小于等于相似度门限值ν,则计算每个神经元的奖惩系数γi,否则添加新的神经元;
Step 4:根据学习算法更新神经元或将新添加的神经元的突触权值置为x;
Step 5:学习结束后,判断是否有错误聚类存在,有则删除。
其中,
(3)
di是第i个神经元的相似度值,β为惩罚度系数,ν为相似度的门限值。γ的计算方法是对一个输入样本x,若竞争获胜神经元k的相似度dk≤ν,则获胜神经元的γk为1,其它神经元的γi=-βdi/ν,i≠k;若dk >ν,则添加新的神经元并将其突触权值置为x。
实际上,网络训练的目的是为了提高本算法的权值实用域,即更加精确的实现对人脸特征的识别,从而提高算法的人脸识别率,当训练结束后,即可输出结果。
2.3 算法仿真测试
为了验证本论文所提出的人脸识别模糊神经网络算法的有效性和可靠性,对该算法进行仿真测试,同时为了凸显该算法的有效性,将该算法与传统的BP神经网络算法进行对比仿真测试。
该测试采集样本500张人脸图片,分辨率均为128×128,测试计算机配置为双核处理器,主频2.1GHz,测试软件平台为Matlab,分别构建BP神经网络分类器与本算法的神经网络分类器,对500幅人脸图片进行算法识别测试。
如表1所示,为传统BP神经网络算法和本论文算法的仿真测试结果对比表格。
从表1所示的算法检测对比结果可以发现:传统的算法也具有人脸特征的识别,但是相较于本论文所提出的改进后的算法,本论文提出的算法具有更高的人脸特征识别率,这表明了本算法具有更好的鲁棒性,神经网络模糊算法的执行上效率更高,因而本算法是具有实用价值的,是值得推广和借鉴的。
3 结束语
传统的图像识别技术,很多是基于大规模计算的基础之上的,在运算量和运算精度之间存在着不可调和的矛盾。因人工神经网络技术其分布式信息存储和大规模自适应并行处理满足了对大数据量目标图像的实时处理要求,其高容错性又允许大量目标图像出现背景模糊和局部残缺。相对于其他方法而言,利用神经网络来解决人脸图像识别问题,神经网络对问题的先验知识要求较少,可以实现对特征空间较为复杂的划分,适用于高速并行处理系统来实现。正是这些优点决定了模糊神经网络被广泛应用于包括人脸在内的图像识别。本论文对模糊神经网络在人脸图像识别中的应用进行了算法优化设计,对于进一步提高模糊神经网络的研究与应用具有一定借鉴意义。
参考文献:
[1] 石幸利.人工神经网络的发展及其应用[J].重庆科技学院学报:自然科学版,2006(2):99-101.
[2] 胡小锋,赵辉.Visral C++/MATLAB图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.
[3] 战国科.基于人工神经网络的图像识别方法研究[D].北京:中国计量科学研究院,2007.
[4] 王丽华.基于神经网络的图像识别系统的研究[D].北京:中国石油大学,2008.
[5] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[6] 金忠.人脸图像特征抽取与维数研究[D].南京:南京理工大学,1999.
1.1人工神经网络研究简况
1943年,生理学家W.S.McCulloch和数学家W.A.Pitts首次提出二值神经元模型。半个世纪以来人们对神经网络的研究经历了五六十年代的第一次热潮,跌人了70年代的低谷;80年代后期迎来了第二次研究热潮,至今迭起,不亚于二战期间对原子弹研究的狂热。
人工神经网络是模仿生物脑结构与功能的一种信息处理系统。作为一门新兴的交叉学科,人工神经网络以其大规模并行结构、信息的分布式存储和并行处理,具有良好的自适应性、自组织性和容错性,具有较强的学习、记忆、联想、识别功能气引起众多领域科学家的广泛关注,成为目前国际上非常活跃的前沿领域之一。
1.2人工神经网络的基本模型及其实现
1.2.1人工神经网络的基本模型人工神经网络的基本模型见表1?
1.2.2以误差逆传播模型说明人工神经网络的实现人工神经网络中应用最多的是误差逆传播(ErrorBack-Propagation)网络,简称BP网络,从结构讲’BP网络是典型的多层网络,分为输入层、隐含层和输出层3层,层与层的神经元之间多采用全互连方式,而同层各神经元之间无连接,见图1。BP网络的基本处理单元(输入层单元除外)为非线性输人-输出关系,一般选用S型作用函数f(x)=l/(1+e-当给定网络一个输人模式时,它由输人层单元传到隐含层单元,经隐含层单元逐层处理后再送到输出层单元,由输出层单元处理后产生一个输出模式。这是一个逐层状态更新的过程,称为前向传播。如果期望输出与实际输出之间的误差不满足要求,那么就转人误差反向传播,将误差值沿通路逐层传送并修正各层连接权值(w1,W2),这是一个逐层权值更新的过程,称为误差反向传播过程。随着2个过程的反复进行,误差逐渐减小,直至满足要求为止。
2常用人工神经网络模型的应用分析
当前,人工神经网络方法主要应用于有机有毒化合物毒性的分类及定量预测、对不同污染物生物降解性能的预测、单要素环境质量评价、环境质量综合评价、环境预测、环境综合决策等方面。
2.1预测性能的分析
以BP网络为例,就近两年来应用BP网络进行预测的成功研究来看,人工神经网络的预测性能得到了充分的肯定。
1997年,刘国东等141应用BP网络建立的雅砻江和嘉陵江流域气温、降水和径流之间关系的网络模型,具有较高的拟合精度和预报精度,并具有精度可控制的优点。计算结果同国内外研究成果的一致性表明,用BP网络分析、研究气候变化对一个地区(或流域)水资源环境的影响是一种新颖、有效的方法。
王瑛等w指出,当外界环境和系统本身性质发生剧烈变化时,BP网络能提供一种有效的方法来更新模型,实现新旧模型之间的转换。他们利用最近12年(1981~1992年)的环境经济数据对2000年环境指标进行了预测,并根据预测结果对未来的环境对策进行了分析。这为解决环境预测的模型问题提供了一条新思路。
张爱茜等用人工神经网络预测含硫芳香族化合物好氧生物降解速率常数和孙唏等⑺对胺类有机物急性毒性的分类及定量预测的结果都说明了,人工神经网络作为一种非线性模型预测能力大大优于多兀线性回归模型。
2.2 评价性能的分析
人们在环境评价中主要应用了BP网络、Hopfield网络、径向基函数网络等模型,并不断地改进应用方法,对其在环境评价中的性能进行比较研究》李祚泳的研究结果表明BP网络用于水质评价具有客观性和实用性。刘国东等?改进了BP网络的应用kf法,并比较了BP网络与Hopfield网络在水质综合评价中的性能。他们指出Hopfield网络采用模式(图象)联想或匹配,既适用于定量指标的水质参数又适用于定性指标的水质参数,而且使水质评价形象化,因此更优于BP网络.郭宗楼等将径向基函数人工神经网络(RBF—ANN)模型应用于城市环境综合评价,结果-表明RBF网络不仅具有良好的推广能力,而且避免了反向传播那样繁琐、冗长的计算,其学习速度是常用的BP网络无法比拟的。郭宗楼等[|11又以三峡工程为背景,把该模型应用于水利水电工程环境影响综合评价的人工神经网络专家系统中,与分级加权评价法相比较具有更高的推理效率。
环境科学研究的问题,如环境污染、生态破坏、自然灾害、资源耗竭、人口过量等等,无一不是在某种程度上损伤或破坏了人——环境的和谓。人——环境关系有着自身的变化规律,是可以进行科学量度的。显然这一M?度是多方位、多因素的非线性评价问题,至今尚未建立起一种适当的评价模型,我们是否可以借鉴人工神经网络的应用优点,考虑建立基于人工神经网络方法的评价模型。
关键词:人工神经网络 化工安全评价
化工生产具有易燃、易爆、易挥发、易中毒、有腐蚀性等特点,因而较其他工业生产部门有更大的危险性,安全评价工作是安全生产和安全管理的重要环节,安全评价方法的选择是安全评价工作的关键,直接关系到评价的深度和准确度,影响评价的效果。小波神经网络具有自适应、自组织、自学习的功能和非线性问题的处理能力,可以通过小波神经网络对化工企业安全评价中的评价指标体系进行建模分析与评判。通过MATLAB工具能够方便快速准确地建立小波神经网络,不需要繁琐工作,这让化工安全评价具有了较强的实用价值与现实意义。
本文根据某大型炼油化工有限公司的主要生产工段提供的安全状态原始指标数据,在对整个企业进行安全评价的数据整理和分析基础之上,进行安全评价网络结构、相应参数以及网络训练过程参数的设计,对网络性能进行综合测试,以达到适应石化企业安全评价的目的。根据对某大型炼油化工有限公司提供的原油脱盆脱水工段、减压蒸馏工段、催化裂化_T一段、催化重整工段、加氢裂化工段、延迟焦化工段、炼厂气加工工段的生产装备因素指标安全原始数据进行分析和整理,得出20个实例样本,其中15个样本用来完成对神经网络的训练,5个样本用来结果验证。原始数据的训练结果期望目标值与评价结果的输出如下表(安全评价输出结果等级划分对照表):
一,安全评价系统神经网络结构的确定
人工神经网络的拓扑结构是由网络的层数、各层的节点数以及节点之间的连接方式组成的。本研究拟采用小波神经网络对化工企业安全生产进行建模评价。如前所述,小波神经网络只有相邻层上的节点相互连接,所以,在设计网络的结构时,关键的参数只涉及到网络的层数和各层的神经元个数。
网络的层数对网络的性能具有重要的影响,确定网络层数的方法是通过大量对实际问题的求解来寻求最合适的网络层数。在确定了网络的层数之后,各层的神经元个数同样也是需要确定的关键参数,神经元的个数对网络的训练及网络收敛速度存在很显著的影响,如果隐含层的节点数太少,网络不能建立复杂的判断界,从而无法识别以前没有的样本,且容错性差;而节点数过多,则学习时间长,使网络的泛化能力降低。在函待解决的评价问题上,对应于各评价指标体系,网络的输入层和输出层的神经元个数是确定的,可以调整的参数是隐含层及隐含层神经元的个数。
在前面分析的基础上,综合考虑整个评价问题,决定采用三层神经网络结构模型。由于化工企业安全评价指标体系中各个单元的评价指标数目不同,在对网络进行训练时隐含层的神经元个数根据各评价单元的收敛情况进行适当的调整。
二、网络样本输入数据的初始化
1,数据初始化的方法
在神经网络的训练过程中,传递激活函数是网络训练的关键环节。传递函数的特征要求输入的信息数据必须在区间[0,1]之内,因此必须对网络训练所需要的原始数据进行初始化处理,使它们转化为分布在[0,1]区间范围内的数据。初始化的具体方法取决于原始数据的数量级,根据每组输入数据中的最大值来确定初始化的数量级,并根据下式确定用于网络输入的数据。
2,网络训练样本数据的准备
根据相关的评价指标体系各单元指标以及对人工神经网络进行理论分析的结果,准备基于神经网络的安全评价模型的训练样本数据。根据对某大型炼油化工有限公司提供的原油脱盐脱水工段、减压蒸馏工段、催化裂化工段、催化重整工段、加氢裂化工段、延迟焦化工段、炼厂气加工工段的安全原始数据进行分析和整理,得出20个实例样本,应用这些实例样本完成对小波神经网络的训练。
在神经网络的训练过程中,传递激活函数是网络训练的关键环节。传递函数的特征要求输入的信息数据必须在区间[O,1]之内,因此必须对网络训练所需要的原始数据进行初始化处理,使它们转化为分布在[O,1]区间范围内的数据表。
3,网络训练过程及结果
根据上面的训练样本数据使用MATLAB6.5软件对网络进行训练,使误差落在要求的范围之内并确定网络内部结构参数权值。网络结构参数表示为(L一M一N),其中,L为网络输入矢量的个数,M为隐含层神经元的个数,N为输出层神经元的个数,在本训练中均为5。网络结构参数确定之后,将获得的原始数据输入,对各因素的网络进行训练,由此可以实现从因素到结果之间映射知识的获取,即分别获得网络单元之间的连接权值向量及各隐含层的阈值向量。
生产装备因素。网络结构参数为(4-11-5),网络迭代次数n=3824.
生产人员素质因素。网络结构参数为(10-12-5),网络迭代次数n=2348.
管理因素。网络结构参数为(3-10-5),网络迭代次数n=3407.
环境条件因素。网络结构参数为(3-7-5),网络迭代次数n=2986.
通过训练获得的神经网络模型即可用于对新的输入进行结果的预测评价。由此可知,蕴藏于神经网络中的知识的获取可以通过计算机软件的学习来实现,参与安全评价的专家只需要提供一定数量的实例以及它们所对应的解,并且只需要知道实例与解之间存在着某种特定关系,而对于究竟具体是何种关系,可以由计算机学习来获得,只要所使用的实例样本空间足够大,就可以比较准确地模拟人的思维判断。
参考文献:
[1]李延渊,吴文新等编著,MATLAB神经网络仿真与应用【M】,科学出版社,2003
关键词 神经网络;空调;应用
中图分类号 TP387 文献标识码 A 文章编号 1673-9671-(2012)071-0184-02
中央空调系统是一个庞大复杂的系统,主要包括:空调冷热源系统、水或空气系统、控制系统等,空调系统能耗与影响因素之间是一种多变量、强耦合、严重非线性的关系,具有很强的动态性。而人工神经网络可以实现从输入到输出的任意非线性映射,能够模拟高度非线性系统,具有较强的学习能力、自适应能力、容错能力和联想能力,已成为复杂的非线性系统建模、仿真、预测的新型工具,人工神经网络自20世纪40年代初被首度提出来以后,经过几十年的发展,广泛运用于模式识别和图像处理、控制与优化、人工智能等方面。随着我国空调事业的快速发展及节能减排新形下,人工神经网络在空调系统中的运用越来越受到广大暖通空调研究者的关注。
1 神经网络
神经网络是对人脑或生物神经网络的抽象和建模,具有从环境学习的能力,以类似生物的交互方式适应环境。人工神经网络是一个由大量简单的神经元广泛联接组成的复合系统,当系统被训练达到平衡后,由各个神经元的权值组成的整个网络的分布状态,就是所求的结果。网络学习的过程也就是各神经元权值的调整过程。人工神经网络根据连接方式不同可以分为两大类:无反馈的前向神经网络和相互连接型网络(包括反馈网络),图1为BP神经网络系统结构简图,BP网络就是一种误差反向传播的前向网络,神经网络的学习算法总体来讲可分为有监督学习和无监督学习。人工神经网络的具有强容错性、冗余性、鲁棒性和信息分布式并行处理及快速进行大量计算能力特点, 能适应复杂环境和进行多目标控制。
图1 BP网络系统结构
2 人工神经网络在空调系统中的应用
2.1 空调风系统方面的应用
变风量系统(VAV系统)的基本思想是:当室内负荷发生变化时,改变送入室内风量,以满足室内人员的舒适性或工艺性要求,实现送风量的自动调节,最大限度地减少风机动力,节约运行能耗。目前对变风量空调控制方法传统方法主要有:定静压控制、变静压控制、总风量控制等,但多数局限于的PID控制理论,对变风量空调这种非线性系统的控制精度难以保证。朱为明等人在VAV系统中采用神经网络预测优化算法对变风量空调进行控制,神经网络预测优化算法控制过程的节能范围为:6%-13.5%,与PID控制方法相比,神经网络预测优化算法的控制量之和减少6%以上,具有较好的节能效果。
2.2 空调水系统方面的应用
中央空调水系统主要包括冷却水和冷冻水系统,对于大型系统,管道长,系统热容量大、惯性大,被控系统水温和流速变化速度较慢,滞后现象严重,是一种典型的大滞后系统,对于过程纯滞后非线性特性,目前过程控制传统算法不具备克服滞后影响的能力,在稳定性和响应速度上都难以达到较好的性能指标。周洪煜等人利用了神经网络的非线性逼近特性、自学习、自组织的能力以及预测控制的滚动优化和反馈校正的特性,建立起的中央空调水系统的动态模型,作为预测控制器的预测模型,不需要对被控对象进行精确的辨识, 提出的多变量神经网络预测控制系统具有优良的控制效果,实现了空调水系统的自适应控制。何厚键等人在中央空调水系统的建模与优化研究中,利用前馈型网络结合BP算法建立了冷却塔和制冷机的神经网络模型,解决的具有高度非线性的中央空调水系统设备的建模问题。
2.3 制冷系统方面的应用
神经网络在空调中的制冷系统应用,主要体现在制冷机组优化控制和制冷系统的故障诊断两方面。在中央空调系统中制冷机组是能耗最大的设备,对制冷机组进行优化控制,提高其运行效率,是空调系统节能的重要途径之一。赵健等人在分析了影响压缩机运行效率的主要因素基础上,建立了以压缩机入口制冷剂温度、压缩机出口制冷剂温度和负荷为输入量,最佳吸气压力输出为输出量的BP神经网络模型。通过在线修正制冷机的吸气压力工作点,解决变负荷下,制冷机优化控制问题,大幅度提高制冷性能参数COP的值,降低了制冷机的运行能耗,与采用额定工况相比,采用神经网络优化控制方法的制冷机节能量约为44.8%。
故障诊断是一种了解和掌握设备在使用过程中的技术,确定其整体或局部是否正常,早期发现故障及其原因并能预报故障发展趋势的技术。在制冷系统的故障诊断方面,神经网络也发挥着重要作用,随着我国空调制冷事的蓬勃发展,制冷系统越来越复杂,故障的潜在发生点也越来越多,制冷设备的故障检测与诊断越来越受到人们的重视。胡正定等人在分析制冷系统常见故障特征的基础上,建立以压缩机进口温度、蒸发器进口温度、冷媒水进口温度、冷媒水出口温度、压缩机排气压力、压缩机吸气压力、压缩机出口温度、冷凝器出口温度等8特征征参数作为输入量,故障模式作为输出量的补偿模糊神经网络模型。仿真结果表明,系统的诊断结果且有较高的准确率。李中领等人在空调系统故障诊断中利用神经网络建立了三层BP网络模型,输入层节点个数为4,对应于4种故障现象,隐含层单元个数为4,输出层节点个数为12,对应于12种故障原因,输出节点值的大小反映了故障出现的可能性。
2.4 负荷预测方面的应用
空调系统逐时负荷的准确预测是实现现代控制的前提之一,准确预测空调负荷对空调高效节能运行具有重大意义,影响空调负荷的因素有空气温度、湿度、太阳辐射强度、人员、设备运行情况等,空调负荷与影响因素之间是严重非线性的关系,具有动态性。
2.5 空调制冷系统的仿真设计方面的应用
制冷空调产品设计中,大量地依赖样机的反复制作与调试,使得产品的设计周期延长,并影响性能优化,用计算机仿真代替样机试验,在计算机上面实现优化设计,使得制冷空调装置仿真技术近年来得到了迅速发展 。
2.6 大型建筑运行能耗的评价方面的应用
大型公共建筑指非住宅的民用建筑,包括办公楼、商场、宾馆、医院、学校等,大型公共建筑用能特点是单位面积耗能非常高,为每年100 kW/m2-300 kW/m2,而且我国大型公共建筑能源系统效率较低,浪费严重,其电耗超过公共建筑节能设计标准规定指标的10倍以上。大型公共建筑中央空调系统运行能耗的科学评价是对大型公共建筑进行用能科学管理的重要基础,赵靖等人基于BP人工神经网络,将冷水机组、冷冻水泵、冷却水泵、冷却塔、其它设备月平均功率、运行时间和气象特征共七个作为预测因子,空调系统总能耗为输出量,建立了大型公共建筑系统运行能耗的预测评价模型,仿真结果表明,网络的平均预测误差输出值约为3.3E-014,可以满足实际应用的要求。
3 发展方向
人工神经网络基于较强的学习能力、自适应能力、容错能力和联想能力,在暖通空调领域中的应用已经取得了突破性的进展。今后的发展方向主要有两个方面,首先,不断改进神经网络性能,提高其预测和控制精确度;另外,逐步使神经网络的实现由软件实现过渡到硬件实现,扩大其在空调领域的应用范围,也是今后的研究方向之一。
参考文献
[1]胡守仁.神经网络导论[M].北京:国防科技大学出版社,1999.
[2]候媛彬,杜京义,汪梅.神经网络[M].西安电子科技大学出版社,2007.
人工神经网络(ANN)又称连接机制模型(ConnectionModel)或并行分布处理模型(ParallalDistributedModel)。作为人工智能的研究方法,目前已广泛应用于自然科学的各个领域,应用计算机程序来模拟这种特殊的数学模型并应用于实际流域的洪水预报研究中,无疑是一种新的尝试和有益探索。岳城水库是海河流域南运河水系漳河上的一座大型控制性工程,入库洪水突发性强,水猛多沙,为确保下游河北、河南、山东、天津广大平原地区和京广铁路的安全,对水库入库洪水进行精确预报,及时采取预泄和分洪措施显得极其重要,因此,用人工神经网络模型模拟预报水库的入库洪水过程,有重要参考和借鉴意义。
2.BP网络的构建
人工神经网络是一个高度复杂的非线性动力学系统,它有大量的简单处理单元(神经元)广泛连接而成,他对人脑的功能作了某种简化、抽象和模拟,具有很强的非线性映射能力,其中对多层前向神经网络bp模型的研究相对成熟,应用最为广泛,其模型结果如图:
结构中,输入层、隐层和输出层神经元的个数根据具体情况设定,其中隐层层数不一,不失一般性对输出层中只含有一个神经元的三层前向神经网络分析如下:假设输入层中有个神经元,隐层中有个神经元,输出层神经元的输出,即整个网络的输出为Y,网络中输入层的输入分别为,,…,则隐层神经元的输入分别是:
(i=1,2,…m)(2.1)
在上式中,为隐层神经元i与输入层神经元j的连接权,为隐层神经元的阈值,选择函数作为隐层神经元的激发函数,则隐层神经元的输出为:
(i=1,2,…m)(2.2)
输出神经元的激发函数取为线性函数,输出层神经元的输出及整个网络的输出为:
(2.3)
其中,Vi为输出层神经元与隐层神经元i的连接权。定义由、、组成的向量为网络的连接权向量(ij,i,i)。设有学习样本(,,…;)(=1,2…,p;p为样本数)。对某样本(,,…;)在给出网络向量后,可以通过公式(1.1)~(1.3)计算出网络的输出值,对于样本
定义网络的输出误差为:(2.4)
定义误差函数为:(2.5)
(ij,i,i)随机给出,计算式(2.5)定义的误差值较大,网络计算精度不高,在确定网络结构后,通过调整(ij,i,i)的值,以逐步降低误差,以提高网络的计算精度,下面给出根据误差信息调整(ij,i,i)的具体计算过程。
在反向传播算法中,是沿着误差函数随(ij,i,i)变化的负梯度方向对进行休整。设的修正值为:(2.6)
式中:为第n次迭代计算时连接权的修正值;为前一次迭代计算时计算所得的连接权修正值;为学习率,取0~1间的数;为动量因子,一般取接近1的数。将式(1.4)和(1.5)代入式(1.6)中,有(2.7)
定义=(,,),则:
(2.8)
(2.9)
(2.10)
采用迭代式对修正计算,得到新的连接权向量。对于所有的学习样本均按照样本排列顺序进行上述计算过程,然后固定的值,对于p个样本分别进行正向计算,从而求出学习样本的能量函数值:
(2.11)
这样结束了一个轮次的迭代过程,当满足某一精度要求时,就停止迭代计算,所得(ij,i,i)即为最终模型参数,否则就要进行新一轮的计算。
3.BP算法的VB程序实现
因程序代码太多,不再给出。网络学习程序界面如下图2:
4.洪水预报网络模型构建
4.1资料收集
岳城水库的入库水文站为观台水文站,该站上游有清漳河匡门口水文站和浊漳河天桥段水文站,距观台分别为66km和64km。上游匡门口、天桥段与下游观台的区间流域面积为1488km2,见流域水系图3。资料采用年鉴1962、1976、1977、1988年四次洪水和相应年份的区间时段降雨量共118组调查数据作为模型的学习训练样本,另取1971年和1982年两次大洪水作为模型的检验数据。
4.2预报模型构建
网络模型采用输出层中有一个神经元的三层前向人工神经网络,洪水预报模型的输出节点为岳城水库的入库站观台水文站的时刻的流量,即网络。考虑河道洪水演进时间和区间流域的产汇流时间,分别取清漳河匡门口站和天桥断以及流域平均降雨量、作为模型的输入节点值;隐层神经元节点数和输入层节点数相同取为4。
模型参数优化:计算中,学习率越大,学习速度会越快,但是过大时会引起振荡效应;动量因子取得过大可能导致发散,过小则收敛速度太慢。据有关文献介绍,取,算法收敛速度较快。本次计算取,;网络中的初始值取(0.1~0.1)之间的随机数(由VB程序产生)。
样本的归一化处理:为了有效利用型函数的特性,以保证网络神经元的非线性作用,对于数值型的学习样本要进行归一化处理。对样本(p=1,2,…p)定义,,归一化处理计算就是按照公式:
(4.1)
将样本转化为0~1之间的数据。对于网络的输出数据还应进行还原计算恢复实际值,公式为:
(4.2)
使用VB程序对网络模型进行训练学习,经102135次学习后,网络输出能量函数值为3.2×10-3,此时得到模型最优参数如表1。
表1模型参数表
序号
11.625608-2.361247-3.2047142.846384-2.718568-1.185164-1.029736
20.138017-0.041076-0.6707810.8445030.936162-2.7469741.546362
31.770369-6.0486571.1342710.7454760.58331-3.0635082.5033320.250.9
4-0.8183131.471144-1.4842650.875319-1.995911-2.6673082.075974
5-1.9730730.30147122.993124-0.160362-3.290356-1.59743-0.627028
5.模型检验
应用以上该区洪水预报的神经网络模型参数分别对1982年、1971年的两次洪水进行检验预测,相应洪水过程趋势线见图4图5。
表2预报考评指标表
序号序号
1982.10.0311982年前20h0.69
1982.20.00811982年后80h0.07
1982.30.040.51982年总过程0.19
1982.40.0421971年前11h0.7
19710.0611971年后50h0.12
aver0.0361.11971年总过程0.23
注:1.1982.1表示1982年大洪水的第一次洪峰,其它类同。
2.1982年前20h表示1982年大洪水的涨洪段前20h,其它类同。
图41971年预测洪水与实测洪水过程线图51982年预测洪水与实测洪水过程线
检验标准:
1)洪峰流量预报误,经计算、皆小于0.1,据《水库洪水调度考评规定SL224-98》,考评等极为良好(见表2)。
2)峰现时间预报误差,经计算考评等极为一般,其中一次良好。
3)洪水过程预报考评指标,从预报数据分析,两次洪水过程的预报考评0.23,,根据规范属一般,从洪水过程检验指标可分析主要是因为模型对涨洪期低量洪水预报精度不高造成,但峰值附近及后期预报精度较高,可作为洪水预报的一项行之有效的方案。
6.结论
岳城水库入库洪水过程的神经网络预测模型运行稳定,对峰高量大洪水预报较为准确,根据规范规定可作为水库自动测报系统的有益补充,为水库的防洪调度提供较为可靠的依据。
参考文献:
[1]焦李成.神经网络的应用与实现.西安:西安电子科技大学出版社,1993
[2]李春好等.人工神经网络bp算法的数据处理方法及应用.系统工程理论与实践,1997,17(8)
[3]赵林明等.多层前向人工神经网络.郑州:黄河水利出版社,1999
[4]丁晶等.人工神经前馈(bp)网络模型用作过渡期径流预测的探讨.水电站设计,1997,13
关键词:水动力模型,ANN神经网络系统,模型数据,缺失数据模拟
中图分类号:G250.72 文献标识码:A
我国大多数的城市管网建设滞后于水厂建设,给水管网的铺设会随城市的发展不断地铺设延长,与之相对应的是用水量的急剧增长,与老管线的协调规划问题等等,这一切的问题都使地下管线的管理成为一个极其复杂的问题。构建水动力模型,可以实时的看到管网的薄弱环节,并且通过分析得知造成管网问题的原因。水动力模型可以应用于并的给水系统的规划,设计及改扩建;管网改造优先性评估;管网改造并行方案的的成本分析,运行情况;指导和帮助安排管网检漏工作等。
建立水动力模型是一项复杂并且富有难度的工程,需要将给水管道的的信息,包括管道的管径、材质、管龄,粗糙系数等如实的反应到模型中,运行模型后要选择管网中具有典型代表性的节点,得到这些节点的节点流量与节点压力模拟值,将这些曲线与实际中该节点的流量与压力曲线进行对比。通过调整管网的粗糙系数,节点流量分配等核心数据使模拟曲线与实测曲线相吻合,这个过程称之为模型校核。校核后的模型才能应用于实际的工程工作中。
模型搭建和校核的过程中需要许多数据,而在现有国内的自来水公司,极少有完备的数据,而这些数据的检测和整理是一项复杂并且耗费财力的工程。当有所需的数据缺失时,根据现有的数据搭建ANN(人工神经网络)模型,模拟出缺失的数据曲线,从而用于水动力模型的校核工作中。譬如,节点流量曲线、节点压力曲线、节点的化学物质残留量曲线等等。
1 人工神经网络的概念
人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,是一种运算模型,由大量的节点(或称神经元)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。人工神经网络是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,通过统计学的方法,人工神经网络能够类似人 一样具有简单的决定能力和简单的判断能力,这种方法比起正式的逻辑学推理演算更具有优势。因为它不需要全面的数据。实践证明只要中间的隐含层个数足够多,ANN神经网络无限逼近任何连续函数。
图1 3层ANN(BP)网络结构
Fig. 1 Three level ANN model’s structure
2基于ANN人工神经网络的节点压力模型的建立
人工神经网络是一个能够学习,能够总结归纳的系统,也就是说它能够通过已知数据的实验运用来学习和归纳总结。人工神经网络通过对局部情况的对照比较,它能够推理产生一个可以自动识别的系统。人工网络系统之所以能够推理,基础是需要有一个推理算法则的集合。在本次的实例检验过程中使用相关系数和确定性系数来衡量模型的准确性,如果确定性系数越大,预测值和实测值的相关系数越大,误差就越小,模型的计算结果就越好。通过对模型精度的分析,判断节点压力曲线是否可以用于水动力模型的,模型校核工作中。
其实人工神经网络就是一个黑箱子,它所建立的模型不是基于实际的物理联系,而是基于我们所记录数据和所得值之间的函数关系(这种函数关系在运算的过程中不得而知),对于人工神经网络的计算过程我们不关心也不必去了解它计算过程的细节。人工神经网络在做出预测之前是使用记录数据的学习过程,之后的使用就是在上面的学习过程之后,人工神经网络会拟合出一个比较准确的函数关系从而会根据所给数据预测出我们所关心变量的结果。
本文以节点压力曲线的模拟为例子,阐述ANN模型的搭建,以及模拟结果的精确性。
已有的数据为给水管网中8个节点的压力曲线,靠近泵站的一个节点的压力缺失某几个小时的数据,现利用已知数据搭建ANN模型,模拟出此时,一个小时后,两个小时后,4个小时后的模拟压力曲线。通过对模型结果的分析,得出其结果是否能用于水动力模型校核工作。
2.1 训练模式对的准备工作
对于管网中的节点压力来讲,他们之间具有相关性,因为在预测未知点的压力曲线时,其他管网中的节点都是未知节点的重要影响因子。因此在搭建模型时要在输入层配置相应的单元用来模拟未知节点的压力曲线。
目标节点预见期压力=F{(某时间点NODE1水位),(某时间点NODE2水位),(某时间点NODE3水位)…(某时间点NODE8水位)}某时间点指的是预见期之前某个相应的时间点。
整个模型从数据输入到结果分析的过程可以用流程图表示出来。数据输入->数据编辑->模型参数确立->运行模型->模型结果分析。
2.2 目标函数(确定性系数)的确立
R= 式-1
式中 R为确定性系数
为该城市实测河流水位
为实测河流水位的平均值
为模型预测水
为模型预测水位的平均值
R越接近于1,说明模拟结果与实际测量结果越一致,也即模型越精确。
2.3 模型的结构参数的确立
人工神经网络模型中关键的参数有学习率,中间层的神经元数,动量因子,终止学习条件,本文利用设定最大平均误差来终止模型运行。其中的学习率和动量因子会影响到模型的收敛速度。学习率和动量因子的取值范围都在[0,1]之间。学习率越大运算速度越大但是如果取过大的值会导致模型不收敛,由于模型的运算速度比较快为了得到更加精确的结果取学习率为0.02.动量因子根据经验取0.1,中间层的神经元数取30。
3 实例分析
我们拥有管网中9个节点的压力曲线值,但是某个时间段节点9的压力曲线缺失,管网中9个节点的具置见图2.
图2 管网中的9个节点
Fig. 2 The 9 nodes in the network
示意图中观测站一为模型下游目标站的位置,本文所讨论的预测站也就是目标站。
建立模型之后对该城市城市管网中的节点9,此时以及未来1-4小时的节点压力进行预测。根据该中的8个节点和目标节点的的压力曲线数据为基础进行训练,并且对预测的结果进行分析。来判断时候可以将模拟的数据直接用于模型校核。
表1 预见期分别为0-4h的模型精确度参数
Table 1 Model’s forecast precision in 0-4hours
图3 同时刻节点压力的模拟值与实测值
Fig. 4 Forecast water level the same time with measured data
图4 预见期为1h时的节点压力曲线
Fig. 5 Forecast water level 1 hour later
图5 预见期为4h时的节点压力曲线
Fig. 5 Forecast water level 4 hour later
图6 预测同时刻的各个节点与目标节点的相关贡献系数
Fig. 6 Relative contribution coefficient between observation station and objective node on the same
time
图7 预测4h之后的各个观测节点与目标节点的相关贡献系数
Fig. 7 Relative contribution coefficient between and objective station when the forecast stage 4 hours
表2不同预见期的绝对误差
通过研究神经网络模型的结果可见:
(1)通过图6、图7可以得知使用人工神经网络模型,各个节点的实测数据对于最后的目标节点影响是不同的。节点3的对与目标站的相关系数性较小,在实际工作中可以舍弃此地数据的采集,从而减少人力物力的投入。随着预测时间的不同其相关系数亦会发生变化。
(2)预见期越长,其最后结果的可靠性越差。确定性系数,和绝对误差可以反映之,预见期为0h、1h时,其误差很小,当延长其预见期时,其误差会相应变大。当模拟结果用于水动力模型校核时,目标节点的模拟结果与输入节点为同时刻时,模拟数据与实测数据高度吻合,说明该结果可以输入水动力模型,进行校核。随着预见期变长,其模拟结果也越来越不准确。预见期为4小时时,其结果不能作为水动力模型的输入数据进行模型校核。
(3)在水动力模型校核过程中,可以将ANN的预测结果也就是预见期的目标节点压力曲线用于在水动力模型中。从而解决了原始数据缺失的问题。
4 结论
本文采用ANN(人工神经网络)建立了节点压力的预测模型,其预测结果可以应用于水动力模型中,用模型校核的原始输入值。从而为搭建城市的给水管网水动力模型提供科学的依据。也节约了大量人力,物力和财力的消耗。
参考文献
严熙世, 赵洪宾. 给水管网系统理论与分析. 中国建筑工业出版社, 2003.9
陶建科, 刘遂庆, 建立微观动态水力模型标准方法研究.给水排水, 2000, 26(5):4~8
Maier H R, Dandy G C. The use of artificial neural networks for the prediction of water quality parameters. Water Resources, 1996 ,32 (4) :1013 - 1022.
关键词:人工神经元网络;BP神经网络;matlab;识别分类
中图分类号:TP391.41文献标识码:A文章编号:1007-9599 (2010) 16-0000-02
Artificial Neural Network Application on Face Classification
Liang Xiaoli
(Heilongjiang Radio&TV University,Harbin150080,China)
Abstract:In the face recognition technology is developing continuously,people not limited to recognize the human face,but the main emphasis on the accuracy and efficiency of face recognition.
Face recognition is divided into three steps,face detection,feature extraction,recognition category,identification and classification of the methods in which the decision of whether to correctly identify the human face.BP neural network with forward propagation and back propagation characteristics,so as to ensure the accuracy of classif-
ication,Therefore,the main author of this article how to MATLAB,the BP neural network used in face recognition classification.
Keywords:Artificial neural network;BP neural network;Matlab;
Recognition category
人工神经元网络,又称为神经元网络,它是对人脑的简化、抽象和模拟,反映了人脑的基本特性神经元网络是由大量处理单元广泛互连而成的网络。神经网络研究的是模拟人脑信息处理的功能,从人脑的生理结构出发来研究人的智能行为。是依托于数学、神经科学、物理学、计算机科学及工程等学科的一种综合性技术。
一、人工神经网络的分类
我们可以对人工神经网络进行如下分类:
(一)单层的前向神经网络
这里所说的单层前向网络是指拥有单层的神经元是,作为源节点个数的“输入层”被看作是一层神经元,“输入层”是不具有计算功能。
(二)多层的前向神经网络
多层前向神经网络与单层前向神经网络的差别在于:多层的前向神经网络和单层前向神经网络的隐含层个数不同,在多层的前向神经网络中完成计算功能的节点被称为隐含单元(隐含神经元)。由于隐层的数量不同,使网络能进行更高序的统计,尤其当输入层规模庞大时,隐层神经元提取高序统计数据的能力便显得非常重要。
(三)反馈网络
反馈网络指在网络中最少含有一个反馈回路的神经网络。反馈网络中包含一个单层神经元,在这一层中的所有的神经元将自身的输出信号反馈给其他所有神经元作为输入。
(四)随机神经网络
随机神经网络是在神经网络中引入了随机概念,每个神经元都是按照概率的原理在工作,这样每个神经元兴奋或抑制具有随机性,其概率取决于神经元的输入值。
(五)竞争神经网络
竞争神经网络最显著的特点是它的输出神经元之间相互竞争以确定胜出者,胜出者指出哪一种原型模式最能代表输入模式。
二、神经网络的学习
神经网络的学习又被称为训练,所指的是通过神经网络所在外界环境的刺激下调整神经网络的参数,使得神经网络以一种调整好的方式对外部环境做出反应的过程。从环境中学习和在学习中提高自身性能是神经网络最有意义的特征了。
学习方式可分为:有师学习和无师学习。有师学习又称为有监督学习,在学习时需要给出指导信号(又可称为期望输出或者响应)。神经网络对外部环境是未知的,但可以将指导信号看作对外部环境的了解,由输入―输出样本集合来表示。指导信号或期望输出代表了神经网络执行情况的最佳结果,即对于网络输入调整网络参数,使得网络输出逼近期望的输出值。无师学习包括强化学习与无监督学习(可以被称为自组织学习)。在强化学习中,对输出的学习是通过与外界环境的连续作用最小化完成的。
三、BP神经网络
BP(Back Propagation)神经网络,就是指包含信息正向传播和误差反向传播算法的学习过程。输入层的每一个神经元负责接收来自外界的输入信息,并传递给中间层中的每一个神经元;中间层的各个神经元是内部信息处理层,负责信息变换,可以设计为单隐层或者多隐层结构;最后隐含层传递到输出层的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不相符时,进入误差的反向传播阶段。误差通过输出层作用于输入层,按误差梯度下降的方式分别修正各层权值,逐渐向隐含层和输入层反传。多次的经过信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也就是神经网络学习训练的过程,此过程一直进行到网络的输出误差减少到可以被接受的程度,或者达到预先设定的学习次数才会停止。
四、实验过程及结果
本文中假设已经用奇异值分解得到人脸特征点的数据,每个人脸划分为五部分,每部分又得到5个特征值,所以也就是25个的特征值。本文采集了50个人人脸,每人采集10张不同姿态下的照片,也就是500张照片,对这些照片进行人脸检测并进行奇异值分解,得到每张照片对应的25个特征值,从每人10张照片中随机抽出5张用于训练出不同的姿态下的人脸,另外的5张用作测试样本。
(一)实验过程
由于数据过长,本文只以2个人,每人2张照片作为的训练样本数据为例来说明。
第一步:训练样本(每人25个特征值),在p是一个25行,4列的矩阵,每一列代表一个人的25个特征值,属于一个样本;列数4表示样本总数;
p=[ 7.4264 9.0728 7.9825 9.5632;
7.5719 7.8115 6.5564 7.8561;
12.8074 12.7073 12.4536 11.5423;
9.0284 10.3744 8.7569 9.9965;
7.0083 9.0284 7.1254 8.8876;
1.2597 2.1578 1.3556 3.0112;
0.6896 0.7835 0.7859 0.9658;
0.7814 0.8818 0.7568 0.8213;
1.0248 1.6783 1.1542 1.5234;
1.0112 1.0248 0.9568 0.9652;
1.0427 1.0813 1.0425 0.9568;
0.5970 0.5886 0.5968 0.5889;
0.4928 0.5969 0.3569 0.6012;
0.6438 0.6417 0.6589 0.5612;
0.3563 0.6438 0.2534 0.6689;
0.4474 0.4235 0.4568 0.4236;
0.2483 0.2282 0.2253 0.2259;
0.3633 0.4616 0.3102 0.4556;
0.3383 0.4167 0.3561 0.3456;
0.3130 0.3383 0.3302 0.3359;
0.3378 0.3313 0.3219 0.3569;
0.1916 0.1767 0.1564 0.1952;
0.2356 0.3422 0.2355 0.3012;
0.2088 0.3268 0.1958 0.3568;
0.1858 0.2088 0.0956 0.1968;];
第二步:目标输出矩阵
因为就两个人,所以采用一位二进制编码就可以,在这里定义第一类样本的编码为0;第二类样本的输出编码为1。
t=[0 1 0 1];
第三步:使用MATLAB建立网络结构
net1=newff(minmax(p),[25,9,1],{'tansig','tansig','hardlim'},'traingdm');
说明:[25,10,1]表示该网络的输入结点为25个值,输出结果为1为二进制编码的值,中间层由经验公式 (rnd为0-1之间的随机数),所以本文选取5-15之间数分别作为隐含层的神经元个数,得出的结论是9的收敛速度最快。
第四步:对网络进行训练
[net1,tr]=train(net1,p,t);
第五步:保存网络
save aa net1
则文件会以aa.mat的格式保存,保存了训练好的网络以及权值。
第六步:输入测试样本
先加载上一步中保存好的网络,本实验中只输入一个测试样本,下面的数据代表测试样本的特征值,共25个。
load aa.mat
p1=[7.8115;0.7835;0.5886;0.2282;0.1767;1.0197;0.7896;0.6814;1.1238;1.1114;0.9427;0.5970;0.4569;0.5438;0.4563;0.1983;0.4632;0.3383;0.3130;0.4377;0.1817;0.2256;0.2088;0.2854;0.2812];
第六步:网络仿真
a=hardlim(sim(net1,p1)-0.5)
(二)实验结果
根据上述实验过程,得出的结果是:
下图是执行了10次中的一次算法模拟情况。
Elapsed time is 0.469seconds
网络仿真的输出结果是:a=0
本文中测试的数据来源于训练样本中输出为0的样本,识别结果正确。换了10个测试样本,其中识别正确的是6个,也就是正确率大约在60%。
然后,采用相同的办法,在实验中把训练样本由每人两个不同姿态下的样本增加到了3个,也就是输入向量的p由4列增加到6列,其他的均不变,网络的训练时间为0.471 seconds。还是使用上面的10个测试样本,其中识别正确的达到了8个,正确率提高到了80%左右。
在样本量扩大到250时,这些样本是来自于,50个人,每人拍摄10张不同姿态下的照片,也就是500张,然后从其中随机的取出每个人对应的5张照片作为训练样本,然后再把从剩余的250张作为测试样本,进行测试。输入结点数为250,每个结点对应的特征向量为25;输出值用二进制的编码表示,由于后面要实现的人脸识别系统中要应用在一个只有50人的环境下,所以采用二进制编码6位就够了,但是为了系统的可扩展性,所以采用7位二进制编码来设计输出结点的值,bp网络就是25维输出7维输出。此时测试的250个数据中只有一组数据是错误的,原因是照片中的人嘴和鼻子被口罩遮住了。
样本量增加后网络训练到一个样本测试仿真所有的时间是1.936seconds。
五、小结
本文介绍了基于BP神经网络的人脸识别分类方法,先用matlab设计了一个模拟程序,然后不断的增加训练样本中同一人样本的样本数,训练后用10个人分别测试两个网络的正确率,当同一人的样本数增加到3时,正确率由60%提高到了80%。可以证明网络训练样本的增加有利于提高识别的正确率。把在上一章中采集到的50个人所对应的500张照片作为标准样本库,从中随机取出250张作为训练样本,然后设定输出值,输出的值应该有50类,采用二进制的编码构成,然后再实用剩余的250张照片作为测试样本,进行测试。