bp神经网络

时间：2023-05-30 10:27:48

开篇：写作不仅是一种记录，更是一种创造，它让我们能够捕捉那些稍纵即逝的灵感，将它们永久地定格在纸上。下面是小编精心整理的12篇bp神经网络，希望这些内容能成为您创作过程中的良师益友，陪伴您不断探索和进步。

bp神经网络

第1篇

关键词：bp 神经网络；学习率；改进算法

反向传播BP（back propagation）神经网络是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一[1]。BP算法的思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符合，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可以接受的程度或进行到预先设定的学习次数为止[2]。

1 BP标准神经网络算法分析

1.1 BP算法存在的不足及原因分析

标准的BP算法因其简单、易行、计算量小、并行性强等优点，是目前神经网络训练采用最多也是最为成熟的训练算法之一。与早期的人工神经网络模型相比，BP反向传播神经网络无论是在网络理论还是网络性能方面都更加成熟，起最突出的优点就是具有很强的非线性映射能力。但人们在使用过程中发现BP算法也存在着训练时间长、收敛速度慢、易陷入局部最小点等缺陷。

1.1.1 学习算法的收敛速度慢

BP神经网络学习训练次数过多，导致学习训练过程过长，学习收敛速度太慢，即使一个比较简单的问题，也需要几百次甚至上千次的学习才收敛。

1.1.2 隐含层层数及节点数的选取缺乏理论指导。

BP神经网络隐含层的层数以及节点数的选取，目前尚无理论上的指导，大多根据经验确定。因此网络往往具有很大的冗余性，无形中增加了学习的时间。

1.1.3 训练时学习新样本有遗忘旧样本的趋势

BP神经网络的学习与记忆具有不稳定性。当给一个训练结束的BP神经网络提供新的记忆模式时，会破坏已经调整完毕的网络连接权值，导致已经记忆的学习模式信息消失。

2 改进的BP神经网络学习算法

2.1 学习方法的改进

对于标准的BP算法，由于其自身存在的缺点，BP算法的研究提出了一些的改进算法，如自适应调节学习率[3]，引入兜度因子[4]，使用双曲正切函数[5]，但是都没有取得非常理想的效果，对此我们可以采用以下的算法来解决问题。

2.1.1 加入动量项

反向传播算法提供使用最速下降方法在权空间计算得到的轨迹的一种近似。我们使用的学习率参数η越小，从一次迭代到下一次迭代的网络突触权值的变化量越小，轨迹在权值空间越光滑。我们可以设想使用一下的方法来解决这个问题。

ΔWji（n）=αΔWji（n-1）+ηδj（n）yi（n）（1）

α是动量常数，通常是整数。

为了看出动量常数在一系列模式呈现上对突触权值的影响，我们将（1）式重新写成带下标t的一个时间系列。索引t从初始时间0到当前时间n，式（1）可被视为权值修正量ΔWji（n）的一阶差分方程。解这个关于ΔWji（n）的方程得到

这代表一个长度为n+1的时间序列，并且我们可以知道δj（n）yi（n）等于- 因此我们可以把公式（2）重写等等价形式

当前修正值ΔWji（n）代表指数加权的时间序列的和。欲使时间序列收敛，动量常数α必须限制在0和1之间。当α等于0，反向传播算法运行起来没有动量。虽然在实际中动量常数α不大可能是负的，但是还有可正可负。

当偏导数在连续迭代中有相同的代数符号，指数加权和ΔWji（n）在数量上增加，所以权值ΔWji（n）被大幅度调整。在反向传播算法中包含动量趋于在稳定的下降方向上加速下降。

当偏导数在连续迭代中有相反的代数符号，指数加权和ΔWji（n）在数量上减少，所以权值ΔWji（n）调整不大。在反向传播算法中包含动量具有稳定符号正负摆动方向的效果。

3 仿真实验

根据以上的算法，我们对标准的BP算法和改进的BP算法进行仿真计算，仿真计算的结果如表1所示。

可以看出改进后得算法能减少迭代次数，减少实际误差。

4 结论

从大量的实际应用来看，收敛速率慢，学习时间长，产生振荡，甚至达不到收敛精度是常规BP算法的主要缺陷，通过对BP算法的改进，增加动量项，可以减少BP算法的迭代次数，减少误差，提高BP算法的工作效率。

[参考文献]

[1]Adaboost算法改进BP神经网络预测研究[J].计算机工程与科学，2013年8月.

[2]韩立群.人工神经网络教程[M].北京：人民邮电出版社，2007年7月.

[3]马锐.人工神经网络原理[M].北京：机械工业出版社，2010年9月.

第2篇

1方法

BP神经网络是目前应用最多的神经网络，一般由一个输入层（inputlayer）、一个输出层（outputlayer）、一个或几个中间层（隐层）组成，每一层可包含一个或多个神经元，其中每一层的每个神经元和前一层相连接，同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层，隐层的神经元对输入层的信息加权求和，加一个常数后，经传递函数运算后传到下一个隐层（或输出层），常用的传递函数是logistic函数，即φh=1/(1+exp(－z))，输出层神经元对前一层的输入信息加权求和经传递函数φ0（线性或logistic函数或门限函数）运算后输出，例如：如果输入为xi，对于含一个隐层的神经网络可以得到：

g(xi,θ)=φ0(αk+∑i≠kwikxi+∑jwjkφh(αj+∑iwijxi))（1）

θ表示未知的参数矢量（即各层的网络权值），BP神经网络一般采用BP算法训练网络，训练开始时选择初始值0，BP算法通过梯度下降法得到估计值，使得g(x,)能很好地估计实测值，关于BP算法及改进可参考相关文献［1］。

利用BP神经网络模型建立生存分析模型，常用的方法有：连续时间模型（continuoustimemodels）与离散时间模型（discretetimemodels）。

1.1连续时间模型（continuoustimemodels）

最常用的是Faraggi和Simon［2］提出的方法，在Cox比例风险模型中,风险函数与时间、协变量有如下关系：

h(t,xi)=h0(t)exp(βxi)（2）

通过最大化偏似然函数，使用Newton-Raphson法得到参数的估计值，现在使用神经网络的输出值g(xi,θ)来代替（2）中的线性项βxi，比例风险模型变成h(t,xi)=h0(t)exp［g(xi,θ)］，有偏似然函数：

Lc(θ)=∏i∈uexp∑jwjk/(1+exp(－wijxi))/∑j∈Riexp∑jwjk/(1+exp(－wijxj))(3)

g(xi,θ)可以依赖时间和协变量变化，也就是说协变量的效应可以随时间而变化，这给我们提供了一个可以处理删失变量但又不需要满足比例风险模型的PH假定的可供选择的方法。

1.2离散时间模型（discretetimemodels）

常用的模型有［3］：（1）直接预测患者是否可以存活到某年(例如5年)，是最简单的神经网络模型，模型的输出层只有一个神经元结点，如欲预测多个时间点，则需建立多个神经网络模型（每个模型对应一个时间区间)；（2）多个输出结点的单个神经网络模型。

1.2.1输出层有单个结点的神经网络模型是一个标准的分类神经网络模型，生存时间被分成2个区间，例如生存时间是否大于5年。其似然函数为：

∏patientsptii(1-pi)(1-ti)

其对数似然函数为：

∑patientstilogpi+(1-ti)log(1-pi)

pi：第i个病人死亡的概率，ti：第i个观测在某时间点（例如5年）的结果，如观测死亡，取值为1，否则取值为0。对于删失的观测不能简单地排除，这样会造成偏性，我们使用Cox线性比例风险模型产生的个体预测值对删失值做填补。

1.2.2输出层有多个结点的神经网络模型将生存时间分成几个离散的区间，估计某个区间事件发生的概率。

不考虑时间区间的顺序，有模型：logpk-logp1=ηk(X)(k=2,…,P)

从神经网络可以得到输出值yk：yk=∑iwikxi+∑jwjkφ1(∑iwijxi)（K=1，…，P）（这里我们设ηk(x)=yk－y1），

于是可以得到时间区间k的概率：pk=exp(yk)∑l(yl)

建立似然函数∏patients∑lik=mi+1pki

mi：观测i存活的前一个生存区间，li：最后的时间区间，pki：第i个病人在时间区间k死亡的概率。

本次研究采用灵敏度、特异度、一致性指数C(concordanceindex)［4,5］作为预测准确性的评价指标。一致性指数C是对含有删失数据的ROC曲线下面积的推广(generalization)，是指预测结果和实际结果一致的观察单位的对子数占总的有用对子数的比例,即C=一致的对子数/有用的对子数，C接近0.5表明模型的预测性能差，接近1表明预测性能好。一致性指数的计算步骤为［5］：①产生所有的病例配对。若有n个观察个体,则所有的对子数为C2n。②排除两种对子:对子中具有较小观察时间的个体没有达到观察终点及对子中2个个体都没达到观察终点。③计算有用对子中,预测结果和实际相一致的对子数,④计算一致性指数。

2实例分析

贲门癌是常见恶性肿瘤,对236例经手术切除但未行放化疗的贲门癌患者随访，生存时间为确诊到最后一次随访，按月记录，分析的协变量包括：性别、年龄、肿瘤的长度、组织学类型、大体分型、浸润深度、淋巴结转移情况、TNM分期等临床上可能的预后因素。为了减少训练时间，先采用COX比例危险模型对可能影响预后的因素进行筛选，采用向前逐步法，引入标准为0.05，剔除标准为0.10，结果显示对贲门癌患者生存率有影响的因素为：病人的肿瘤长度、淋巴结转移情况、组织学类型、筛选结果见表1。

表1贲门癌患者生存的COX逐步回归分析结果（略）

Tab.1TheresultofCoxregressionmodelforcarcinomaofthegastriccardia

2.1BP网训练集、校验集和测试集的确定

从原始数据中随机抽取80例作为训练集，80例作为校验集，76例为预测样本。

2.2输入数据的预处理

使输入变量的取值落在0到1的范围内。对于肿瘤长度使用x′i=ximax(x)进行归一化处理；病理分型为无序分类变量，以哑变量的形式赋值。

2.3神经网络模型的建立及训练

选取Cox回归选出的3个变量作为网络的输入。建立输出层为1个结点的离散型神经网络时，将病人生存时间按下式分为两类作为输出变量

yi（i=1,2,…,n），

即yi=1生存t≥5年

0生存t<5年；建立输出层为5个结点的离散型神经网络时，将病人生存时间分为5类作为输出变量yi，time<1year，1year≤time<2year，2≤time<3year，3≤time<5year，time>5year。

使用Matlab软件建立神经网络模型，学习率为0.01，传递函数采用logistic传递函数,单结点网络的隐单元数为2，多结点网络隐单元数为3，采用“早停止”策略防止过度拟合。

2.4两种神经网络模型预测性能

使用灵敏度、特异度、一致性指数C评价模型的预测性能。

表2两种神经网络模型预测性能*（略）

Tab.2Thepredictiveperformanceofthreetypeofneuralnetwork

*判断界值取0.5

3讨论

神经网络已在语音识别、图像诊断分析、临床诊断、高分子序列分析等许多方面取得了成功的应用，在医学研究领域，变量间关系往往非常复杂，神经网络正逐渐变成分析数据的流行工具，目前主要应用于分类与预测，用于生存分析方面的研究还较少。国内黄德生［5］等建立利用BP神经网络建立time-codedmodel和single-timepointmodel用于肺鳞癌预后预测，贺佳［6］等对肝癌术后无瘤生存期的预测做了应用尝试。

本文通过实例建立连续时间模型与离散时间模型探讨BP神经网络在生存分析中的应用，Faraggi提出的方法还可以扩展到其他可以处理删失数据的模型,例如加速失效时间模型、Buckley-James模型，但哪一种模型更好，还有待进一步研究。神经网络在生存分析中的应用主要在于［7］：个体患者预后的预测，研究预后因子的重要性，研究预后因子的相互作用；对于预测变量的影响力强弱，解释性还有待进一步探讨。还有研究者在建立多个时间区间的模型时将时间区间也作为一个输入变量，也有学者将神经网络纳入Bayes方法的研究框架，神经网络建立的生存分析模型可以探测复杂的非线性效应，复杂的交互效应，相信会逐渐应用到生物医学研究领域。

第3篇

[关键词]数据挖掘 BP神经网络 CPI预测

一、引言

目前，随着居民收入的快速增长，中国居民消费能力不断升级，尤其是近期我国居民消费价格总水平出现了明显上涨，其中粮食、猪肉等食品价格屡创新高。对于相关部门来说，应努力做到关注国际形势的同时，根据市场价格的变化情况进行科学分析，最终制定合理的综合性措施。应用现代技术对CPI进行预测在当前来说是很有意义的，国内很多专家学者在这方面都做了研究。以往学者对CPI的预测更多的是运用计量经济学方法，而通过数据挖掘方法进行CPI预测的研究不多，值得我们进一步探讨。

BP神经网络是一种应用最广泛的人工神经预测网络，它独有的容错性和泛化能力能较好地进行预测。本文选用SPSS公司的Clementine来进行BP网络模型的实现，Clementine中的工具箱使BP网络的建立、训练以及预测都变得非常简单，而且训练过程及效果非常直观，使神经网络应用于实际具有更大的可行性。

二、BP神经网络概述

BP网络是在1974年由Worbos提出，1986年Rumelhart和McCelland等人对具有非线性连续转移函数的多层前馈网络的误差反向传播（Error Back Proragation）算法进行了详尽的分析，实现了Minsky关于多层前馈网络的设想。

BP算法基本思想：学习过程由信号的正向传播与误差的逆向传播两个过程组成，正向传播时，模式作用于输入层，经隐层处理后，传向输出层。若输出层未能得到期望的输出，则转入误差的逆向传播阶段，将输出误差按某种形式通过隐层向输入层逐层返回，并分摊给各层的所有单元，从而获得各层单元的误差信号，以作为修改各单元权值的依据，这种信号正向传播与误差逆向传播的各层权矩阵的修改过程是周而复始地进行的。权值不断修改的过程，也就是网络的学习过程。此过程一直进行到网络输出的误差逐渐减少到可接受的程度或达到设定的学习次数为止。BP神经网络在进行设计时，主要考虑以下因素。

1.网络层数。一般BP网络由一个输入层，一个输出层，及若干隐含层构成。实际应用中，通常利用一个隐含层就基本上能满足大部分应用问题的需求，因为两层的神经网络可以逼近任何非线性函数。而盲目地增加隐含层层数，往往会使学习速度变慢，同时增加了结构的复杂性。

2.输入层节点数。输入层节点数由影响输出变量的变量个数来决定，一般来说有几个变量对输出变量的结果有影响就选择几个输入层节点。输入网络的节点过少，会使得网络不能很好地获得输入与输出数据的非线性关系，如果过多，就会增加过度适应的危险和增大了训练集的大小。

3.输出层节点数。输出层节点数取决于输出数据类型和表示该类型所需的具体数据。

4.隐层节点数。一个具有无限隐层节点的两层BP网络可以逼近任何非线性函数，但对于输入与输出均为有限个的网络，并不需要无限个隐层节点，这就涉及到如何选择隐层节点数的问题，而这一问题的复杂性，使得至今为止，尚未找到一个很好的解析式，隐层节点数往往根据前人设计所得的经验和自己进行试验来确定，也可从1、2、3开始。一般认为，隐层节点数与数据、寻找的模式以及网络的类型都有直接的关系。另外，隐层节点数太多会导致学习时间过长；而隐层节点数太少，容错性差，识别未经学习的样本能力低，所以必须综合多方面的因素进行设计。

隐层节点数的初始值可由（1）式来确定：

式中：m、n分别为输入层结点数与输出层结点数，l为隐层节点数。

5.传递函数。BP神经网络中的传递函数通常采用S（sigmoid）型函数，即

上式中x为前面组合函数的结果，一般取进入单元的输入加权和。

三、BP网络在CPI预测中的应用实例

我国的CPI由食品、烟酒及用品、衣着、家庭设备用品及服务、医疗保健及个人用品、交通和通信、娱乐教育文化用品及服务、居住等类构成。CPI具有较强的非线性特性，要对其进行较为准确的预测，就应该采用能捕捉非线性变化规律的方法。笔者将BP神经网络引入到CPI预测中来，用历史数据预测未来CPI相对增长率，弥补传统预测方法的不足。显然，CPI相对增长率与类别各自的增长率有关，在本文中正是从这类别对CPI的影响来进行模型的构建。

1.数据读取

本实例选取国家统计局的统计数据进行研究，同时采用Access作为数据库平台，前八个字段为当月CPI构成的类别指数，第九个字段为下月CPI，取部分记录显示，见表1：

表1 居民消费价格指数表

2.数据预处理

数据预处理对于数据挖掘是一个重要的问题，因为现实中的数据多半是不完整的、有噪声的和不一致的。数据预处理包括数据清理、数据集成、数据变换和数据归约。数据清理可以去掉数据中的脏数据，纠正不一致，包括空值处理、规范化数据格式、拆分数据等。数据集成将数据由多个源合并成一致的数据存储。数据归约可以通过聚集、删除冗余特性或聚类等方法来压缩数据。本文中数据预处理主要是对各输入指标进行归一化处理，以便进行BP神经网络模型构建。即将数值限定在［0，1］区间内，归一化公式为：

该步骤在Clementine中通过Field Ops部分的Derive组件实现。

3.模型构建及应用分析

本研究采用只含一隐层的BP网络，选取输入层节点数为8（分别为某个月的8个类别各自的相对增长率）；输出层节点数为1（为下个月的居民消费价格指数的相对增长率），同时根据前述经验公式，选取隐层节点数为3，而传递函数则选取默认的S型函数。在本模型中，还需设置以下参数，动量因子0.8，初始学习速率0.4，最大训练步数300。以上参数的选取以及模型的构建均在Clementine中实现，流程如图1所示。

在本模型中，随机抽取数据的70％作为训练样本，30％作为验证样本，来进行神经网络模型的训练，训练过程见图2。

图1 模型流程图

图2 模型训练过程

从图2中可以看到该模型的准确度较高，误差在允许的范围内波动，故将该模型应用于CPI预测是切实可行的。紧接着，将上文构建出的神经网络模型应用于2007年10月CPI预测中，因前半部分流程同图1，故从居民消费指数节点开始截取，流程如图3所示。

图3 预测过程

表2 2007年10月CPI预测结果

通过模型应用，预测结果如表2所示。从表2的$N-下月居民消费价格指数归一值字段中可以看到，2007年10月，居民消费价格指数归一值为0.968，通过公式（3）逆推算出当月CPI原值为106.25。该值在一定程度上反应了近期宏观政策制定的效果，从近期政策面及各方面反应来看，该预测结果基本符合该月的真实情况。总的来说，该模型的性能比较良好，可以达到对CPI进行预测的目的。

四、结论

通过上文我们能够看到，BP神经网络在CPI预测中具有较高的精度，在已知上月类别指数的情况下，通过该模型能够很快地计算出较准确的当月CPI指数，这能够给相关部门进行综合性措施的制定提供较大的帮助，同时能够提供较为科学的依据。本文初步尝试采用CPI近几年数据建立BP神经网络模型，旨在提出一种进行CPI预测的新思路。但由于CPI指数近几年来才按现行的标准进行统计，数据量有限，加上政策的制定对CPI的直接影响，所以在应用该模型进行预测时可能会出现一些大的误差，但总体来说，该模型已基本能够对CPI进行预测。当然，在应用该模型时，应随着新数据的进一步加入调整模型的各项参数，以使模型训练及预测能够达到最理想的效果。

参考文献：

［1］黄章树，王前辉.基于数据挖掘的电信增值业务营销策略研究［J］.福州大学学报（社科版），2005，（4）.

［2］黄章树，王凤英.基于决策树技术的福州市居民出行特征分析［J］.重庆工商大学学报（自然科学版），2007，（3）.

第4篇

【摘要】为解决神经网络在沉降预报应用中的局限性，结合灰色理论等维信息策略和BP神经网络建模思想，利用数据序列本身构建训练样本，建立BP神经网络预报模型，并利用数学工具MATLAB编程实现，进行模拟的变形预测，通过与灰色理论GM(1，1)模型的预报效果进行比较，表明该BP神经网络模型具有更高的预报精度，可以达到更好的预报效果。

【关键词】BP神经网络；变形检测；沉降预报最佳值为7；输入层和隐层的传递函数(Tfi)用缺省的正切S形函数(tansig)，输出层用线形函数(purelin)；网络训练函数(BTF)使用动量批梯度下降函数(traingdm)，它具有更快的收敛速度，而且引入了一个动量项mc，避免了局部最小问题的出现；网络权值、阈值学习函数(BLF)和性能函数(PF)采用MATLAB缺省值；对输入数据、目标数据、输出数据的处理，使用MATLAB提供的归一化函数(premnmx)和反归一化函数(postmnmx)。运行程序时先用训练样本对网络进行训练，然后利用训练好的网络对预报样本进行预报。灰色理论GM(1，1)模型同样利用MATLAB编程实现。

2.3结果分析

首先用MATLAB编写的灰色理论GM（1，1）模型和BP神经网络模型分别处理训练样本，得到相应的拟合误差。其中GM（1,1）相对模型拟合误差主要为18.97、4.48、9.07、33.71、7.63、4.08、9.50等，等维BP网络模型拟合误差主要为6.66、0.97、0.29、6.16、2.06、4.44.并且通过之前得到的模拟数据可以得出BP神经网络模型拟合的平均误差以及GM(1，1)模型拟合的平均误差为11.82%。BP神经网络模型拟合的误差小于GM(1，1)模型拟合的误差为3.10%，其拟合精度高于灰色理论GM(1，1)模型。为了进一步检测灰色理论GM(1，1)模型和BP神经网络模型的预报精度，再分别用两种模型对监测点的沉降数据的预报样本进行预报，并可从中得出BP神经网络模型的预报精度远高于灰色GM(1，1)模型的结果。

三、结论

本文引入灰色理论中新陈代谢思想构造神经网络的学习样本，建立BP神经网络预测模型，并用该模型进行了实际的沉降预测。工程模拟实例表明：用等维BP神经网络模型进行沉降预测是可行的，预报精度远高于灰色GM(1，1)模型。为了提高BP神经网络模型的预测精度，一方面需要有足够的观测数据序列，以保证神经网络学习所需的样本数。另一方面需要恰当地确定输入层神经元的个数，目前尚无据可依，只能通过根据试算确定。

参考文献

[1] 赵全.地面沉降数学模拟及其应用的研究[D].天津：天津大学，2011.

[2] 于先文，胡伍生，王继刚.神经网络在建筑物沉降分析中的应用[J].测绘工程，2010，13(4)：48-50.

第5篇

【关键词】BP神经网络；PID控制；直流电机调速系统

1.引言

PID控制以其算法简单，鲁棒性好和可靠性高等优点，广泛地应用于工业生产当中，成为衡量各行各业现代化水平的一个重要标志。随着科学技术的发展，生产工艺的日益复杂化，生产系统具有非线性，时变不确定性，在实际生产中，常规PID控制器参数往往整定不良、性能欠佳，对运行工况的适应性很差[1]。

BP神经网络具有良好的自学习、自适应能力和鲁棒性，可以用来处理高维、非线性、强耦合和不确定性的复杂控制系统。本文结合BP神经网络的优点和传统PID控制的优势，对PID控制器进行优化，使其具有很强的自适应性和鲁棒性。通过对直流电机调速系统仿真，结果表明，这种方法是有效的。

2.PID控制原理

PID是工业生产中最常用的一种控制方式，PID调节器是一种线性调节器，它将给定值r（t）与实际输出值c（t）的偏差的比例（P）、积分（I）、微（D）通过线性组合构成控制量，对控制对象进行控制。传统的PID控制系统原理框图如图2.1所示，系统主要由PID控制器和被控对象组成。它根据给定值rin（t）与实际输出值yout（t）构成控制偏差额e（t）：

图2.1为PID控制系统原理框图。

3.基于BP神经网络的PID整定原理

PID控制要取得好的控制效果，就必须通过调整好比例、积分和微分三种控制作用在形成控制量中相互配合又相互制约的关系，这种关系不一定是简单的“线性组合”，而是从变化无穷的非线性组合中找出最佳的关系[2]。BP神经网络具有良好的自学习、自适应能力和鲁棒性，将PID和BP神经网络结合起来，建立参数自学习的PID控制器。其结构如图3.1所示。

经典增量式数字PID的控制算式为：

式中，是与、、、u（k-1）、y（k）等有关的非线性函数，可以用BP神经网络通过训练和学习找到这样一个最佳控制规律。

假设BP神经网络NN是一个三层BP网络，其结构如图3.4所示，有M个输入节点、Q个隐层节点、三个输出节点。输出节点分别对应控制器的三个可调参数，，。其激发函数为非负的Sigmoid函数。而隐含层的激发函数可取正负对称的Sigmoid函数。

神经网络的前向算法如下：设PID神经网络有M个输入，3个输出（，，），上标（1）（2）（3）分别代表输入层、隐含层和输出层，该PID神经网络在任意采样时刻k的前向计算公式（3-3）如下所述：

基于BP神经网络PID控制算法可以归纳为：①选定BPNN的结构，即选定输入层节点数M和隐含层节点数Q，并给出各层加权系数的初值，选定学习速率和惯性系数；②采样得到和，计算；③对进行归一化处理，作为BPNN的输入；④计算BPNN的各层神经元的输入和输出，输出层的输出即为PID控制器的3个参数，，；⑤计算PID控制器的输出，参与控制和计算；⑥计算修正输出层的加权系数；⑦计算修正隐含层的加权系数：⑧置，返回②[3]。

4.仿真实例

仿真试验中所用的直流电机参数Pnom =10kw，nom=1000r/min，Unom=220V，I=55A，电枢电阻Ra=0.5Ω，V-M系统主电路总电阻R=1Ω，额定磁通下的电机电动势转速比=0.1925V.min/r，电枢回路电磁时间常数Ta=0.017s，系统运动部分飞轮距相应的机电时间常数Tm=0.075，整流触发装置的放大系数=44，三相桥平均失控时间Ts=0.00167s，拖动系统测速反馈系数=0.001178V.min/r，比例积分调节器的两个系数T1=0.049s，T2=0.088s。BP神经网络的结构采用4-5-3，学习速率和惯性系数，加权系数初始值取区间[-0.5，0.5]上的随机数。利用simulink模块建立模型如图4.1所示。

从上面的仿真结果中，进行比较分析后，可以得出常规PID控制系统BP神经网络PID控制系统两者对于在零时刻加幅度为1的阶跃信号，它们有着不同响应曲线。为了便于比较，可以将两者的响应结果列表，见表4.1。

5.结论

由仿真结果可知，BP神经网络控制系统的最大超调量和调整时间均比常规PID控制系统的最大超调量要小。这说明利用BP神经网络对PID控制器进行优化具有有良好的自学习、自适应能力和鲁棒性，在工业生产中，具有更高的价值。

参考文献

[1]王敬志，任开春，胡斌.基于BP神经网络整定的PID控制[J].工业控制计算机，2011（3）：72-75.

第6篇

1BP神经网络简介

1986年，Rumelhart，Hinton和Williams完整而简明地提出一种ANN的误差反向传播训练算法（简称BP算法），系统地解决了多层网络中隐含单元连接权的学习问题，由此算法构成的网络我们称为BP网络。

1.1BP神经网络的基本原理

BP网络的基本思路是将训练过程分为两个阶段，第一阶段正向传播，输入信息从输入层经隐含层单元处理后传向输出层，每一层神经元的状态只影响下一层神经元状态。倘若在输出层得不到希望的输出，则转入第二阶段反向传播，将误差信号沿原来的神经元连接通路返回。通过修改各层神经元的权值，逐次地向输入层传播进行计算。这样，反复地运用这两个过程，使得误差信号最小，最后使得信号误差达到允许的范围之内。

1.2BP神经网络的神经元模型

BP神经元的结构模式如图1所示，基于以下几点假定：其一，每一个神经元是一个多输入单输出的信息单元；其二，突触分兴奋性和抑制性两种类型；其三，神经元输出有阈值特性；其四，神经元输入与输出间有固定的时滞；其五，忽略时间的整合和不应期；其六，神经元本身是非时变的。BP神经元的三个重要功能：一是加权-可对每个输入信号进行不同程度的加权；二是求和-确定全部输入信号的组合效果；三是转移-通过转移函数f（.），确定其输出。1.3BP神经网络的结构BP神经网络的主要功能决定于两个方面：一是网络的组成结构形式，也就是BP神经网络的连接方式；二是网络的学习和运行规则，及网络中连接权值的调整规则。如图2和图3所示，BP神经网络多层网络有单层网络级连而成，即网络中下一层各神经元接受前一层各神经元的输出。输入层各神经元负责接收来自外界的输入信息，并传递给中间各隐层神经元；每一个隐层是神经网络的内部信息处理层，负责信息变换；最后一个隐层将信息传递到输出层，输出层将信息进一步处理后即向外界输出信息处理结果，完成了一次从输入到输出的信息处理。由输出层构成多层网络时，各层间的转移函数应是非线性的，否则多层网络只相当于一个单层网络，其映射和存储能力丝毫不比单层强。

2BP神经网络在钢铁工业中的应用

2.1BP神经网络在钢铁冶炼中的应用

近年来，BP神经网络以其并行运算及强大的非线性处理能力被广泛应用于转炉炼钢控制中，随后转炉人工智能静态控制模型被成功开发，使终点命中率有了很大提高。因此，国内外许多学者进行了大量的基于神经网络的转炉控制研究［8，9］。AmlanDatta等［10］报道了在转炉炼钢过程中开发BP神经网络模型来预测钢水中硫含量。模型经40个样本学习后，现场应用的实际相关系数为0.87。水城钢铁（集团）有限责任公司炼钢厂的张毅［11］采用3层BP神经网络来预测炼钢成品的C、Si、Mn成分，根据炼钢的实际生产数据选取铁水、废钢、供氧、吹氩、硅锰合金、增碳剂等28个因素作为输入变量，对输入参数进行归一化处理，采取附加动量项和自适应学习步长的措施，解决了BP神经网络局部收敛和学习时间过长的问题，提高了神经网络预报的准确率。杭州电子科技大学的朱亚萍［12］针对转炉炼钢静态模型终点命中率较低的问题，分析了影响转炉炼钢终点命中率的各种因素包括铁水量、铁水温度、铁水各项化学成分含量等共17个变量，确定了BP神经网络（BPNN）的拓扑结构，并依此建立了转炉炼钢静态模型，该研究提高了转炉炼钢静态模型的终点C含量和温度预测精度。宝钢的杨志勇等［13］针对铁水预处理粉剂模型，设计了BP人工神经元网络数学模型，并给出了在系统中的应用方案，使脱硫效果提高8%，符合现场实际生产需求，由于模型精确度大幅提高，脱硫生产操作过程能够得以稳定，极大地减轻了高炉和转炉的脱硫负担。

2.2BP神经网络在钢铁轧制中的应用

AMukhopadhyay，AIqbal等［14］采用三层BP神经网络预报了低碳热轧板的极限强度、屈服强度和延伸率，并研究了不同网络结构对预报准确率的影响，该模型采用121组数据进行验证，验证值与实测值吻合良好。该模型已在印度塔塔钢铁公司热轧厂成功在线应用。山东莱芜钢铁集团有限公司板带厂的王洪彬［15］利用所建BP神经网络卷取温度预设模型提高了卷取温度的控制精度，能够给出不同厚度规格时的可靠的预设定值，从而减轻了反馈控制的负担，提高了卷取温度的控制质量。重庆钢铁集团公司的朱颖杰等人［16］利用BP神经网络的方法预测SPCC冷轧带钢产品力学性能并以现场得到的化学成分（C、Si、Mn、P、S、Al）和工艺参数（退火温度、轧制速度）正交试验数据为基础，采用离线学习的方法得出网络的预报值，BP神经网络具有良好的预报性能，实测值与预报值之间的偏差不超过8%。昆明理工大学的栗景树等人［17］以昆钢热轧产品Q235为例，对热轧板带的质量预测进行研究。利用BP神经网络理论建立以化学成分、轧制参数为输入，以力学性能为输出的质量预测模型-BP热轧板带质量模型，并利用训练好的BP神经网络质量模型，对产品的力学性能进行预测，98%的预测输出与实际输出误差在5%以下。北京科技大学的吴晋斌等人［18］以0.33%C，0.40%Si，1.50%Mn，0.099%V的中碳含钒微合金钢在应变速率为0.005～30s-1、温度为750～1050℃条件下的单向热压缩变形实验数据为样本数据，用商用软件matlab6.5构建BP人工神经网络模型。适用于预测一定温度与应变速率范围内（0.1～0.9）应变处的热变形流变应力，与常用的表征稳态或峰值应变处的流变应力与温度和应变速率关系的Arrhenius方程相比，应用范围更广。东北大学的邱红雷等人［19］为了提高中厚板轧机轧制力的预报精度，采用轧制力模型自适应与人工神经元网络相结合的方法进行中厚板轧制力的在线预报。应用结果表明，采用本方法预报轧制力时精度优于传统的数学模型，相对误差可以控制在±3%以内。

2.3BP神经网络在漏钢预测中的应用

连续铸钢生产过程中漏钢是最严重的事故之一，在20世纪70年代后期，为尽可能降低连铸过程中发生漏钢事故所造成的损失，研发了连铸漏钢预报技术［20，21］。20世纪90年代，神经网络开始应用于漏钢预报系统中［22-24］。目前，国内外工程中获得实际应用的神经元模型大部分是BP网络模型。田陆等人［25］提出了一种基于前馈反向传播（BP算法）神经网络的漏钢预报系统。通过神经网络分析漏钢前一段时间结晶器的温度特征曲线，提前诊断出漏钢的可能性，做出及时的预报，防止漏钢的发生。此系统得到了广泛的应用。东北大学的厉英等人［26］建立了BP神经网络漏钢预测模型，增加了BP神经网络参数，改变了传统只考虑温度因素的方式，将拉速和中间包钢水温度作为输入参数，扩大了漏钢因素的考虑范围，提高了预报的准确性，对某钢厂现场实际数据进行训练和预测，实验测试结果准确率为100%。2.4BP神经网络在钢材组织及性能中的应用钢的力学性能与其化学成分和工艺参数间呈现高度的非线性关系，难以用数学模型精确描述，但人工神经网络特别适合描述非线性关系，在钢的力学性能的研究中有重要作用。近年人工神经网络在钢的性能预测方面得到了广泛的应用，取得了令人满意的结果。C觟l等人［27］采用广义回归神经网络（GRNN）对一种APIX65微合金化钢的韧性进行预测。网络的输入为化学成分（C、Nb、Ti、N），冶炼工艺参数（钢液总量，硬硼酸钙石、石灰、FeMn、FeSi、Al、CaSi加入量，吹Ar量，吹Ar时间），加工工艺参数（保温温度、保温时间、出炉温度、变形率、终轧厚度、终轧温度、卷取温度），网络的输出为冲击功。预测结果表明GRNN能有效地预测冲击功，相关系数为0.984，平均相对误差为3.04%。XuLiujie等［28］采用BP网络根据淬火温度和回火温度预测高钒高速钢（HVH-SS）残余奥氏体量、硬度、磨粒磨损强度；采用贝叶斯正则化与LevenbergMarquardt算法结合的改进的BP网络，改进后的BP网络能精确预测奥氏体量、硬度、磨粒磨损强度，并能用于研究热处理工艺对性能的影响规律，从而确定最佳热处理工艺。改变该钢中V、C含量后采用与上述相同的BP网络对磨损失重进行预测，该BP网络能精确预测磨损失重并反映化学成分与磨损失重间的关系，从而确定了V、C的最优加入量［29］。FWMargrave等用超声波探伤仪，对含有裂纹、线缺陷、穿孔、夹渣、气孔等缺陷的试样进行探伤，测得能表征缺陷的不同形状、位置、尺寸、服役条件（应力）等情况的回波信号，再将这些信号处理后作为BP神经网络的输入，输出端为上述5种缺陷和无缺陷共6个输出变量。缺陷的识别准确率大于90%。

3BP神经网络在钢铁工业中的局限及发展前景

BP神经网络存在学习收敛速度慢、学习时间长和数据依赖性强等局限性，因此寻找合适的算法与BP神经网络相结合，解决上述问题，是BP神经网络发展的重要研究方向。多年来，围绕BP神经网络陷入局部极小值的问题，国内外的研究者做了大量的工作。解决这一问题，必须彻底摆脱依赖梯度信息来指导数值调整方向，引进其他算法与BP算法相互结合。因此，模拟退火法、单纯形法、趋化性算法、随机学习算法、动量算法以及递推最小二乘（RLS）技术等方法应运而生。针对学习时间长这一问题，现在一般采用离线学习、在线预报作为变通手段。BP神经网络的发展为冶金工作者提供了一个全新的知识获取和处理手段。与其它传统模型（如数学模型、回归模型、时间序列模型及经验分析模型）相比，它具有较强的抗噪声和非线性问题处理能力。另外，它的实时性又使其能对过程实现在线响应。基于此，它被越来越多地收入到专家系统中，同时，其结构价值也在专家系统的功能应用中得到体现。

第7篇

【关键词】 BP神经网络;动量梯度下降算法;免疫学数据

作者单位:116044大连医科大学医学影像学系(陈艳霞);

大连医科大学检验医学院(刘挥)

人工神经网络理论以非线性大规模并行分布处理为特点,突破了传统的线性处理模式,以其高度的并行性,良好的容错性和自适应能力成为人们研究其赖以生存的非线性世界、探索和研究某些复杂大系统的有力工具,已应用于很多领域的信息处理工作。

BP算法的多层前馈网络的人工神经网络模型采用典型的有教师学习方式来进行预测和分类问题的处理。采用的传递函数通常是sigmoid型可微函数,可以实现输入和输出间的任意非线性映射。这使其在函数逼近、模式识别、数据压缩领域有着更加广泛的应用。该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,各神经元的作用函数为Sigmoid函数,用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束。应用BP网络处理正常状态与处于焦虑状态的学生的血液中免疫学指标数据,取得了很好的效果[1]。

1 基于BP网络的医学数据分析

数据选自在某大学就读的大学生,共计48例。在自愿、正常学习生活的情况下抽取他们的血液标本,然后再在考试前抽取他们的血液标本,分别进行五项免疫学指标检验,共获得两类、五项、480组数据。随机把其中的20例学生的两类、五项数据做为训练集输入矢量输入,目标矢量为处于考前状态的五项数据输出为1,平时正常生活状态的五项数据输出为0。网络训练时调整神经元之间的连接权值,使网络的输出和实际的两类情况尽可能相符。如果对所有的训练样本集网络的输出95%或更高能保证与实际结果一致,则训练过程结束。网络训练好后,剩余的28例学生的5项数据作为神经网络的输入项,神经网络的输出值就是该学生是处于考前状态1还是平时正常生活状态0。主要设计程序如下:

%NEWFF-生成一个新的前向神经网络;%TRAIN-对BP神经网络进行训练;%SIM-对BP神经网络进行仿真;pause %敲任意键开始

clc

a1=[955 182 148222 1240]’;

a2=[1190 1911252421010]’;

a3=[1370291743461460]’;

a4=[1150 1962001511370]’;

a5=[821 109 82195 899]’;

a6=[1290246 112 299 1200]’;

a7=[876 132 139 166 952]’;

a8=[800 200 53.7214 873]’;

a9=[1210187 215 210 1370]’;

a10=[1090 131 68.5285 1380]’;

a11=[1240 433 154 224 1520]’;

a12=[1300 239 61.3289 1150]’;

a13=[1200 284 71.9119 1430]’;

a14=[1270 339 133 197 1210]’;

a15=[1210 248 151 125 1330]’;

a16=[1030 294 132 137 1040]’;

a17=[876151 126 194 1020]’;

a18=[1130 246 129 320 1470]’;

a19=[1020 196 157 225 1200]’;

a20=[1260 243 96.9143 1330]’;

b1=[910 188 127 216 1300]’;

b2=[1160177 136 268 1220]’;

b3=[1370287 101 321 1420]’;

b4=[947 159 170 111 1310]’;

b5=[911 116 66.2216 1140]’;

b6=[1320278 80.1305 1250]’;

b7=[804 147 150 177 987]’;

b8=[930 227 66.4245 962]’;

b9=[903 147 191 217 1380]’;

b10=[729121 59.2285 1330]’;

b11=[1180 436 144 220 1460]’;

b12=[949169 70.3240 972]’;

b13=[1150 273 65124 1520]’;

b14=[1150 172 118 179 1340]’;

b15=[1110 216 144 120 1320]’;

b16=[898260 112 197 1000]’;

b17=[866155 134 181 1050]’;

b18=[1060 235 158 149 1400]’;

b19=[887160 136 168 1450]’;

b20=[1320 286 92154 1410]’;

p=[a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 a12 a13 a14 a15 a16 a17 a18 a19 a20 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20];%为输入特征矢量!

t=[-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1];%为输出目标矢量?

%创建一个新的前向神经网络

net=newff(minmax(p),[12 1],{’tansig’,’purelin’},’trainlm’);

%==============设置网络参数============================

net.trainParam.show = 50;

net.trainParam.lr = 0.05;

net.trainParam.mc = 0.9;

net.trainParam.epochs = 10000;

net.trainParam.goal = 1e-1;

%=======================================================

[net,tr]=train(net,p,t); %对网络进行训练

echo off;

b=[1590 245 125 286 1330]’;

w=sim(net,b);

if w>0

disp(’0’);

else

disp(’1’);

end

表1

BP神经网络处理免疫学数据结果

神经网络

诊断结果训练数据测试数据

正常状态考前状态正常状态考前状态

0 200243

10 20425

其中对于训练集,正常状态与考前状态的正确检出率为100%。对于测试集,正常状态的正确检出率为85.7%;考前状态的正确检出率为89.3%。平均为87.5%。

3 讨论

3.1 本研究所采用的人工神经网络检验免疫数据的结果较好地符合了已知数据,具有较高的准确性。

3.2 要想进一步提高该方法的准确性,应该注意收集更多更全面的检验数据。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。

3.3 可能对亚健康的诊断具有指导意义。亚健康问题各国医学界已作了一些研究,并取得了某些实际的成果。但是,由于亚健康的多种类型以及多种相关因素,使得现有的诊断在准确性和实用性方面都存在着相当的局限性,如建模复杂困难。由于对影响罹病与否的各种因子的作用机制了解得不是很清楚,如何建立诊断模型,以及如何确定新建立的模型在何种程度上与实际情况相吻合还是一个问题;容错能力不强,适用范围不广;依赖于某些病例库新建立起来的医学模型往往具有很强的局限性,用于新的病例库时误差有时较大。另外,由于医学方面的原因,我们收集到的数据有时不完整,而现有的研究方法所建立起的医学模型由于容错性差,对这些不完整的数据通常都难以处理。人工神经网络理论突破了传统的线性处理模式,以其高度的并行性,良好的容错性和自适应能力成为人们研究其赖以生存的非线性世界,探索和研究某些复杂大系统的有力工具。对亚健康的诊断关键在于准确找到亚健康的判定函数,可能利用BP网络的函数逼近功能来实现。这需要有更多的医学数据来实践检验。

参考文献

第8篇

1．1采用计算机模拟技术建立模拟模型

对BP神经网络模拟模型建立的基础，人们是这样认为的，因为影响工程造价的因素，大多数人们都是没办法确定的，所以我们不需要把这个值具体是多少确定下来，而是从另一个方面考虑，根据这个项目的基本情况，估计实际的造价落在某个范围的机会会大一些，这个思想就是计算机模拟技术建立模拟模型的理论基础。

1．2人工智能模型

工程造价估算专家系统，是通过人工智能，加上知识库技术而建立起来的，可是这种人工智能模型主要靠专家的知识，来对工程造价进行估计计算的，但是估算的结果是被估算人员的主观意识所影响的，不同专家的性格，知识面的宽窄，经验丰富与否、都是不确定因素，几乎可以会所不一样的估算专家所得出的结果都不会一样。这种方法很容易带有个人偏见和片面性。受专家的主观偏见性较强。

2BP神经网络模型构造与算法

2．1人工神经网络的基本原理

1985，D•E•Rumelhart等人组成的PDP小组提出的一种神经网络模型，这就是我们今天所说的BP神经网络，BP神经网络结构是利用误差反向传播来消除误差的，它有三个层次，有一个输入层，第二个是隐层，最后一个当然就是输出层。在训练估算中，我们可以通过计算输出值和我们预期的期望值，他们之间所产生的误差，逆向思维，去求解输出层单元的一般化误差，然后再把误差进行反向传播，把隐含层单元的一般化误差求解出来，并最终调整输出层和隐含层，包括输入层之间的连接权，还有连接权与隐含层和输出层的阈值，最终目的就是让系统误差达到我们可以接受为止。当先前的系统误差达到我们所需求的时候，权值和阈值就变成了固定不变的了，这样我们再通过反向逆推，就可以测出我们这个项目的未知信息。这就是人工神经网络的基本原理。

2．2BP神经网络模型建立的步骤

(1)我们首先确定模型输入层，隐含层还有输出层的神经元个数。并且以此为依据，确定BP神经网络模型的结构参数;(2)神经网络只能处理－l～l之间的数据，所以在输入网络时，我们不仅需要对原始数据进行规范化处理，还要对隐含单元和各个单元输入信息进行求和;通过反向逆推之后得到本单元的输入信息。所以对原始数据，隐含单元输入模块规范化细致化是非常重要的;(3)隐含单元的输出值可以根据神经网络操作模型得出，只要我们把net信号经过一次激发函数的处理，可以得到这个隐含单元的输出值;(4)对于输出单元节点，我们只要对前一层的隐含层单元输入信息，并且加权求和后，就能得到该单元的输入信息。操作起来非常方便快捷;(5)对权矩阵的调整，因为人工神经网络可以近似实现任意空间的数学映射。所以我们假设，如果神经网络输入单元数为M，输出单元为N，则在m维欧式空间尺中会有一个有界子集A，存在着一个到n维欧式空间，那么R中一个有界子集F(A)的映射。

3基于BP神经网络的工程造价估算模型

3．1定量化描述工程特征的因素

什么是工程特征，在BP神经网络中所说工程特征，就是指不但能表示工程特点，而且还能反映工程的主要成本构成的重要因素。，我们可以通过参照历史工程资料的统计和分析，进行工程特征的选取工作。选取完成之后，再根据专家的经验来确定，这样就可以万无一失了。首先我们可以通过典型住宅工程的造价组成进行分析，然后对建筑结构参数的变化和别的工程做一下对比，通过以上两点得出的结果，分析这些因素对造价的影响，依照以上的理论方法，我们进行了实践性的研究，最终把础类型，结构形式，建筑层数，门窗类型，外墙装饰还有墙体材料以及平面组合等，这7种因素作为工程的主要特征。不同的建筑工程有着不同的类型，比如说结构，可以是砖混结构和框架结构等;砖条基和钢筋砼条基础等都可以作为基础特征，对于这样的特征选取的多样性我们称之为特征类目，通过工程特征不同类目的列举，再跟据定额水平，工程特征对造价影响的相关性，这些对平方米造价的改变，对工程定量化的描述可以主观的给出对应的量化数据。

3．2建立估价模型

工程造价估算的指标体系到该项目的单位造价的非线性映射，就可以统称为是建设项目工程造价的估算问题。BP网络可以根据人们的需求以任意的精度去逼近任意映射关系，究其原因就是上文说的BP网络采用的是三层BP神经网络结构，不同于其他的电脑估算网络。不仅是因为该模型的输入单元为7个，还有他们的项目样本特征也不尽相同。神经网络可以根据已经经过我们优选的模型特征，做为参考估算要素，然后再通过项目工程造价估算中，我们所提供的一定数量的已知样本，采取对样本的神经网络训练，最后根据以往的大的数据库，提取类似的项目估算值，然后才能对其它特征的项目进行估算。这样我们只需要输入指标体系的各指标值，BP神经网络就可以在该项目的单位造价的非线性映射中给出该项目的单位造价。

3．3检测结果的分析

上面我们通过大量的实际实验得知了这两个固定不变的数字，然后我们可以用程序值被收敛后的网络，对现在要进行求解的数据进行检测，在测试后，如果发现总体误差比率较小，那么就满足我们初步设计的概算需求了，同时对工程可行性研究的投资估算需求也已经基本符合了，这些结果能有好的保证，全是依赖我们所选择的模型的宽度够用，模型在所有的因素中具有广泛的代表性。所以估价模型的计算才较为成功。几个工程估算的好坏也不能代表所有的项目都是完美的，也有个别工程造价估算误差大，因为电脑毕竟是人在给其输入程序，电脑的经验，还有就是对一些特征的学习不够用，本身的知识储备还是有局限性的。因为对样本数量的学习始终是有限，不可能面面俱到，而且挑选的样本也不可能针对这个工程而言都是符合这个项目的特性。虽然说BP神经网络模型有这样无法控制的缺点，但是和其他的造价估算模型相比，BP神经网络模型的优点还是可圈可点的，其优点和其他的造价模型相比较优点还是非常明显的。在以后的估算中，随着样本的不断充实，数据的不断积累，经验的不但丰富，其估算的误差也将不断缩小，这些方面的补充，在以后的估算中，必定会取得非常完美的成绩。

4总结

第9篇

关键词BP神经网络；汽车故障率；神经元；梯度下降

中图分类号U2 文献标识码A 文章编号2095―6363（2017）03―0063―02

随着互联网、数据库、云计算、移动通信技术的快速发展和进步，促进了其在多领域得到广泛普及，开发电子政务、电子商务、在线学习、物流仓储、智能家居、金融证券等领域得到广泛普及和使用，已经积累了海量的应用数据资源，并且持续呈现几何级数增长。汽车是信息化普及和使用的一个重要方向，汽车生产制造、保养修复、运行监控等都开发了先进的智能管理系统，这些系统运行也积累了海量数据，可以采用分类算法挖掘潜在有价值信息，形成一个个的数据类别，这些数据类别内部具有高度相似性，类别之间高度相异，因此就可以根据用户输入的信息主体划分数据资源，提供一个合理的知识解释和决策信息。

1 BP神经网络理论

目前，汽车故障数据分析主要包括2个类别，一是有监督学习方法，比如BP神经网络、支持向量机、贝叶斯理论；一种是无监督学习方法，比如谱聚类、密度聚类、K均值、信息等方法。有监督大数据分析方法需要利用人们的经验，预先构建一个分析模型，然后尽可能提高这个学习模型的准确性，从而保证类别分析的精确度；无监督学习方法却不需要任何先验知识，系统自动的将数据按照不同的关注角度进行分类。

BP神经网络能够按照统计学规则，实现误差逆传播，是一种多层次的前馈神经网络，目前已经在多个机器学习和模式识别领域得到广泛普及。BP神经网络可以学习和存储海量的数据信息，并且经过自学习形成一个强大的支持网络结构，并且利用当前最为流行的梯度下降方法，不断调整网络的结构、权值和阈值，降低网络的误差平方和，准确提取相关的数据隐含模式信息。汽车运行数据处理过程中，输入层可以接收所有数据，并且将这些数据传输给中间层的神经元，神经元可以负责数据信息处理、变换，并且能够根据信息变化能力的需求，改变和整合中间层结构汽车运行数据流经过识别和处理之后，就可以从中间层分发到输出层，这样就可以完成一次学习过程，将BP神经网络训练成为一个准确度非常高的模型，还可以通过误差梯度下降等修正各个层次的权值，向隐藏层逐级反馈，实现反向传播和修正，提高汽车运行数据识别精确度。

2汽车故障率预测模型设计

汽车故障是指企业部分组件或全部组件丧失工作能力，也即是零部件机器相互配合的状态发生了异常变化，汽车故障广泛地发生于生产制造、运行使用、修理维护等全过程，因此每一个环节都需要非常小心和注意，尤其是在汽车使用故障发生时，一定要及时发现故障类型，及时排除故障内容，才能够保证汽车使用中尽量降低事故发生率。目前，汽车故障形成具有很多原因，具体原因如下所述。

1）汽车组成部件自身质量差异。汽车及其自身组件由于生产厂家、生产批次均不同，因此不可避免的存在许多质量差异，原厂配件在使用过程中将会出现很多问题，协作厂和不合格的配件装配到汽车上之后将会出现很多问题，对于不同批次、规格相同的部件来讲，可以将其划分为好中差3个层次，权值因子设置为0.95、0.8和0.6。

2）汽车消耗品质量差异。汽车运行中，消耗品包括燃油、油等，这些消耗品的自身质量将会影响汽车运行性能和使用寿命，非常容易的导致企业发生故障。目前汽车常用的燃油包括90#、95#和97#。

3）汽车使用环境影响。汽车使用环境复杂，路面易发生各类型事故，同时山区、城市、丘陵等地带由于地势不同，耗费的动力也是不同，汽车使用环境复杂多变，容易诱发汽车故障，将使用环境划分为3个方面，分别是好良中，权值因子设置为I/0.8和0.5。

4）汽车故障诊断和维修的影响。汽车运行中，需要定期对其进行保养，以便能够准确诊断故障，才能够将这些内容修复完毕。汽车运行维护、故障诊断、维修服务中需要较高的技术，因此为了提高这些技术产品的应用性，可以将汽车定期维护程度划分为多个时间长短的内容，分别是0-3/4-6/7-9三个阶段。

5）汽车的自然损耗。汽车各个组件会随着运行公里的增加逐渐衰弱，汽车自燃损耗越多，产生故障的概率就越大，因此汽车的自然损耗也是一个关键因素。

基于BP神经网络的汽车故障率预测模式可以利用管理系统、传感器等采集上述5个方面的数据信息，将这些信息输入到BP网络的输入层，输入层接收道数据之后，将其按照权值因子进行整合，输入到隐藏层网络，隐藏藏网络利用梯度下降、多层反馈等关键技术，对BP神经网络进行训练和学习，通过对此类标签对比，不断拟合调整网络权值，形成一个强大的故障率预测网络结构，这样就可以准确预测网络结构，将其输出到显示器上，具体的BP神经网络运行如图1所示。

第10篇

人工神经网络（Artificial Neural Networks，ANN），是基于人类大脑的生物活动所提出的，是一个数学模型。它由众多节点通过一定的方式互联组成，是一个规模巨大、自适应的系统。其中有一种学习算法是误差传递学习算法即BP算法。BP算法是人工智能最常用到的学习方法，从一定意义上来讲，BP算法的提出，终结了多层网络在学习训练算法上的空白史，是在实际应用中最有效的网络训练方法，对ANN的应用和发展起到了决定性的作用。

BP算法是使用从输出层得到的误差来估算前一层的误差，再利用该误差估算更前一层的误差。依次进行，就会获得其他所有各层的估算误差。这样就实现了将从输出层的得到误差沿着与输入信号传送相反的方向逐级向网络的输入端传递的过程[1]。但是，BP算法也存在着不可忽视的缺陷。基于此，该文总结介绍了BP的改进方法。

2 BP算法的基本思想

2.1 BP算法的基本原理

BP算法是有监督指导的算法，它的学习训练过程一般分为两步：首先是输入样本的正向传递；第二步误差的反向传递；其中信号正向传递，基本思想是样本值从输入层输入，经输入层传入隐藏层，最后通过输出层输出，中间层对样本数据进行处理操作，利用各层的权值和激活函数对数据进行操作然后在输出层获得输出[2]；接下来就是反向传递，算法得到的实际输出值与期望目标输出之间必然会有误差，根据误差的大小来决定下一步的工作。如果误差值较小满足训练的精度要求，则认为在输出层得到的值满足要求，停止训练；反之，则将该误差传递给隐藏层进行训练，按照梯度下降的方式，对权值和阈值进行调整，接着进行循环，直到误差值满足精度要求停止训练[3]。

3 BP算法的缺陷

尽管BP算法有着显著的优点，但是在实际应用过程中，BP算法会出现很多问题。尤其是下面的问题，对BP神经网络更好的发展有很大影响。有的甚至会导致算法崩溃。

3.1 收敛速度的问题

BP算法在进行训练学习时，收敛速度慢，特别是在网络训练达到一定的精度时，BP算法就会出现一个长时间的误差“平原”，算法的收敛速度会下降到极慢[4]。如果盲目的加快收敛速度，则会使算法产生震荡现象。

3.2 局部极小点问题

在一些初始权值的条件下，BP算法在训练过程中会陷入局部极值。这是由于BP网络采用最速下降法，误差曲面非常复杂且分布着许多局部极值点，一旦陷入，BP算法就很难逃脱，进而会使BP网络的训练停止。算法可以在某处得到一个收敛值，但是并不能确定取到了误差曲面的最小值。这样就会使网络难以达到事先规定的误差精度[5]。

3.3 网络瘫痪问题

在算法的学习训练过程中，网络的权值会变得很大，从而使得节点的输入变大，这就会导致其激活函数的导函数在改点取得的值很小，接着会导致算法的训练速度变得极低，最终会导致BP网络停止收敛，网络瘫痪。

3.4 步长问题

BP的收敛是建立在无穷小权修改量的基础上，而这就意味着网络所需要的训练时间是无穷的，这显然是不可取的。因此，要限定权值修改量的值。这主要是因为，如果步长太小，那么网络的收敛速度就会下降，如果步长太大，就会使BP神经网络产生瘫痪和振荡。学者们经过研究提出一个较好的方法，就是用自适应的步长代替原来的定值步长，以使权值修改量随着BP网络的训练而不断变化[6]。

4 改进BP算法的方法

BP算法应用广泛，但它又存在很多缺陷，针对BP算法的问题，国内外许多学者提出各种改进方法，主要的改进方法分为两类：一是启发式改进，如附加动量法和自适应学习率等；二是结合新理论的改进。这些方法在不同程度上提高了网络的收敛速度，避免了局部最小问题。

4.1 启发式改进方法

启发式改进方法是建立在BP网络梯度下降规则的基础上，通过对BP神经网络的权值和学习率的改进，从而解决BP网络在学习训练过程中遇到的问题。它的核心思想是：使权重的调整量最大限度的适应误差下降的要求。该文主要介绍了附加动量法。

传统的BP算法实际上是运用最速下降规则来搜索最优点的算法，该规则是顺着梯度的反方向进行权值的修正，并不将前一阶段积累的经验考虑进来。因此会在训练过程中发生震荡，导致收敛速度缓慢。但是将动量项引入到BP网络中后，当输入样本依照顺序输入时，则可以将权值的修正公式看作为以t为变量的时间序列，那么权值的修改公式就改变为如下所示：

加入动量项以后若本次。

4.2 BP网络结构的优化

在BP算法中，输入和输出节点的个数由实际问题确定，网络结构的优化主要是针对隐藏层的节点数和层数。许多研究表明，一个隐藏层就可以解决各种分类问题。那么对于隐藏层节点的个数的确定，有的学者给出了公式[NH=NI+NO+L]（其中[NH]表示隐藏层节点数，[NI]表示输入层节点数，[NO]表示输出层节点数），但是公式缺乏一定的理论支持，所以目前最好的方法是通过经验和在学习训练过程中不断的调整隐藏层节点数，最后得到一个合适的网络结构。

4.3 基于新理论的算法改进

随着对BP网络结构知识的研究，能够更加深刻的理解BP算法误差传递的本质。出现了许多基于新兴理论的BP算法的改进，这种改进方式是结合了其它领域比较成功的优化算法和理论，比如将遗传算法与BP算法相结合，将遗传算法高效的全局寻优能力引入进来，利用GA算法来优化BP算法的权值和阈值，解决BP神经网络存在容易陷入局部极值和收敛速度慢的问题，两种算法的结合实现了各自优势的互补，取得了良好的效果[8]；将粒子群优化算法用于BP神经网络的学习训练，使算法更容易找到全局最优解，具有更好的收敛性[9]。很多研究者还将BP算法与模糊数学理论、小波理论、混沌算法等相结合。这些改进使得BP神经网络得到更进一步的应用。

5 小结

BP算法是目前在神经网络学习算法中得到最广泛应用的。该文总结了BP算法的原理，针对BP算法中出现的问题，虽然给出了BP算法的改进方法，但还是有很多不足之处。随着科学日新月异的发展，各种新的优化算法不断的提出，BP算法也会得到更广泛的发展。

参考文献：

[1] 胡彩萍.基于BP神经网络的排序评价算法研究及应用[D].南昌：江西师范大学硕士学位论文，2009.

[2] 刘翔.BP算法的改进及其应用[D].太原：太原理工大学硕士学位论文，2012.

[3] 张璐璐.基于遗传神经网络的人民币识别方法研究[D].长春：吉林大学硕士学位论文，2009.

[4] 张波.DRP决策支持系统及小波网络在其中的应用[D].成都：四川大学硕士学位论文，2006.

[5]付海兵，曾黄麟.BP神经网络的算法及改进[J].中国西部科技，2012，11（8）：1671-6396.

[6] 周羽.红外图像人脸识别研究[D].大连：大连理工大学硕士学位论文，2007.

第11篇

关键词：图像标注；BP神经网络；Normalized Cuts；图像低层特征

中图分类号：TP391文献标识码：A文章编号：1009-3044(2011)14-3399-02

Image Semantic Annotation Based on BP Neural Network Algorithm

WU Yu-hua

(Department of information Technology, Hengyang Technician College, Hengyang 421008, China)

Abstract: Because of the "Semantic gab" problem in the traditional CBIR(content-based image retrieval ) systems, they are not fit in some special areas. The appearance of Image-Semantic-Annotation can effectively resolve this problem. This paper represents a method that first uses the Normalized Cuts to cut the image into several areas and then extract the low-level features, last use BP neural network algorithm to learn the relations between the areas and the annotation words. The experiment's results proved this method is valid and efficient.

Key words: image annotation; BP neural network; normalized cuts; low-level feature

基于内容的图像检索近10年来得到了研究者的关注,一系列的基于内容的图像检索方法和检索系统被提出来。然而由于计算机对图像信息的理解和人对图像信息的理解存在着客观区别, 检索系统中就难免存在计算机认为的“视觉相似”和人们所理解的“语义相似”之间的“语义鸿沟( Semantic gap )”。如何解决“语义鸿沟”问题是目前CBIR系统亟待解决的技术难题。图像标注这个直观的想法能有效地弥补语义的缺失,它可以利用已标注的图像集自动学习语义概念空间与视觉特征空间的关系模型,并用此模型标注未知语义的图像,即它试图在高层语义特征和底层视觉特征之间建立一座桥梁。因此,它可以一定程度解决大多基于内容图像检索方法存在的语义鸿沟问题。如果能实现自动图像标注,那么现有的图像检索问题实际上就可以转化成技术已经相当成熟的文本检索问题。它的潜在应用领域包括生物医学、商业、军事、教育、数字图书馆和互联网检索等。

1 相关研究工作

图像自动标注技术可以利用已标注的图像集自动学习语义概念空间与视觉特征空间的关系模型,并用此模型标注未知语义的图像,即它试图在高层语义特征和底层视觉特征之间建立一座桥梁。近年来图像自动标注技术正成为国际上图像检索领域的一个研究热点。许多机器学习方法由于能很好地获取图像特征和文本描述之间的对应关系,因而被引入这一领域，并且已经出了一些成果，例如同现模型(Co-occurrence Model)[1],基于机器翻译的对象识别模型[2]，跨媒体相关模型(Cross-Media Relevance, CMR)[3]等等。

本文中我们提出了先使用Normalized Cuts[4]方法对图像进行分割并提取出每个区域的低层特征，再利用BP神经网络算法来学习图像区域特征和标注字的对应关系模型并用此模型来对未知语义图像进行自动标注的方法，实验证明该方法能够取得很好的效果。

2 Normalized Cuts及图像区域特征选择

因为Normalized Cuts在图像分割这块有强的优势，所以本文中我们选择其作为图像的分割方法。先对图像进行Normalized Cuts区域分割，然后提取图像的各个区域特征，在这里我们采用的图像低层视觉特征是颜色、纹理特征的结合。

2.1 Normalized Cuts区域分割

我们使用Timothee Cour等人开发的Multiscale Normalized Cuts Segmentation Toolbox对每个图像（160*160）进行区域分割（nsegs = 8），分割的效果如图1所示。

2.2 低层特征提取

由于图像的颜色分布信息主要集中在低阶矩中，因此我们采用颜色的一阶矩、二阶矩和三阶矩来表示图像的颜色分布。一阶中心矩、二阶中心矩和三阶中心矩分别表示图像或子区域图像的平均颜色、标准方差和三次根非对称性，公式分别为以下式1、2和3：

(1)

(2)

(3)

对于每幅图像每一个分割区域我们可以得到3个颜色分布特征。

我们采用的纹理特征是Gabor纹理特征（Gabor滤波变换后求取图像区域的均值和方差）。Gabor滤波后的部份图像效果图如图2所示。

我们对每幅图像从4个尺度(0,1,2,3)和8个角度（0℃，45℃，90℃,135℃,180℃,225℃,270℃,315℃）组合进行滤波后再提取每个区域的均值和方差作为纹理特征,这样每个区域就可得到32个纹理特征。

通过上面的低层特征提取，每幅图像的每个区域我们可以得到共有35个低层特征，即颜色特征3个，纹理特征32个。

3 BP(Back Propagation)神经网络

3.1 BP神经网络典型结构

图3为BP网络结构图。

3.2 BP学习算法[5]

BP(Back Propagation)算法为误差反向传播算法，主要分为两个阶段：一个前向传播阶段（计算误差），另一个误差反向传播阶段（修改权值）。

BP具体算法：

①创建nin个输入单元，nhidden个隐藏单元，nout个输出单元的网络；

② 初始化所有的网络权值为小的随机值（-0.05~0.05）；

③ 在遇到终止条件前（达到迭代次数或者训练精度），对于每个训练样例做以下计算：

1）输入沿网络前向传播：把实例输入网络,并计算网络中每个单元u的输出ou。

2）误差沿网络反向传播：

对于网络的每个输出单元k,计算它的误差项dk，；

对于网络的每个隐藏单元h,计算它的误差项δh: 。

3）更新每个网络权值wji，

3.3 图像标注基本原理

图像标注基本原理如图4所示，主要分为两个阶段：模型训练阶段和标注阶段，我们采用BP神经网络模型来学习图像区域特征和标注字之间的对应关系。

训练阶段主要是对已标注的图像集进行处理，包括：1、图像的区域分割，2、区域特征的提取，3、区域对应的标注字的提取（也即对应的标记，例如在程序中，我们使用1代表森林，2代表草地，3代表动物，4代表天空等），4、BP神经网络模型训练几个步骤，训练后得到的权值，我们保存在weight.txt文件中。

标注阶段是对待标注的图像集进行处理，包括：1、图像的区域分割，2、区域特征的提取，3、从weight.txt文件中读取各层的权值到BP模型中，使用训练好的BP模型来对待标注的图像进行标注。

4 实验结果

我们使用的实验数据为微软亚洲研究院视觉计算组的图像集。我们从中挑选了300幅包含动物、草地、森林和天空等对象的图像作为训练集，先使用NormalizedCuts方法进行区域分割，得到8个区域并抽取其36维特征向量，在程序中我们采用三层BP模型，36个输入单元（对应36个低层特征），15个隐藏单元和4个输出单元（对应4个对象，动物、草地、森林和天空），学习因子为0.3，训练后得到权值保存在weight.txt文件中。另外我们选取了50幅图像作为测试集，在PIV 2.0G 256M 硬件环境和XP系统，vs2005 + OpenCV_1.0的软件环境下进行实验，使用本文提出的方法来进行图像语义的标注，准确率达到78.23%，初期实验结果样例如图5所示。

5 结束语

使用BP神经网络算法能够很好学习区域特征和标注字的对应关系，因此图像的区域分割和低层视觉特征选择很重要，搞好了就能很好地进行图像语义自动标注，对稍微简单点的图像标注准确率比较高，对复杂图像的标注准确率下降很多，也就是BP神经网络存在无法学习图像的上下文信息的缺点。因此如果能够融合图像的上下文信息的话，标注的效果会更好。而CRF（条件概率随机场）[6]在融合上下文信息这方面功能很强大，因此，未来的工作重点主是结合BP和CRF对图像进行语义的自动标注。

参考文献：

[1] Mori Y, Takahashi H, Oka R.Image-to-word transformation based on dividing and vector quantizing images with words[J].In Proc. of MISRM,1999.

[2] Duygulu P, Barnard K, de Freitas J F G, et al, Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary[J].Proceedings of the 7th European Conference on Computer Vision-Part IV,2002:97-112.

[3] Jeon J, Lavrenko V , Manmatha R. Automatic image annotation and retrieval using cross - media relevance models[C].New York: ACM Press, 2003:119 - 126.

[4] Shi J, Malik J.Normalized cuts and image segmentation[J].In Proc. IEEE Conf. Computer Vision and Pattern Recognition,731-737,1997.

第12篇

关键词：电网负荷预测； BP神经网络；模拟退火优化算法；预测误差

中图分类号： TN926?34； TM715 文献标识码： A 文章编号： 1004?373X（2016）20?0064?03

Abstract： Since the forecasting accuracy of the traditional linear load forecasting method cannot meet the requirements of the modern power grid management system， the nonlinear BP neural network algorithm suitable for the power grid load prediction task is used in this paper to build forecasting model. Because the conventional BP neural network is easy to fall into the local optimal solution and has low convergence efficiency， simulated annealing algorithm is used in this paper to optimize the BP neural network weight training algorithm to improve the convergence efficiency and self?learning ability of the prediction model. The prediction model studied in this paper is analyzed with an example. The results show that the training times and training time of the improved BP neural network are less than those of the conventional neural network， and it has higher convergence accuracy， in addition， the prediction error of the improved BP neural network prediction model is obviously reduced.

Keywords： power grid load forecasting； BP neural network； simulated annealing optimization algorithm； prediction error

0 引言

对电网负荷进行预测对于确保电力系统正常稳定运行具有重要意义，对电网的短期负荷进行精确预测能够降低电力电网系统的运行和维护成本，负荷预测系统已经成为电力电网管理系统中的重要组成部分之一，同时也是电力科研工作者的主要研究重点内容之一[1?5]。

传统的电网负荷预测方法主要是基于线性的时间序列分析法、回归分析模型等，然而实际的电力负荷模型是非线性的，电网的负荷会受到温度、湿度等各种影响因素干扰，使得传统线性预测模型的预测精度无法满足现代电力电网管理系统的精度要求[6?7]。

BP神经网络预测模型是一种非线性的预测模型，其具有自学习能力、预测精度较高以及强大的非线性函数关系拟合能力等优点，特别适用于电力电网负荷的预测任务，但是常规的BP神经网络存在容易陷入局部最优解以及收敛效率低等问题[8?9]。因此本文使用模拟退火算法对BP神经网络权值训练算法进行优化，提高预测模型的收敛效率和自学习能力。

1 改进型BP神经网络预测模型

常规的BP神经网络存在容易陷入局部最优解以及收敛效率低等问题，因此本文使用模拟退火算法对BP神经网络的权值参数的训练进行优化。模拟退火算法模拟金属材料退火过程，在固定时段内以一定的概率算法求解较大搜索空间内的全局最优解[10]。

使用模拟退火算法对BP神经网络优化过程为[12]：

步骤1：对参数进行初始化，初始生成一个较大的温度[T0]，随机生产BP神经网络的初始权值，并由初始权值组成初始的状态解[ωij0]。

步骤2：根据随机扰动模型由第k步的解[ωijk]得到第k+1步的解[ωijk+1]。

步骤3：将新的状态解[ωijk+1]赋值到BP神经网络模型中，使用训练数据对新生成的BP神经网络进行训练，使用目标优化函数计算该BP神经网络预测值与期望值之差。

步骤4：判别系统能否接收新的状态解[ωijk+1]。

步骤5：如果内循环次数达到设定最大值，则进入下一步，否则跳回步骤2。

步骤6：若满足调节[Tk+1

步骤7：若SA算法完成对各个训练样本的优化任务后，并且温度达到设置的终止温度，则结束优化过程，SA算法的最优解则作为BP神经网络的最优连接权值。

2 实例分析

通过实例对本文研究的改进型BP神经网络电网负荷预测模型进行分析。调取了某市2009―2010年的电网负荷数据以及天气数据等，并针对某一天的电网负荷进行预测，与真实数据进行对比[13]。

使用常规BP神经网络与改进型BP神经网络进行对比实验，两种模型的输入神经元个数均为65，输出为24个，即对某一天24个小时负荷量的预测[14?15]。使用训练样本对两种预测模型进行训练，得到了训练结果性能如表1所示。

由表1可以看出，在精度要求一致时，本文研究的改进型BP神经网络的训练次数和训练耗时均低于常规神经网络，说明改进后的BP神经网络具有更快的收敛效率，同时改进后的BP神经网络的相对误差平均值降低了2.44%，相对误差最大值降低了4.22%，说明改进后的BP神经网络具有更高的收敛精度。

使用上述训练后得到的预测模型，对该市2009年10月13日的24 h电网负荷进行预测，得到的预测结果如表2所示。

表2 电网负荷预测结果

通过计算可得常规BP神经网络预测模型的预测均方误差为3.29%，平均相对误差为2.78%，使用改进型BP神经网络预测模型的预测均方误差为1.52%，平均相对误差为1.18%，预测误差明显降低。两种预测模型的预测值与真实值比较如图1所示。由图1可以看出使用改进后的BP神经网络预测模型的预测准确度平均值达到了99.2%以上。

3 结语

电网负荷预测对于确保电力系统正常稳定运行具有重要意义，是电力科研工作者的主要研究重点内容之一。本文使用BP神经网络建立电网负荷预测模型，并使用模拟退火算法对BP神经网络权值训练算法进行优化，提高预测模型的收敛效率和自学习能力。最后通过某市2009―2010年的电网负荷数据以及天气数据等对本文研究的改进型BP神经网络电网负荷预测模型进行分析，结果表明，本文研究的改进型BP神经网络预测误差明显降低，具有较好的应用价值。

参考文献

[1] 王大鹏.灰色预测模型及中长期电力负荷预测应用研究[D].武汉：华中科技大学，2013.

[2] 任丽娜.基于Elman神经网络的中期电力负荷预测模型研究[D].兰州：兰州理工大学，2007.

[3] 程其云.基于数据挖掘的电力短期负荷预测模型及方法的研究[D].重庆：重庆大学，2004.

[4] 张华.基于优化BP神经网络的微博舆情预测模型研究[D].武汉：华中师范大学，2014.

[5] 马洪松.基于改进灰色模型的电力负荷预测方法研究及应用[D].北京：华北电力大学，2013.

[6] 朱晓明.BP?灰度模型的电力负荷预测模型研究[J].科技通报，2013（8）：50?52.

[7] 周建中，张亚超，李清清，等.基于动态自适应径向基函数网络的概率性短期负荷预测[J].电网技术，2010（3）：37?41.

[8] 陈伟淳.基于多神经网络的智能电网短期负荷预测研究[D].广州：华南理工大学，2012.

[9] 熊伟.基于粒子群模糊径向基网络的电力系统短期负荷预测[D].长沙：长沙理工大学，2009.

[10] 尤丽华，吴静静，王瑶，等.基于模拟退火优化BP神经网络的pH值预测[J].传感技术学报，2014（12）：1643?1648.

[11] 王惠琳.模拟退火遗传算法优化的BP网络在翘曲量预测中的应用[D].杭州：浙江大学，2011.

[12] 王惠琳，胡树根，王耘.基于模拟退火遗传算法优化的BP网络在质量预测中的应用[J].轻工机械，2011（4）：26?31.

[13] 师彪，李郁侠，于新花，等.改进粒子群?BP神经网络模型的短期电力负荷预测[J].计算机应用，2009（4）：1036?1039.

bp神经网络