时间:2022-05-29 17:51:52
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇神经网络原理,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
1 引言
很长时间以来,在我们生活中所接触到的大部分计算机,都是一种被称为“电脑”的冯诺依曼型计算机。这种计算机在运算等很多方面确实超越了人类大脑的水平,但是基于串行控制机构的冯诺依曼型计算机在图像处理、语音识别等方面远不如大脑的处理能力。于是,在人类对大脑的不断探索中,一种更接近人脑思维方式的神经网络计算机走进人们的视线。
2 大脑的研究
大脑活动是由大脑皮质许许多多脑神经细胞的活动构成。
神经细胞由一个细胞体、一些树突 、和轴突组成,如图1所示。神经细胞体是一颗星状球形物,里面有一个核。树突由细胞体向各个方向长出,本身可有分支,是用来接收信号的。轴突也有许多的分支。轴突通过分支的末梢和其他神经细胞的树突相接触,形成所谓的突触,一个神经细胞通过轴突和突触把产生的信号送到其他的神经细胞。每个神经细胞通过它的树突和大约10,000个其他的神经细胞相连。这就使得人脑中所有神经细胞之间连接总计可能有1,000,000,000,000,000个。
神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触,信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程,但就我们而言,重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也只有两种状态:兴奋和不兴奋。发射信号的强度不变,变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突上突触进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋状态,这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值,神经细胞就不会兴奋起来。
尽管这是类似0和1的操作方式,由于数量巨大的连接,使得大脑具备难以置信的能力。尽管每一个神经细胞仅仅工作于大约100hz的频率,但因各个神经细胞都以独立处理单元的形式并行工作着,使人类的大脑具有非常明显的特点:
1) 能实现无监督的学习。
2) 对损伤有冗余性
3) 善于归纳推广。
4) 处理信息的效率极高:神经细胞之间电-化学信号的传递,与一台数字计算机中cpu的数据传输相比,速度是非常慢的,但因神经细胞采用了并行的工作方式,使得大脑能够同时处理大量的数据。这个特点也是神经网络计算机在处理方法上最应该体现的一点。
3 人工神经网络基础
对于脑细胞的活动原理,用简单数学语言来说, 一次乘法和累加就相当于一个神经突触接受一次信息的活动。许许多多简单的乘法和累加计算, 就形成了脑细胞决定是激活状态还是抑制状态的简单数学模型。从这种模型出发, 任何复杂的大量的脑神经细胞活动与只是大量乘法、累加和判别是否达到激活值的简单运算的并行与重复而已。因此用这种大量并行的简单运算就可以来模拟大脑的活动, 这就是人工神经网络。
神经网络的基本单元是人工神经元,它是根据人脑的工作原理提出的。图2所示为一个人工神经元,可由以下方程描述
σi =wijxj + si2θi , ui = f(σi) ,yi = g(ui)
xi 为输入信号;
yi 为输出信号;
ui 为神经元的内部状态;
θi 为阈值;
si 为外部控制信号输入(控制神经元的内部状态ui ,使之保持一定的状态);
wij 为神经元的连接权值。
其中,可通过学习改变连接权wij ,使得神经元满足或接近一定的非线性输入输出关系。
4 神经网络计算机的实现
对于神经网络计算机实现,目前主要有以下三种实现途径:
4.1 用软件在通用计算机上模拟神经网络
在sisd(单指令流、单数据流,如经典个人计算机)、simd(单指令流、多数据流,如连接机制机器)或mimd(多指令流、多数据流,如在transputer网络上)结构的计算机上仿真。
这种用软件实现神经网络的方法,灵活而且不需要专用硬件,但是基于此方法实现的神经网络计算机速度较慢,一般仅适合人工神经网络的研究,另一方面,它在一定程度上使神经网络计算机失去了它的本质,体现不出并行处理信息的特征。
4.2 对神经网络进行功能上的仿真
以多个运算单元节点进行运算,在不同时间模拟各异不同的神经元,串并行地模拟神经网格计算。换句话说,即用m个物理单位去模拟n个神经元,而m<n。基于并行计算机和阵列机的神经网络虚拟实现,具有一定的通用性。 <br="">
虚拟实现的神经网络计算机主要可分为:协处理机,并行处理机阵列及现有的并行计算机等。目前已经有多种产品及系统问世,包括mark v神经计算机、gapp系统、gf11、基于transputer的系统以及基于dsp的系统。它们各有特点,技术已日益成熟。
但是这种实现方式仍以神经网络仿真为主要目标,另外其速度,容量等性能的提高则以增加处理机等费用为代价,较难成为神经网络的最终应用产品。
4.3 利用全硬件实现
4.3.1 基于cmos, ,ccd工艺和浮栅工艺的神经网络全硬件实现
在微电子芯片上作上许多具有模拟神经元功能的单元电路,按神经网络模型的拓扑结构在芯片上联成网络,这类神经网络芯片上的电路与所模拟神经网络种的各个神经元和神经突触等都有一一对应的关系,神经网络中的各个权值也都存贮在同一芯片上。
我国1995年开发的预言神一号就是一台实现了全硬件的通用神经网络处理机。它以pc机作为宿主机,通过编程实现前馈网络、反馈网络、som等人工神经网络的模型和算法,在网络运算过程中预言神一号神经计算机还具备随时修改网络参数及神经元非线性函数的功能。
但是这类芯片受硅片面积的限制,不可能制作规模庞大的神经网络硬件。如果一个数万个神经元的全联接网络,其互联线将达到10亿根;若以1微米三层金属布线工艺来计算,仅仅布线一项所占硅片面积将达到数十平方米。因此,在微电子技术基础上用这种一一对应的方式实现规模很大的神经网络显然不现实。
4.3.2 用光学或光电混合器件实现神经网络硬件系统
光学技术在许多方面有着电子技术无法比拟的优点:光具有并行性,这点与神经计算机吻合;光波的传播交叉无失真,传播容量大;可实现超高速运算。现在的神经计算机充其量也只有数百个神经,因此用“电子式”还是可能的,但是若要把一万个神经结合在一起,那么就需要一亿条导线,恐怕除光之外,任何东西都不可能完成了。但是光束本身很难表示信号的正负,通常需要双层结构,加之光学相关器件体积略大,都会使系统变得庞大与复杂。
5 小结
人工神经网络(AartificialNeuralNetwork,下简称ANN)是模拟生物神经元的结构而提出的一种信息处理方法。早在1943年,已由心理学家WarrenS.Mcculloch和数学家WalthH.Pitts提出神经元数学模型,后被冷落了一段时间,80年代又迅猛兴起[1]。ANN之所以受到人们的普遍关注,是由于它具有本质的非线形特征、并行处理能力、强鲁棒性以及自组织自学习的能力。其中研究得最为成熟的是误差的反传模型算法(BP算法,BackPropagation),它的网络结构及算法直观、简单,在工业领域中应用较多。
经训练的ANN适用于利用分析振动数据对机器进行监控和故障检测,预测某些部件的疲劳寿命[2]。非线形神经网络补偿和鲁棒控制综合方法的应用(其鲁棒控制利用了变结构控制或滑动模控制),在实时工业控制执行程序中较为有效[3]。人工神经网络(ANN)和模糊逻辑(FuzzyLogic)的综合,实现了电动机故障检测的启发式推理。对非线形问题,可通过ANN的BP算法学习正常运行例子调整内部权值来准确求解[4]。
因此,对于电力系统这个存在着大量非线性的复杂大系统来讲,ANN理论在电力系统中的应用具有很大的潜力,目前已涉及到如暂态,动稳分析,负荷预报,机组最优组合,警报处理与故障诊断,配电网线损计算,发电规划,经济运行及电力系统控制等方面[5]。
本文介绍了一种基于人工神经网络(ANN)理论的保护原理。
1、人工神经网络理论概述
BP算法是一种监控学习技巧,它通过比较输出单元的真实输出和希望值之间的差别,调整网络路径的权值,以使下一次在相同的输入下,网络的输出接近于希望值。
在神经网络投运前,就应用大量的数据,包括正常运行的、不正常运行的,作为其训练内容,以一定的输入和期望的输出通过BP算法去不断修改网络的权值。在投运后,还可根据现场的特定情况进行现场学习,以扩充ANN内存知识量。从算法原理看,并行处理能力和非线是BP算法的一大优点。
2、神经网络型继电保护
神经网络理论的保护装置,可判别更复杂的模式,其因果关系是更复杂的、非线性的、模糊的、动态的和非平稳随机的。它是神经网络(ANN)与专家系统(ES)融为一体的神经网络专家系统,其中,ANN是数值的、联想的、自组织的、仿生的方式,ES是认知的和启发式的。
文献[1]认为全波数据窗建立的神经网络在准确性方面优于利用半波数据窗建立的神经网络,因此保护应选用全波数据窗。
ANN保护装置出厂后,还可以在投运单位如网调、省调实验室内进行学习,学习内容针对该省的保护的特别要求进行(如反措)。到现场,还可根据该站的干扰情况进行反误动、反拒动学习,特别是一些常出现波形间断的变电站内的高频保护。
3、结论
本文基于现代控制技术提出了人工神经网络理论的保护构想。神经网络软件的反应速度比纯数字计算软件快几十倍以上,这样,在相同的动作时间下,可以大大提高保护运算次数,以实现在时间上即次数上提高冗余度。
一套完整的ANN保护是需要有很多输入量的,如果对某套保护来说,区内、区外故障时其输入信号几乎相同,则很难以此作为训练样本训练保护,而每套保护都增多输入量,必然会使保护、二次接线复杂化。变电站综合自动化也许是解决该问题的一个较好方法,各套保护通过总线联网,交换信息,充分利用ANN的并行处理功能,每套保护均对其它线路信息进行加工,以此综合得出动作判据。每套保护可把每次录得的数据文件,加上对其动作正确性与否的判断,作为本身的训练内容,因为即使有时人工分析也不能区分哪些数据特征能使保护不正确动作,特别是高频模拟量。
神经网络的硬件芯片现在仍很昂贵,但技术成熟时,应利用硬件实现现在的软件功能。另外,神经网络的并行处理和信息分布存储机制还不十分清楚,如何选择的网络结构还没有充分的理论依据。所有这些都有待于对神经网络基本理论进行深入的研究,以形成完善的理论体系,创造出更适合于实际应用的新型网络及学习算法[5]。
参考文献
1、陈炳华。采用模式识别(智能型)的保护装置的设想。中国电机工程学会第五届全国继电保护学术会议,[会址不详],1993
2、RobertE.Uhrig.ApplicationofArtificialNeuralNetworksinIndustrialTechnology.IEEETrans,1994,10(3)。(1):371~377
3、LeeTH,WangQC,TanWK.AFrameworkforRobustNeuralNetwork-BasedControlofNonlinearServomechannisms.IEEETrans,1993,3(2)。(3):190~197
中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)11-2599-05
License Plate Recognition Based on Synergetic Neural Network
ZHANG Mei-jing
(Fujian Jiangxia College,Fuzhou 350108,China)
Abstract: Feature losses and noise are major barriers for license plate recognition. Because of outstanding properties in association and rec? ognition, Synergetic Neural Network is used to process the binary character image to regain the legibility and completion. According to the result of experiment, Synergetic Neural Network is proofed to be an excellent algorithm in Recognition.
Key words:synergetic neural network;license plate recognition;character recognition
字符识别属于模式识别领域的重要组成部分,是文字自动输入的一种方法。它通过扫描和摄像等输入方式获取媒介上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出字符的标准编码,并按指定格式存储在文该文件。字符识别的过程如图1。
1车牌字符识别原理
车牌字符识别是字符识别技术的一个分支,是智能交通系统的重要组成部分。车牌字符识别的任务是将车牌图片上的7个由汉字,数字和大些英文字符组合而成的字符图片识别成字符,相关字符如图2。[1](a)汉字样本(b)字母样本(c)数字样本
图2车牌字符样本
车牌字符识根据识别对象分类属于有限样本的印刷体脱机字符识别,常用的方法有模板匹配字符识别法,人工神经网络字符识别和特征统计匹配法等。[2]模板匹配字符识别算法是将待识别字符与系统中已收录的标准字符样本进行像素级别的逐一匹配,通过匹配度的高低判定待识别样本。字符特征识别对待识别字符进行字符布局,结构,笔划等特征进行分析,通过特征的分析结果与系统字符库中的样本进行比对,得出识别结果。人工神经网络以人脑识别物体的原理为依据,构建一个与人脑识别过程相似的网络系统。该网络经过训练后对各字符样本的特征极为敏感,能够对待识别对象在较短时间能做出判断,得出识别结果。
在实际应用中,车牌识别算法远达不到理想状态下的性能,单独采用上述算法中的任何一种均难以取得较好的效果,个别情况乃至各种技术的组合都难以奏效。车牌识别率不高的主要原因是有效信息不足或缺失和噪声太大等失真,原因包括由天气、光线、背景环境、摄取角度、车牌污损等,图像在采集过程中存在不同程度的信息损失和图像变形;个别字符间的高相似度严重使得样本特征不易提取和区分;图像预处理导致的图像有效信息弱化,乃至消失等,如图3。因此,如何保证待识别图像信息的完整性是高效识别字符的关键。
2协同神经网络
20世纪70年代,德国科学家H.Haken教授在斯图加特大学冬季学期演讲中首次引入协同学(Synergetic)的概念。20世纪80年代末,协同学原理被引入计算机科学和认知科学,基于协同学的神经网络正式提出。[3]
2.1协同神经网络原理
协同神经网络(Synergetic Nerural Network, SNN)是一种竞争性网络。根据协同学将模式识别过程与模式形成过程视为同一过程的原理[3],系统将根据待识别对象q和样本构造一系列的序参量,让序参量在一个动力学过程中进行竞争,最终取胜的序参量将驱使整个系统进入一个特定的有序状态,使得q从中间状态进入某个原型模式止中,完成整个系统的宏观质变。整个过程可描述为q(0) q(t) vk。忽略涨落力( )F t和暂态量,势函数表达式如式(1), l为注意参数,其值为正数时可q指数增长;kv为原型模式向量,满足归一化和零均值条件,即式(3)和式(4); x,用于描述q在最小二乘意义下kv上的投影,即可把q分解为原型向量kv和剩余向量w,如式(5)
2.2协同神经网络的构建
根据上述协同神经网路的原理,构造Haken网络结构,将序参量的动力学方程离散化为式(12)=,离散系统神经网络的稳定性主要取决于r的大小。通过上述处理,Haken网络转化为三层前向网络的形式,如图4所示。图4协同神经网络结构
设原型模式数为M,状态向量与特征向量的维数为N,为满足原型模式之间线性无关条件,MN£,则网络输入层的神经元数为N,输出层的神经元个数为N,中间层的神经元个数为M。从网络的输入单元j到中间层k的连接权值,为伴随向量kjv+,该伴随向量kjv+通过网络的训练获得;中间层k到输出层单元l的连接权值,为原型向量lk v,通过网络的训练获得[4]。
协同神经网络的运行过程分为两个阶段:首先是网络学习阶段,然后是网络识别阶段,其运行步骤包括以下八步:
1)网络学习阶段
①选择网络的训练模式,将训练模式向量化;
②计算出满足归一化和零均值条件的原型模式向量kv,即网络中间层到输出层的连接权值;
③求出原型向量kv的伴随向量kv+,并存储伴随向量矩阵,从而获得网络输入层到中间层的连接权;
2)网络识别阶段
④网络输入层读入待识别模式的特征向量(0)q,输入模式的特征向量(0)q满足归一化和零均值条件;
⑤输入层模式特征向量(0)q与网络权值相乘,即(0)(0)
3识别实验
我国现行的02式车牌字库样本包含40个汉字,26个大写英文字母和10个数字,总共76个,样本如图5所示。相对于数字和字母而言,汉字结构比较复杂,以脱机方式识别难度较大,且识别原理相同,故以34个省、自治区、直辖市简称的字符为识别样本进行实验,实验的软件平台采用Matlab2009a,实验结果将分别与BP神经网络(BPNN)和Hopfield神经网络(HNN)的识别效果进行比较。=,1B C==;求得各序参量初值ξ(0)如下:
-0.06867057433020530.01568406876894620.05013376633354150.0631045313417070-0.0274198021611342 0.03373680640883180.1625299254749570.03986166655208920.06608181151017900.0593773160644256 0.0189960079554657-0.03124887237908740.0252495395456835-0.1715844592494780.0661238836233446 0.0681958334905401-0.09422390281760170.137104511398972-0.0371544780361387-0.0206758647343073 0.0204453344805276-0.07415745082880180.335697288112717-0.0827516059489237 0.0749152803026763 0.03887147948484890.149771923460272-0.06972351567272020.09636195429090890.0897441258906458-0.109678771470029-0.1227450763021440.119589618251446-0.0596355107322448
3.1信息缺失字符的识别实验
信息缺失是干扰识别效果的极为重要的因素,主要表现为字符不完整,多数由于图像采集和字符分割预处理过程所导致的,如图6。该待识别样本由于车牌的倾斜校正处理使得走字底部分造成残缺。经过约110轮的迭代,获胜模式为“辽”,识别所需时间为0.036287秒,迭代过程如表1,图7显示了竞争过程中各序参量的变化,识别结果图8,各神经网络的识别结果及开销对对比如表2。
3.2噪声干扰字符的识别实验
噪声干扰也是图像识别中主要的干扰因素,主要源于图像采集和二值化预处理过程,如图9,该字符由于车牌污损导致字符布满噪声。经过约96轮的迭代,获胜模式为“浙”,识别所需时间为0.035126秒,迭代过程如表3,图10显示了竞争过程中各序参量的变化,识别结果图11,各神经网络的识别结果及开销对比如表4。
结果表明,协同神经网络识别效果最好,与原型模式完全一致;Hopfield神经网络虽也识别,但识别结果存在少许失真;BP神经网络则识别错误。在时间开销方面,协同神经网络需要迭代的次数较多,但用时最短,Hopfield神经网络迭代的次数较少,但用时较多。
经过对400个车牌样本的识别,识别结果的统计如表5,各项数据充分表明了协同神经网络优异的识别性能。
表5 400图片测试结果对比
4结束语
协同神经网络是协同学在模式识别方面的重要应用,该文介绍了协同神经网络的原理,以Matlab为平台实现了网络模型,并以车牌汉字为例进行实验。大量的实验结果表明,Haken协同神经网络比BP神经网络和Hopfield神经网络具有更好的识别效果,充分表明了协同神经网络在字符识别方面的有效性。但是,实验结果也表明,经典的Haken神经网络对于外形酷似的字符,如字符“0”与字符“O”、字符“O”与字符“Q”等,仍不能进行有效精确识别,有待进一步的挖掘和提高。
参考文献:
[1]公安部.GA36-2007,中华人民共和国公共安全行业标准—中华人民共和国机动车号牌[S],2007.
[2]刘静.几种车牌字符识别算法的比较[J].电脑与电信,2008(8):72-73.
【关键词】BP神经网络;函数逼近
1.绪论
人工神经网络(artificial neural network,ANN)是模仿生物神经网络功能的一种经验模型。生物神经元受到传入的刺激,其反应又从输出端传到相联的其它神经元,输入和输出之间的变换关系一般是非线性的。
1.1 BP神经网络定义
BP (Back Propagation)神经网络是一种神经网络学习算法。相邻层之间各神经元进行全连接,而每层各神经元之间无连接,网络按有教师示教的方式进行学习,当一对学习模式提供给网络后,各神经元获得网络的输入响应产生连接权值(Weight)。此过程反复交替进行,直至网络的全局误差趋向给定的极小值,即完成学习的过程。
1.2 BP神经网络模型及其基本原理
网络的输入层模拟的是神经系统中的感觉神经元,它接收输入样本信号。输入信号经输入层输入, 通过隐含层的复杂计算由输出层输出,输出信号与期望输出相比较,若有误差,再将误差信号反向由输出层通过隐含层处理后向输入层传播。在这个过程中,误差通过梯度下降算法,分摊给各层的所有单元,从而获得各单元的误差信号,以此误差信号为依据修正各单元权值,网络权值因此被重新分布。此过程完成后, 输入信号再次由输入层输入网络,重复上述过程。这种信号正向传播与误差反向传播的各层权值调整过程周而复始地进行着,直到网络输出的误差减少到可以接受的程度,或进行到预先设定的学习次数为止。权值不断调整的过程就是网络的学习训练过程。
2.BP网络在函数逼近中的应用
2.1 基于BP神经网络逼近函数
步骤1:假设频率参数k=1,绘制要逼近的非线性函数的曲线。
步骤2:网络的建立
应用newff()函数建立BP网络结构。隐层神经元数目n可以改变,暂设为n=3,输出层有一个神经元。选择隐层和输出层神经元传递函数分别为tansig函数和purelin函数,网络训练的算法采用Levenberg Marquardt算法trainlm。
同时绘制网络输出曲线,并与原函数相比较,结果如图3.3所示。
其中 “――” 代表要逼近的非线性函数曲线;
“……” 代表未经训练的函数曲线;
因为使用newff( )函数建立函数网络时,权值和阈值的初始化是随机的,所以网络输出结构很差,根本达不到函数逼近的目的,每次运行的结果也有时不同。
步骤3:网络训练
应用train()函数对网络进行训练之前,需要预先设置网络训练参数。训练后得到的误差变化过程如图2.1所示。
步骤4: 网络测试
对于训练好的网络进行仿真:
其中 “――” 代表要逼近的非线性函数曲线;
“” 代表未经训练的函数曲线;
“” 代表经过训练的函数曲线;
从图中可以看出,得到的曲线和原始的非线性函数曲线很接近。这说明经过训练后,BP网络对非线性函数的逼近效果比较好。
3.结束语
神经网络在近几年的不断发展,在人工智能、自动控制、计算机科学、信息处理、机器人、模式识别等众多方面都取得了不错的成绩,给人们带来了很多应用上的方便,和一些解决问题的方法,期待神经网络可以应在在更多的领域,为人类做出更大的贡献。
参考文献:
[1] 刘焕海,汪禹.《计算机光盘软件与应用》. 北京: 高等教育出版社,2011.10:15-30.
关键词:气体传感器阵列;人工神经网络;信号预处理;BP算法
中图分类号:TP183 文献标识码:B
文章编号:1004-373X(2008)10-187-03オ
Application of Artificial Neural Network in Gas Analysis System
HE Bo,WANG Wuyi,ZHANG Jiatian
(Education Department Key Laboratory of Photoelectric Oil and Gas Logging & Detecting,Xi′an Shiyou University,Xi′an,710065,China)オ
Abstract:In order to study the application of artificial neural network in gas analysis system,the article chooses gas sensor array and network model training samples to identify CH4 and CO,signal preprocessing algorithms is determined in the experiment.The experiment also chooses appropriate network model and creative improves BP algorithm for gas identification.The article researches the influence on gas analysis system of structure and parameters of feed forward neural network,result indicates that the method based on the combine gas sensor array with BP nervous network to analyze gas component is feasible.If further adjusting and improving hardware measurement circuit of gas sensor array,the multi-gas analysis system,which is applied in reality complex environment can be developed.
Keywords:gas sensor array;artificial neural network;signal preprocessing;BP algorithmオ
目前,煤矿生产过程中释放的大量的CH4(甲烷)及CO(一氧化碳)等易燃易爆气体极大的威胁了生产过程的安全性,发生事故时会造成巨大的经济损失,特大事故甚至危及矿工的生命[1]。所以对煤矿井下CH4(甲烷)及CO(一氧化碳)等易燃易爆气体进行快速准确的检测显得尤其重要。同时多组份气体的定性、定量检测在环境保护、食品保鲜、航空航天等领域也有着广泛的应用。使用气体传感器构成的气体分析仪进行多组份气体的定性定量测量,具有成本低,测量周期短,并可实现在线实时测量等优点。但是由于气体传感器普遍存在着交叉敏感特性和选择性差等缺点,使用单一传感器很难实现多组份气体的检测分析。目前较有效的方法是通过多个敏感程度不同的气体传感器组成传感器阵列,结合人工神经网络算法进行多气体的分析。本文主要介绍一种基于气体传感器阵列[2]和采用BP算法[3]进行训练的神经网络进行混合气体的种类识别。
1 人工神经网络模型的选取
人工神经网络是新兴交叉学科,也是国际上研究异常活跃的领域之一。神经网络模型有BP模型、Hopfield模型、Hamming模型等,都是基于连接学说构造的智能仿生模型。他是由大量神经元组成的非线性动力系统,具有非线性、非区域性、非定长性和非凸性等特点。
BP神经网络模型是人工神经网络的重要模型之一[4]。通常BP算法是通过一些学习规则来调整神经元之间的连接权值,具有初步的自适应与自组织能力,具有学习功能。BP学习算法(反向传播学习算法)具有思路清晰、结构严谨、工作状态稳定、可操作性强的特点。BP神经网络由具有多个节点的输入层、隐含层和多个或1个输出的输出层组成,每个节点为1个单独的神经元,相邻两层间单向连接,图1为BP神经网络模型的原理框图。
图1 BP神经网络模型原理框图
2 实验原理及传感器阵列的选取
2.1 实验原理
本实验的原理是将被测气体按所需测量精度和浓度成分分成不同的等级,采用标准气体配置这些等级的不同成分的所有组合作为标准模态训练神经网络。通过识别某一未知气体样本的模式,即可以得到未知气体的成分浓度。
2.2 传感器阵列及样本的选取
在实验中为了检测CH4和CO两种气体的混合气体,选用4个半导体气体传感器构成阵列,型号分别为:QM-N7II,QM-H1,QM-N5,QM-N8型。这4个气体传感器都是金属氧化物N型半导体气敏元件,他们对CH4 ,CO的灵敏度各不相同。当与还原性气体CH4 ,CO接触时,其电导率随气体浓度的增加而迅速升高。根据数据分析的需要测试CH4,CO分别在100,200,300,400,500,600,700,800,900,1 000 ppm (1 ppm=10-6)浓度时传感器阵列的响应,从而获得了20个样本对。
3 实验分析
将实验中测得的气体样本一分为二,10组用于训练,10组用于预测。过程为先将CH4,CO分别在100,300,500,700,900 ppm的共10组样本进行预处理,输入前馈神经网络,期望输出[1,0],[0,1]分别对应CH4,CO二种气体。当网络收敛到规定的误差指标时,停止训练,固定网络连接权值和节点阀值;然后将CH4,CO分别在200,400,600,800,1 000 ppm的共10组样本进行预处理,输入上述经过训练的网络,从而得到预测结果。对于分类器,预测值>0.7视为1;预测值<0.3视为0;预测值在(0.3,0.7)之间视为预测出错。同时通过分析确定了信号预处理算法和不同网络结构参数对系统输出的影响。
3.1 信号预处理算法
为了提高检测系统的分类辨识效果,必须对传感器阵列的输出信号进行预处理,以消除或降低气体浓度对传感器输出的影响。传感器信号预处理算法直接影响着检测系统的工作特性,应该合理选择。假设传感器阵列对空气的电导用Gair=[Gair,1,Gair,2,…,Gair,4],对混合气的电导用Ggas=[Ggas,1,Gair,2,…,Ggas,4]В阵列中4个传感器与CH4,CO作用时其电导将增加,则通常采用阵列归一化算法:[HT5]
Иxgas,i=Ggas,i/Gair,i1n∑ni=1Ggas,iGair,i21/2(1)И
其中n=4为阵列中传感器总数。经过式(1)处理后的阵列响应Xgas=[xgas,1,…,xgas,4]ё魑人工神经网络系统的实际输入,气体传感器阵列归一化响应数据如表1[5]所示。
阵列归一化算法的预测结果如下表2[5]所示。
3.2 改进的BP算法
由于BP算法是一种基于梯度下降优化方法的学习算法,因而不可避免地存在可能收敛到局部极小的问题,另外传统BP算法采用固定的学习率和使用Sigmoid函数为作用函数,从而导致网络的训练速度和精度不高。由于传感器物理特性造成的误差难以避免,可采用样本筛选的方法,对原始样本中偏差较大的删除或作调整,达到精简优化样本质量的效果。但这样的效果不是很明显,为此本文从训练算法入手,对传统BP算法进行一些改进[6]:
(1) 采用变步长机制:在误差变化剧烈的地方,适当减少步长以保证其精确性;而在误差变化平缓的地方,适当加大步长以加快收敛速度。
(2) 引入动量因子Е联:其原理类似共轭梯度法,目的在于加入一项以记忆上一时刻权的修改方向,而此时刻的修改方向则为上一时刻修改方向与此刻方向的组合。他能有效加速收敛、防止振荡。
(3) 加入Еpiб蜃樱在一定程度上改变到达平坦区的误差函数,使误差变化迅速退出不灵敏区,而得到收敛。
表1 气体传感器阵列归一化响应数据
故连接权值公式修改为:
ИWsq(t+1)=Wsq(t)+η(t)δqys+αΔWsq(t)(2)И
其中,Е俏增益项;δq为误差项;ys为节点的输出。令sq为ij或jk,而i,j,kХ直鹞从输入到输出的对应各层节点。相应的误差项为:
隐含层-输出层:
ИЕpjk=(tpk-ypk)ypk(1-ypk)γpk(3)И
输入层-隐含层:
ИЕpij=∑n-1k=0δpjkWjkxpj(1-xpj)γpj(4)И
当ЕE总0时,有η(t+1)=η(t)•β,α=0。其中,φ>1,β
ΔE(t)=E(t)-E(t-1)。
当遇到局部最小而不能收敛时,可以通过调节γpk和γpj来克服,即将γpk和γpj分别调节到大于1。И
3.3 神经网络结构参数的比较
前馈神经网络中隐含层数目、隐含层神经元数目(本文中采用4∶4∶2结构)也是影响系统性能的可能因素,因此优化选择神经网络的结构和参数是系统设计中的另一个重要步骤。为了比较神经网络结构参数对系统性能的影响,将预处理算法固定为阵列归一化算法,同样网络的初始连接权值和节点阀值也不变,只改变网络的隐含层数目和隐含层神经元数个数[6,8]。
结果发现,对于本文的实际问题,采用单隐含层的神经网络和多隐含层神经网络都可以完成辨识任务,不同仅在于:单隐含层神经网络的训练时间明显低于多隐含层神经网络训练时间。对于单隐含层神经网络,隐含层神经元数目只要介于3~12之间,预测结果无明显变化,所以本文的神经网络结构和参数完全可以满足设计要求。
4 结 语
通过以上实验可知,应用气体传感器阵列与BP算法训练的人工神经网络模型相结合进行多种气体成分分析具有很好的效果,如果能够进一步调整和完善气体传感器阵列的硬件测量电路,则可开发出用于现实复杂环境的多气体分析系统。
参 考 文 献
[1]张延松.煤矿井下有害气体的危害及预防[J].安全,1996(2):14-16.
[2]曲建岭,王磊.基于前馈神经网络的人工嗅觉系统[J].西北工业大学学报,1999(增刊):124-128.
[3]罗发龙,李衍达.神经网络信号处理[M].北京:电子工业出版社,1993.
[4]焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1990.
[5]闻新,周露,力,等.Matlab神经网络应用设计[M].北京:科学出版社,2000.
[6]王永骥,徐建.神经元网络控制[M].北京:机械工业出版社,1998.
[7]杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001.
[8]沈清,胡德文,时春.神经网络应用技术[M].长沙:国防工业出版社,1993.
[9]Huyberechts G.Simultaneous Quantification of Carbon Mono-xide and Methane in Humid Air Using a Sensor Array and an Artificial Neural Network.Sensors and Actuators BP,1997,45:123-130.
关键词:神经网络 心理障碍 专家系统
中图分类号:G64 文献标识码:A 文章编号:1007-9416(2012)02-0174-02
人工神经网络技术的兴起为知识获取开辟了一条新途径。它通过模拟人脑的神经网络结构形式,建立各种网络模型,进行信息处理达到解决问题的目的。如BP网络模型就能通过大量的训练例子,经过学习获取知识[1]。
目前高校在大学生心理健康教育领域只是通过学校的心理辅导老师或医院的心理学专家给予咨询指导,但是由于经验水平不一,层次不同,达不到预期的效果。而利用神经网络专家系统能够进行复杂的模式识别和完成规则复杂、无法预先确定化的任务。文章试图借助神经网络专家系统全面综合国内外心理学专家的经验,全方面检测大学生心理状况并及时给出诊断方案。
1、人工神经网络的基本思想
人工神经网络(Artificial Neural Networks,简记作ANN),是对人类大脑系统的一阶特性的一种描述[1]。简单地讲,它是一个数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法[1]。人工神经网络的功能特性由其连接的拓扑结构和突触连接强度,即连接权值决定。神经网络全体连接权值的可用一个矩阵W表示,它的整体反映了神经网络对于所解决问题的知识存储。神经网络能够通过对样本的学习训练,不断改变网络的连接权值以及拓扑结构以使网络的输出不断地接近期望的输出。这一过程称为神经网络的学习或训练,其本质是可变权值的动态调整。神经网络的学习方式是决定神经网络信息处理性能的第三大要素,因此有关学习的研究在神经网络研究中具有重要地位。改变权值的规则称为学习规则或学习算法,在单个处理单元集体进行权值调整时,网络就呈现出“智能”特性,其中有意义的信息就分布地存储在调节后的权值矩阵中。
2、BP神经网络模型的原理和结构
BP(Back Propagation)神经网络是由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一[3]。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图1所示)。
Fig1 BP Neural Network Structure
BP网络的原理是把一个输入矢量经过隐层变换成输出矢量,实现从输入空间到输出空间的映射。由权重实现正向映射,利用当前权重作用下网络的输出与希望实现的映射要求的期望输出进行比较来学习的。但要深入了解我们就先要了解一下BP网络学习算法――反传学习算法(即BP算法)。对于输入信号,要先向前传播到隐层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S型函数,如,式中Q为调整激励函数形式的Sigmoid参数。该算法的学习过程由正向传播和反向传播组成。正向传播时,传播方向为输入层隐层输出层,每层神经元的状态只影响下一层神经元。若在输出层得不到期望的输出,则转向误差信号的反向传播流程,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。BP模型把一组样本的I/O问题变为一个非线性优化问题,它使用的是优化中最普通的梯度下降法。
3、大学生心理障碍诊断专家系统
有关研究和统计结果表明,大学生在心理上的确存在着一系列的不良反应和适应障碍,有的甚至到了极为严重的程度,因心理疾病而休学、退学甚至伤人、自杀的比率近几年呈上升趋势。心理疾病主要是由心理因素造成的。对此,我们设计此诊断专家系统,使大学生可以及时了解自己心理健康状态,为大学生心理健康成长提供有力帮助[4]。
鉴于篇幅原因,以从五个特征识别大学生常见心理疾病为例,说明模型服务的开发过程。输入的五个特征包括:行为举止、情绪状态、饮食睡眠、性格特征、躯体疾病,选择大学生常见的四种心理疾病作为训练,构造心理疾病识别神经网络。在实际中的心理疾病的特征要复杂庞大的多,且各个特征间也多有重叠交互,在此仅提供选取五个鲜明共性,构造神经网络识别训练集,如表1所示。
该样本设计成如图2所示的神经网络。网络输入层的神经元个数为5个,输出层的神经元个数为4个,隐层的神经元个数为5个。
Fig.2 Neural Network of Psychological barrier distinguishing
进行神经元网络计算,需要把文字概念转换为数值。为了便于数据的判别,用六维向量值表示各个特征,其中前三位表示类别,后三位表示特征,则共可以容纳26=64种特征。表1的内容经过文字到数值的转换后的结果见表2。
经过改进的BP网络后加入的动量项初始值为0.6,网络学习速率为0.43。网络训练的循环次数规定为5000,训练误差期望为0.000001。
通过该神经网络模型来完成大学生心理障碍专家诊断系统。对该神经网络进行训练后,输入四组数据见表3:
下表为量化后的实例表4:
表4 量化后的数据表
Table4 After the quantitative data table
运行客户端程序,得到结果报表。所得到报表包含以下内容:
(1)完成文字到数值转换后的输入参数;
(2)神经网络的计算输出值;
(3)根据输出数值得到的结论。得到以下推理结果如图3所示:
Fig.3 Result of college student Psychological barrier Expert System
从计算结果中可以看出神经网络的容错效果很好,对第二例,对焦虑症缺省缺乏自信、孤独内向条件时,输出结果是焦虑症(0.9122);对第三例,输入神经衰弱和焦虑症的共同信息时,神经网络输出既靠近神经衰弱(0.8761),又靠近焦虑症(0.8429),输出结论:该症状是介于神经衰弱症和焦虑症的中间种类,不能被明确识别,神经网络需要进一步训练、学习。
4、结语
神经网络来源于研究者对真实神经元网络运算能力的模拟,在发展过程中,逐渐显示出学习、记忆、联想等强大的功能,因此神经网络被广泛的应用到很多领域。通过对神经网络在大学生心理障碍诊断中的应用研究,实现了简单的模式识别,达到了预期诊断效果。目前该系统只是对生物神经系统的某种特定性能的简单模拟,如果进行足够的训练和学习,理论上该系统能够进行复杂的模式识别和完成规则复杂、无法预先确定化的任务。
参考文献
[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006:23-27.
[2]冯定.神经网络专家系统[M].北京:科学出版社,2006:57-61.
[3]高隽.人工神经网络原理及仿真实例(第二版)[M].北京:机械工业出版社,2007:10-11.
[4]陈青萍.现代临床心理学[M].北京:中国社会科学出版社,2004:124-130.
[5]李维,张诗忠.心理病理卷(中文版)[M].上海:上海教育出版社,2004:74-76.
关键词 压力传感器;温度漂移;温度补偿
中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2014)10-0038-02
压力传感器的输出结果精度容易受到多种因素的影响,其中,唯独是影响传感器输出精度的最主要因素。目前,国内经常使用硬件补偿和软件补偿两类方法对压力传感器进行温度补偿。硬件补偿方法调试难度较高、精度低、通用性也较差,在实际工程中应用时,难以去得较好的效果;而软件补偿方法有效弥补了硬件补偿的缺点,其中BP神经网络补偿在实际工程中运用十分广泛,但是典型BP神经网络补偿法虽然精确度高,但是整个流程过于复杂、整个过程耗时较长,因此,本文提出了一种基于主成分分析的BP神经网络补偿方法,希望对提高补偿效率和准确性起到一定的作用。
1 典型BP神经网络补偿原理分析
BP神经网络是目前研究中应用范围最广的神经网络模型之一,BP神经网络术语单向传输网络结构,整个信息传输的过程呈现出高度的非线性特点。典型的BP神经网络结构包括输入层、隐含层和输出层3层结构。通常情况下BP神经网络只有这3层结构,这主要是由于单隐层的BP神经网络既可以完成从任意n维到m维的映射。其典型结构如下图所示。
BP神经网络结构模型
BP算法设计到了信息的正向传播以及误差的反向传播,信息首先从输入层传入,然后经过隐含层的处理传入输出层,最终输出的信息可以用下面的形式进行表示:
其中:、分别代表了隐含层及输出层的权值;
n0、n1分别对应了输入节点数及隐含层节点数。
输出层神经元的激励函数f1通常呈现出线性特点;而隐含层神经元的激励函数f2通常采用如下所示的形式在(0,1)的S型函数中进行输出:
由于BP神经网络隐含层采用的传递函数为对数S型曲线,其输出范围在(0,1)之间。为了避免节点在短时间之内饱和而无法继续进行训练,需要在训练开始之前利用下面公式对样本数据进行预处理:
,
其中:Ui、Pi均为训练数据的标定值;Uimin、Uimax分别表示输出电压的标定极值(最小和最大);Pimin、Pimax分别表示压力的标定极值(最小和最大)。
当目标矢量为T,信息通过正向传递,可以得到误差函数,具体如下所示:
如果输出结果无法达到要求的误差范围,则返回误差信号并按照一定的权值对公式中的各层权值进行修正,直到输出结果达到期望值。
在利用典型BP神经网络进行压力传感器温度补偿的过程中,算法过于复杂,而且非常耗时,因此,需要对其进行改进,以提高补偿效率。
2 BP神经网络法的改进
2.1 改进原理
基于典型的BP神经网络,利用以下方法进行改进。
1)利用小波神经网络的思想对神经元的激励函数进行改进,从而实现小波特性与BP神经网络自学功能的充分结合,提高激励函数的逼近能力。以Morlet函数作为小波函数的母函数,可以降低不同层面神经元之间的影响,提高网络的收敛速度。以Morlet函数作母函数的小波函数属于幅值小波,其信号中包含了复值和相关信息,改进后的函数具体如下所示:
在本次研究中,我们选取了R个输入样本和N个输出节点,则可以利用下面的公式对第l个样本的第n个节点的输入进行表示:
其中:K表示神经网络隐含层的单元数量;M表示神经网络输入层的单元数量;ωn,k表示神经网络隐含层第k单元与输出层第n单元的连接权值;ak-小波伸缩因子;bk-平移因子;Sl(xm)―输入信号。
2)在计算过程中通过,附加动量法的应用可以有效改实现梯度方向的平滑过渡,使得计算结果更具稳定性。该方法以BP法为基础对权值进行调节,具体公式如下:
其中:t表示样本的训练次数;η表示学习速率;σ表示动量因子;σΔωki(t)表示附加动量项,它能够有效降低不同神经元之间的影响,提高网络的收敛速度。
2.2 主成分BP神经网络算法的实现
步骤1:按照典型BP神经网络数据预处理方法对样本数据进行预处理。
步骤2:利用主成分分析法对预处理后的样本数据进行分析,降低输入向量之间的影响,使各个输入变量的协同方差趋于统一,从而使各权值具有相同的收敛速度,并以此确定神经网络的输入节点。
步骤3:对神经网络进行初始化,并对其中的部分关键变量进行设置。
步骤4:为神经网络选取一组学习样本,以输入节点作为网络的输入向量,并输入期望fn,l,n=1,2,…,N;l=1,2,…,R。
步骤5:利用输入的网络参数计算网络的实时输出能力,当输出误差在允许范围之内时,停止训练;而当输出误差超过允许范围 ,则将误差信息进行反向传播,使权值沿误差函数的负梯度方向发生变化,然后利用梯度下降法计算出变化后的网络参数,然后再重复进行第4步的操作。
步骤6:BP神经网络在训练合格之后,对其进行样本补偿。
步骤7:对补偿后的样本进行反标准化处理,然后与实测数据进行误差比较,判断出网络改进之后的变化。
2.3 压力传感器温度补偿
根据前文提供的BP神经网络算法实现步骤,可以利用Matlab编程语言来实现。在实现该算法之后,我们通过在压力传感器量程范围内确定n个压力标定点,同时确定m个温度标定点。标准值发生器会根据每个标定点的信息产生对应的标定输入值。然后输入样本数据,样本数据按照目标值要求的±20%范围进行选择,然后以误差目标小于10-3进行训练,当达到误差目标之后,网络的收敛速度得到有效的提升。
3 结论
通过研究结果发现,利用主成分分析法对信息进行补偿之后,再利用BP神经网络对这些信息进行训练,其学习速度相对直接利用BP神经网络进行训练更高。同时,通过改进典型的BP神经网络,利用小波函数作为激励函数,并应用动量附加发对网络敏感性进行控制,可以有效避免网络发生局部极小问题。通过基于主成分的BP神经网络温度补偿方法可以使压力传感器受环境温度变化而发生的误差问题得到高效、精确的解决。
参考文献
关键词:模拟电路;故障诊断;模糊数学;bp网络;模糊bp网络
0引言
电路故障是指在规定的条件下,电路工作时它的一个或几个性能参数不能保持在要求的上、下限之间,其结构、组件、元器件等出现性能减退、老化、破损、断裂、击穿等现象,丧失了在规定条件和环境下完成所需功能的能力。
长期以来,学界对模拟电路工作特点的研究已相当深入,但对于故障诊断方法的研究却困难较大,这是由于模拟电路本身的特性决定的:1)输入激励和输出响应都是连续量,模拟电路中的故障模型复杂,量化难度大;2)模拟电路信号量程宽,不管电压、电流的量程还是频率都可达十几个数量级,测量难度大;3)模拟电路中的元器件参数具有容差,导致电路的故障状态的模糊性,而无法准确定位;4)模拟电路中存在广泛的反馈回路和非线性问题,使计算的难度更加复杂。因此,学界提出了许多模型和方法来完成对某些符合特定条件的模拟电路的故障诊断。其中神经网络法的使用就相当普遍,在硬和软故障诊断中都有应用,因为神经网络的技术优势针对模拟电路故障诊断有较好的适用性,这主要体现在:1)神经网络的大规模并行处理特点,大大提高了诊断效率;2)自适应与自组织能力使神经网络在学习和训练中改变权重值,发展出新的功能。同时,模糊数学也与神经网络相结合,这是利用了模糊数学对待诊断模拟元器件的故障不确定性进行量化处理,能够有效克服模拟电路元器件因为容差、非线性及噪声造成的电路参数模糊性。
本文的研究目的就是分别利用单纯bp神经网络和模糊bp神经网络的方法建立模拟电路故障诊断模型,利用电路仿真收集电路不同工作状态下的关键点电压,代入诊断模型并得到诊断结果。根据各网络的结果分析比较各诊断模型的优缺点,找出模糊数学对改进模拟电路故障诊断模型的具体表现。
1模糊神经网络的故障诊断模型
1.1典型模糊神经网络诊断模型介绍
图1显示的是一个典型的模糊神经网络模型,该模型由原始知识获取(fundamental knowledge acquire,fka)、特征参数处理(characteristic parameter produce,cdp)、知识提取(knowledge extracted,ke)、经验知识库(experience knowledge base,ekb)、学习样本集(learning sample set,lss)和模糊神经网络(fuzzy neural networks,fnn)共6个模块共同组成,其工作流程是:
图1 典型模糊神经网络诊断模型
1)原始知识获取模块通过对电路工作原理进行分析,模拟或仿真各类故障发生时输入和输出参数,从而获取原始知识(x,y),将其传入知识提取模块中供系统学习,所得经验集存入经验知识库中;
2)将原始知识和已经存放在经验知识库中的经验知识(初始库可为空)一起输入学习样本组织模块中,进行学习样本的构建,合成训练样本集为(x1,y1);
3)将(x1,y1)输入到模糊神经网络模块,学习训练,并在达到指定精度后停止;
4)将从模拟电路中获得的实测参数xc输入至特征参数提取模块中,完成数据分析和处理,输出特征参数数据xc';
5)将特征参数数据输入到学习收敛后的模糊神经网络中,进行诊断推理,得出诊断结果yc';
6)将得到的实测数据集(xc',yc')输入学习样本组织模块,动态增强模糊神经网络的自适应能力;
7)将得到的实测数据集(xc',yc')输入知识提取模块,进行分析和处理,如能提取出经验知识,则归入经验知识库中[1]。
1.2模糊神经网络结构
模糊神经网络的结构应该包括4层,如图2所示。
模糊层的作用是将输入量进行模糊化。每一个模糊层节点对应一个该论域中的模糊子集和隶属函数。该层接收精确数值输入,经过模糊化计算得出对应的隶属度并输出。
图2 模糊神经网络结构图
输入层、隐含层和输出层共同构成一个完整的神经网络。输入层不具有运算功能,它只是将所感知的输入值精确传递到神经网络中;隐含层的作用相当于特征检测器,提取输入模式中包含的有效特征信息,使输出层所处理的模式是线性可分的,该层节点是模糊神经元,与输入层间的连接权值是随机设定的固定值;输出层节点也是模糊神经元,与隐含层之间采用全连接方式,其连接权值是可调的,作用是输出用模糊量表示的结果[2]。
1.3输入层、输出层和隐含层节点数确定
输入层的个数代表了电路故障诊断的关键测试点的个数n1,输出点为电路所具有的潜在故障模式种类数n3。
根据输入层和输出层的个数,隐含层节点数n2的确定有以下4种经验公式[3]:
(1)
(为0~10之间的常数)(2)
(为0~10之间的常数)(3)
(4)
2模糊数学和神经网络的算法介绍
2.1模糊数学和隶属度函数
模糊数学的作用是对测试点测得的电压信号进行特征提取——模糊化处理。因为在模拟电路测试中,参数值会随着故障原因的不同和故障阶段不同而发生变化,所以在进行数据处理时常用方法是使用精确事实规则。即用正态分布函数作为隶属度函数表示“大约为a”的模糊概念,此外还有如三角分布和梯形分布等[4]。在使用中,正态分布使用较多,其中的a是该测试点的理想状态工作点,b为该测试点在各种可能状态下的工作电压均方差。
2.2bp神经网络与算法
图3bp神经网络模型结构图
反向传播网络(back-propagation network,简称bp网络),是一种有隐含层的多层前馈网络。每一层均有一个或多个神经元节点,信息从输入层依次经各隐含层向输出层传递,层间的连接关系强弱由连接权值w来表征。bp算法是一种监督的学习,基本原理是梯度最速下降法,中心思想是调整权值使网络总误差最小。通过连续不断地在相对于误差函数斜率下降的方向上计算网络权值和偏差值的变化而逐渐逼近目标的。每一次权值和偏差的变化都与网络的误差的影响成正比,并以反向传播的方式传递到每一层。bp网络模型结构如图3所示。
以bp神经网络模型结构图为例进行bp算法推导,其输入为p,输入神经元有r个,隐含层内有s1个神经元,激活函数为f1,输入层内有s2个神经元,对应的激活函数为f2,输出为a,目标矢量为t。
1)隐含层输出:(i=1,2,…,s1)(5)
2)输出层输出: (k=1,2,…,s2) (6)
3)定义误差函数:(7)
4)输入层的权值变化量:(8)
其中:
同理可得:(9)
5)隐含层权值变化有: (10)
其中:
同理: (11)
bp网络经常使用的是s型的对数、正切激活函数或线性函数[5]。
3电路故障诊断算法验证
图4 共集-共射电路的直流通路图
例:如图4所示的直流通路图,电阻的标称值如图中所注。利用multism软件在直流状态下进行多次monte carlo分析仿真该电路[6],并考虑电阻的容差影响,取40个样本作为模糊神经网络的训练样本,另取5个样本为测试样本。设电阻r1~r5的容差值为-5%~5%。测试点选为a、b、c、d和e五点,所测电压值为va、vb、vc、vd和ve。
表1 部分电路实验样本原始数据
表2 测试样本原始数据
表1列举了40组电路实验样本原始数据的11组,包含了该电路在11种工作状态下的五个关键点电压值,所以n1=5,n2=11,隐含层的节点数可以依据公式2.3确定为12个,其中a为5。
表2则列举了5组测试样本的原始数据。
步骤一:数据模糊化
根据用正态分布函数作为隶属度函数表示“大约为a”模糊概念的思路,可以分别得到各测试点上电压隶属度函数的参数值。
a1=5.57、a2=4.97、a3=4.9、a4=5.7和a5=5.69以及b1=4.3729、b2=4.4817、b3=3.9091、b4=4.2870和b5=3.7944。
由各测试点的隶属度函数可得到网络的训练样本见表3。
表3 神经网络部分输入、输出训练样本
步骤二:将训练样本输入神经网络进行训练
将全部40个原始值和模糊化值的输入样本和对应的输出样本分别输入bp神经网络中进行训练。
步骤三:将测试样本输入神经网络进行检测
将全部5个原始值和模糊化值的输入样本和对应的输出样本分别输入已经训练好的bp神经网络中,输出诊断结果见表4。
表4 输出诊断结果
表4中的数据是经过故障诊断后得到的结果,在此只是各随机选用了一组数据加以比较说明。通过对故障诊断的试验观察和结果的比较可以作出以下分析。
1)模糊化数据能够有效减少神经网络的收敛次数。如在bp网络诊断中,使用模糊化数据的迭代次数由886减少到263次,收敛速度明显加快;
2)模糊化数据能够有效提高神经网络训练的效果。通过表4中数据的对比可以发现对于相同的神经网络,经过模糊化数据的训练,其准确性更高。这主要表现在电路所对应的状态结果普遍高于未经模糊化数据训练的网络得出的结果;同时,其他状态对应的机率更低,皆低于0.1,且更多值为0,说明数据模糊化能使神经网络的诊断结果更集中,正确率更高,有效性更加明显。
4结论
通过分别采用bp网络和模糊bp网络建立了电路故障诊断模型,对电路相同工作状态参数的诊断结果进行比较,得出了模糊数学对提高电路故障诊断模型精度和有效性效果明显的结论。模糊数学和神经网路理论的组合有效地提高了模拟电路故障诊断模型的收敛速度,提高了故障诊断的工作效率,还提高了诊断的准确性,有效性得到了充分显示。
参考文献:
[1] 吕律,魏蛟龙.基于模糊神经网络的板级电路故障诊断研究[j].计算机与数字工程,2003(3):21-23.
[2] 李国勇.智能预测控制及其matlab实现[m].北京:电子工业出版社,2010.
[3] matlab中文论坛.matlab神经网络30个案例分析[m].北京:北京航空航天大学出版社,2010.
[4] 朱大奇.电子设备故障诊断原理与实践[m].北京:电子工业出版社,2004.
【关键词】脑卒中瘫痪;神经网络重建;护理
The effect and nursing of treatment for stroke and paralysis
Huang Jia-ming(people's hospital in Sichuan Neural Medicine,Leshan 614000,China)
【Abstract】Objective:Discuss the function of neural network reconstruction for the paralysis that it is caused by stroke.Method:For the patients of stroke and paralysis, on the basis of the same routine treatment and according to the principle of randomized,we divided these patients into control and test group. Use the neural network reconstruction to train the paralysis of limbs of test group, and use the acupuncture to train the paralysis of limbs of control group. Results:The treatment of test group is better than control group obviously. Conclusion:It is a good treatment for stroked patients that the application of neural network reconstruction. So,it can apply clinical.
【Keywords】Stroke paralysis;Neural network;Nursing
脑卒中所致的肢体瘫痪是脑血管疾病常见的后遗症,采用何种物理治疗方法促进瘫痪肢体功能的恢复,更好地提高患者的生活质量,目前方法很多,疗效报道不一。为进一步了解该类物理治疗的效果,2006年11月至2007年11月,对脑卒中引起的瘫痪,分别采用神经网络治疗与针炙治疗,并对两种方法治疗的效果进行比较,得出:神经网络重建对此类疾病的治疗较针灸治疗有明显的优势,是一种不可缺少的康复治疗手段,值得推广。
1 对象与方法
1.1 对象:2006年11月至2007年11月对住入我院神经内科的脑卒中并肢体瘫痪的263例病人,在进行脑出血或脑梗死塞基础治疗上,采取抛硬币法,随机分成神经网络治疗组及针炙组;脑溢血病人在入院后一周且神志清楚者,脑梗塞在入院后第二天且神志清楚者,分别开始神经网络重建(实验组)或针灸的康复治疗组(对照组)。实验组135例,其中男性69例,女性66例;年龄56±8岁;诊断:脑出血57例,脑梗塞58例;脑卒中合并高血压、糖尿病、各种感染共计10例。对照组128例:其中男性60例,女性68例;年龄60±9岁;诊断脑出血55例,脑梗塞68例,脑卒中合并高血压、糖尿病、各种感染共计15例。两组病人在性别、年龄、病种,出血部位/梗塞部位、治疗疗程方面P>0.05均无统计学意义,具有可比性。
1.2 方法
1.2.1 肌力测定 对入组病人由神经专科医生采用徒手肌力测定法,收集入院时的肌力;随着治疗的进展,每天观察、检查病人肌力变化,并在出院时再测得病人的肌力,将病人入院与出院时肌力变化进行自身对照,得出观察效果。
1.2.2 两组病人的治疗 对出血性脑卒中的患者均采用稳定血压、降颅压、脑保护剂治疗,并根据不同情况给予抗感染、镇静、纠正水、电解质紊乱等合并症治疗。对缺血性脑卒中均采用抗血小板凝集、钙离子拮抗剂、抗自由基、营养支持,并根据合并症不同而采取抗感染、降血压、降血糖等治疗。两组病人在以上基础治疗相同的情况下,实验组使用神经网络重建仪进行康复训练,对照组使用针灸治疗进行康复训练。频率:QD,40分钟/次,一周五次,休息两天再进行,持续整个住院过程。
1.2.3 疗效判定 以出院时病人肌力的恢复情况进行判定,①显效:A:肌力恢复正常者;B:肌力较入院时提高2级以上肌力。②有效:肌力较入院时提高1级肌力。③无效:肌力无变化。
1.3 统计学方法:数据用均数±标准差(X±S)表示,两组间比较用x2检验。
2 结果
2.1 神网组与针炙组比较,两种方法有效率经四格表资料的x2检验x225,P<0.05具有统计学差异
2.2 对入院时瘫痪肢体肌力<3级的病例,再作两组病例的显效率比较,x215.77, P<0.005 显示神经网络治疗组对入院时瘫痪肢体肌力<3级者,效果更好于针炙治疗。
3 讨论
3.1 神经网络重建对瘫痪肢体的作用:神经网络重建是一种运用肌电生物反馈介导的低频治疗方法,其治疗原理是:当来自患者肌肉自主收缩产生的微弱的肌电信号达到或超过某一设定阈值时,可立即转化为多种可视可听的感官信号,并同步启动神经肌肉电刺激,使患者肌肉进一步收缩,它涉及到重复训练与感觉运动整合,既可产生有随意运动诱发的模式化的、反复的被动运动,又可加强本体感觉的生物反馈,有助于运动皮质功能的重组[1]。对于失神经支配的肌肉进行电刺激,引起肌肉节律性收缩,可以促进血液循环,延缓肌肉萎缩,增强肌力。本资料表明,神经网络治疗较传统的针炙治疗:对病人无创、无病苦,两种治疗无论是在有效率,还是显效率上均具有统计学差异。当病人肌力<3级时,更应首选神经网络重建为瘫痪肢体早期的被动运动,以有效地防止肌萎缩的发生,本组资料中经神经网络治疗的病人,未发生肌萎缩,值得推广。
3.2 护理:神经网络重建是通过病人意识能力,实现大脑皮层重建神经网络的,所以护理人员在操作前、中、后都应密切重视病人的反应,了解病人的心理状况,讲解神经网络重建仪的治疗原理,正确指导病人及家属配合仪器进行运动,集中病人注意力,充分调动病人的积极性,促进病人达到越来越高的目标,尽最大努力恢复病人肢体功能,改善病人生存质量。
摘 要 遗传算法具有很强的全局搜索能力,但是容易造成未成熟的收敛,而径向基函数RBF神经网络的优势在于采用全局收敛的线性优化算法,唯一最佳逼近点唯一,二者结合的应用能弥补各自的缺陷。两种方法结合应用到核电厂安全管理评价领域,建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,对核电厂安全管理存在的风险进行评价,有助于核电厂安全管理人员及时发现风险,采取应对措施,对于降低核电厂安全管理风险,确保人民群众生命财产安全和社会环境安全都具有极其重要的现实意义。
关键词 遗传算法 神经网络 核电厂 安全管理评价
核电厂的安全管理评价是对核电厂的安全管理现状进行的评价分析。科学合理准确的评价可以对核电厂的日常安全管理提供指导,为科学的开展安全管理提升提供参考。
利用遗传算法对RBF神经网络进行优化,保证了并行处理规模较大信息的能力,发挥了概括、联想、类比、推理等综合处理数据的能力。因此常被用来处理复杂问题,并做出科学的预测。建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,既确保了对大规模数据的处理能力,又提升了安全管理评价的科学化水平,对于准确掌握核电厂安全管理现状,提升核电厂日常管理水平,有效保障企业员工的生命安全、国家财产安全和生态环境安全具有重要意义。
一、遗传算法和RBF神经网路原理
遗传算法于1975年,由美国的J.Holland教授提出。该随机化搜索方法借鉴了自然进化法则,即优胜劣汰、适者生存的遗传机制。该方法直接对结构对象进行操作;选用概率化的寻优方法,自动获取和指导优化的搜索范围。但该方法在实际应用中也存在部分局限性:因借鉴了优胜劣汰、适者生存的遗传机制,所以如果出现优势个体(局部最优解)时,就造成了过早收敛现象,也就无法搜索产生全局最优解;其次在经过多次重组演化后,容易丢失上一代的的基因片段,即同样造成无法得到全局最优值;再次传统的遗传算法通过杂交变异的手段,确定搜索空间,导致相似模式的数据种群占据优势,同样无法产生全局最优解。
RBF神经网络是一种前馈式神经网络,网络结构分为三部分:输入层、隐含层、输出层。它依据输入层少数的神经元(基础数据),利用隐含层(高效径向基函数),决定神经网络的输出层(预测数据)。隐含层(高效径向基函数),实际是通过利用高斯函数,执行固定的非线性操作指令,即将输入层(基础数据)映射到一个新的空间,通过输出层节点线性加权组合,输出形成结果。
输出函数为:
为隐含层神经元的输出, 为权值,二者的乘积累加和即为RBF神经网络的输出。输入层、隐含层相互连接,其中隐含层为一系列同一类型的径向基函数(高斯函数)[3]。RBF神经网络由高斯函数表示为:
其中,Ci代表了基函数的中心, 代表了函数的宽度参数。从上述公式中可以看出:高斯函数的径向范围与 函数的宽度参数成反比。在实际计算中,函数宽度参数 的确定一般采用自适应梯度下降法确定,而确定Ci 、 、w的取值也就确定了为隐含层神经元的输出 。
二、对RBF神经网路原理的优化
依据生物神经网络的机理建立基于RBF神经网络安全管理评价模型,通过在不同网络传递环节选取恰当的算法对模型进行优化改进,以此得到安全管理评价的优化模型。但是在应用过程中RBF神经网络关键函数基函数中心值、网络权值等难以得到最优解,因此选择遗传算法,利用其优势对神经网络模型进行优化完善。
(一)最优基函数中心值的确定
应用遗传算法进行数据编码。将学习样本进行编号:1,2,3,……,N,进而从样本中随机选择M个数据为一组中心矢量作为种群中的一个个体进行编码。如下所示,以第i个染色体为例,神经网络的m应度函数 为期望输出 和实际输出 之差的绝对值累加和的倒数:
从上一代中任意选取两个母体进行交叉以此获得两个子个体,再将两个子个体以一定的概率进行变异,染色体其他位的编号值用1,2,3,……,N,中任意值以一定的变异概率替换。将母体与子体进行比较从中选择优势个体即完成一次进化。以此方式循环迭代,直到个体达到给定最大代数或满足给定的精度,此时个体则为最优基函数中心值。
(二)最优权值w的确定
权值的优化是一个长期复杂的过程,实数编码值能够较好地反应现实情况,用一个数码代表一个染色体,一个染色体则代表一个X值;群体初始化,根据遗传算法的搜索范围将权值以 分布随机确定(-0.8,0.4,0.65,0.5);选取适应度函数,将输出样本的平方作为适应度函数:
根据遗传操作原理,采用染色体交叉变异,选择交叉的概率Pn、变异的概率Pm。
U11=(-0.8,0.4,0.65,0.5),U21=(0.3,0.7,0.6,-0.8),交叉:U21=(-0.8,0.4,0.6,0.5)变异:U22=(-0.8,0.4,0.5,0.5)
三、安全管理评价模型的建立
依据核电厂安全管理评价指标,建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型。其实现流程如图所示:
四、结语
本文建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,对核电厂安全管理存在的风险进行评价,有助于核电厂安全管理人员及时发现风险,采取应对措施,切实降低了核电厂安全管理风险,并为核电厂科学管理,安全管理提升提供参考和技术支持。
参考文献:
[1] 郭赞.基于遗传算法和RBF神经网络的铀尾矿库安全预警模型[J].绿色科技,2015.3:243-245.
[2] 魏艳强.基于RBF神经网络的公路货运量预测方法研究[J].天津理工大学学报,2008.2(1):17-20.
[3] 徐杰.基于遗传算法的RBF神经网络优化及应用[J].信息技术,2011(5):165-168.
关键词:压铸机;RBFNN;故障诊断;模糊K均值聚类算法
中图分类号:TP212文献标识码:A
文章编号:1004-373X(2009)12-179-04
Method of Control System Sensor Fault Dignosis Based on RBF Neural Network
PENG Jishen,DONG Jing
(Faculty of Electrical and Engineering Control,Liaoning Technical University,Huludao,125105,China)
Abstract:For the problems of related sensor common fault in the die casting machine real-time detection and control system,through the study of artificial neural network′s theory and methods,sensor fault diagnosis observer model of control system based on a radial basis function neural network control system RBFNN is established.The model is trained by the measured parameters of die-casting machine,adopting fuzzy K means clustering algorithm to select clustering centre,using the observer to forecast the residuals between the sensor output value and the sensor actual output value to diagnose sensor fault.The simulated results show that RBFNN observer has strong capacity of non-linear process and arbitrary function approximation,and has many advantages such as high-precision,learning time short,rapid network computing and stable performance to meet the requirements of sensor fault diagnosis.
Keywords:die casting machine;RBFNN;fault dignosis;fuzzy K means clustering algorithm
0 引 言
传感器是现行研究的压铸机实时检测与控制系统[1]的关键部件,系统利用传感器对压铸机的各重要电控参数(如:合型力、油压、压射速度、模具温度等)进行检测,并进行准确控制。这一过程中,各传感器输出信号的质量尤为重要,其优劣程度直接影响压铸机控制系统分析、处理数据的准确性,最终影响压铸件产品质量的优劣。由于大型压铸机生产环境较为恶劣,长期的高温、高压、高粉尘及来自周边器械的电磁干扰等因素的存在,不可避免地会造成传感器软硬故障的发生,有故障的传感器所发出的错误信号,会使整个压铸机控制系统分析、处理和控制功能紊乱,造成系统无法正常运行,带来无法估计的生产安全隐患及严重的后果。因此,对压铸机控制系统中传感器故障诊断方法的研究具有重要的意义。
人工神经网络[2](神经网络)是传感器故障诊断的方法之一。神经网络是有大量人工神经元相互连接而构成的网络。它以分布的方式存储信息,利用网络拓扑结构和权值分布实现非线性的映射,并利用全局并行处理实现从输入空间到输出空间的非线性信息变换。对于特定问题适当建立神经网络诊断系统,可以从其输入数据(代表故障症状)直接推出输出数据(代表故障原因),从而实现非线性信息变换。层状结构的神经网络输入层、输出层及介于二者之间的隐含层构成。依据用于输入层到输出层之间计算的传递函数不同,提出一种基于径向基函数RBF神经网络的传感器故障诊断策略[3-5]。
1 RBF神经网络的模型
径向基函数神经网络[6,7](RBFNN)是一种新型神经网络,属于多层前馈网络,即前后相连的两层之间神经元相互连接,在各神经元之间没有反馈。RBFNN的三层结构与传统的BP网络结构相同,由输入层、隐含层和输出层构成,其结构见图1。其中,用隐含层和输出层的节点计算的功能节点称计算单元。
图1 RBF神经网络结构图
RBF神经网络输入层、隐含层、输出层的节点数分别为n,m,p;设输入层的输入为X=(x1,x2,…,xj,…,xn),实际输出为Y=(y1,y2,…,yk,…,yp)。输入层节点不对输入向量做任何操作,直接传递到隐含层,实现从XFi(x)的非线性映射。隐含层节点由非负非线性高斯径向基函数构成,如式(1)所示。
Fi(x)=exp(-x-ci/2σ2i), i=1,2,…,m(1)
式中:Fi(x)为第i个隐含层节点的输出;x为n维输入向量;ci为第i个基函数的中心,与x具有相同维数的向量;σi为第i个感知的变量,它决定了该基函数围绕中心点的宽度;m为感知单元的个数(隐含层节点数)。x-ci为向量x-ci的范数,通常表示x与ci之间的距离;Fi(x)在ci处有一个惟一的最大值,随着x-ci的增大,Fi(x)迅速衰减到零。对于给定的输入,只有一小部分靠近x的中心被激活。隐含层到输出层采用从Fi(x)yk的线性映射,输出层第k个神经元网络输出见式(2):
k=∑mi=1ωikFi(x), k=1,2,…,p(2)
式中:k为输出层第k个神经元的输出;m为隐层节点数;p为输出层节点数;ωik为隐层第i个神经元与输出层第k个神经元的连接权值。
RBF网络的权值算法是单层进行的。它的工作原理采用聚类功能,由训练得到输入数据的聚类中心,通过σ值调节基函数的灵敏度,也就是 RBF曲线的宽度。虽然网络结构看上去是全连接的,实际工作时网络是局部工作的,即对输入的一组数据,网络只有一个神经元被激活,其他神经元被激活的程度可忽略。所以 RBF网络是一个局部逼近网络,这使得它的训练速度要比 BP网络快 2~3 个数量级。当确定了RBF网络的聚类中心ci、权值ωik以后,就可求出给定某一输入时,网络对应的输出值。
2 算法学习
在此采用模糊K均值聚类算法[8]来确定各基函数的中心及相应的方差,而网络权值的确用局部梯度下降法来修正,算法如下:
2.1 利用模糊K均值聚类算法确定基函数中心ci
(1) 随即选择h个样本作为ci(i=1,2,…,h)的初值,其他样本与中心ci欧氏距离远近归入没一类,从而形成h个子类ai(i=1,2,…,h);
(2) 重新计算各子类中心ci的值,ci=1si∑sik=1xk。其中,xk∈ai;si为子集ai的样本数,同时计算每个样本属于每个中心的隶属度为:
uij=min∑sij=1xj-cixk-ci, xj,xk∈ai(3)
U={uij∈[0,1]|i=1,2,…,h;j=1,2,…,s}
(3) 确定ci是否在容许的误差范围内,若是则结束,不是则根据样本的隶属度调整子类个数,转到(2)继续。
2.2 确定基函数的宽度(误差σ)
σ2=(∑sj=1uijxj-ci)∑sj=1uij(4)
式中:ai是以ci为中心的样本子集。
基函数中心和宽度参数确定后,隐含层执行的是一种固定不变的非线性变换,第i个隐节点输出定义为:
Fi(x)=exp(-x-ci2/2σ2i)∑mi=1exp(-x-ci2/2σ2i)(5)
2.3 调节隐层单元到输出单元间的连接权
网络的目标函数为:
E=12N∑NK=1[y(xk)-(xk)]2(6)
也就是总的误差函数。式中:y(xk)是相对于输入xk的实际输出;(xk)是相对于xk的期望输出;N为训练样本集中的总样本数。对于RBFNN,参数的确定应能是网络在最小二乘意义下逼近所对应的映射关系,也就是使E达到最小。因此,这里利用梯度下降法修正网络隐含层到输出层的权值ω,使目标函数达到最小。
Δωi=-ηE(xk)•(xk)郸i(7)
式中:η为学习率,取值为0~1之间的小数。根据上面式(6),式(7)最终可以确定权值ω的每步调整量:
Δωi=-ηN∑[y(xk)-(xk)]bi(xk)(8)
权值ω的修正公式为:
ωiωi+Δωi,i=1,2,…,m(9)
利用上述学习方法得到ci=8.1,σ=0.01。
3 控制系统传感器故障诊断与仿真研究
3.1 观测器模型与故障诊断
压铸机检测与控制系统中传感器主要检测的参数有合型力、油压、模具温度、压射速度,各参数随时间变化输入与输出之间存在明显的非线性关系。RBF神经网络模型具有较强的非线性处理和任意函数逼近的能力。图2为基于RBF神经网络的传感器故障诊断原理。
图2 基于RBFNN的传感器故障诊断原理图
图2中虚线框所示部分即为RBFNN观测器原理。基本思想:通过正常情况下非线性系统的实际输入和传感器的输出学习系统的特性,用已经训练好的观测器的输出于实际系统的输出做比较,将两者之差做残差,再对残差进行分析、处理,得到故障信息,并利用残差信号对传感器故障原因进行诊断[9]。
非线性系统:
y(k)=f[u(k-d),y(k-1)](10)
u(k-d)=[u(k-d),u(k-d-1),…,u(k-d-l)](11)
y(k-d)=[y(k-1),u(k-2),…,y(k-n)](12)
式中:y(k)是传感器实际输出;u(k)是系统实际输入;f(•)代表某个未知的动态系统(压铸机)的非线性关系;n,l,d分别代表系统结构的阶次和时间延迟,并且假设u(k),y(k)是可测的。
利用RBF神经网络模型的径向基函数来逼近f(•)。将函数:
X(k)=y(k)=[u(k-d),u(k-d-1),…,
u(k-d-l),y(k-1),y(k-2),…,y(k-n)](13)
作为RBF神经网络训练模型输入层的输入,通过上述隐含层高斯径向基函数进行非线性变换,再利用上述模糊K均值聚类算法来选取聚类中心和训练权值,最后得到整个网络的输出:
(k)=∑mi=1ωiFi(k)+θ(14)
式中:(k)为输出层的输出;ωi为修正后的权值;Fi(k)为第i个隐层节点的输出;θ为输出层节点的阀值,并将(k)与当前系统的实际输出y(k)进行比较,得到残差δ(k)。若δ(k)小于预定阀值θ,表示传感器正常工作,此时采用系统实际输出的数据;若δ(k)大于预定阀值θ,说明传感器发生故障,此时采用RBFNN观测器的观测数据作为系统的真实输出,实现信号的恢复功能。
3.2 仿真实验
在压铸机系统各传感器正常工作时连续采集52组相关数据,将其分成2组,前40组用于对RBF神经网络进行离线训练,以构建RBF神经网络观测器;后12组用于对训练好的网络进行测试。表1为训练样本库中的部分数据。
表1 用于RBF神经网络训练的部分数据
序号合型力 /MPa油压 /MPa压射速度 /m/s模具温度 /℃
111.258.962.50353.21
211.408.902.52353.30
311.409.002.46354.20
411.259.002.42354.50
511.009.102.42353.61
611.709.102.56353.14
712.009.122.60352.90
812.109.212.60352.95
912.109.232.52353.76
1011.709.122.68353.21
1111.258.902.68356.12
1211.258.892.62355.32
1311.328.982.48354.46
1411.329.112.48353.62
1511.459.102.50355.00
1612.109.112.42356.18
由于表1中的4个参数的物理意义、量级各不相同,必须经过归一化处理后才能用于神经网络的训练,用Matlab[10]的Simulink仿真工具箱提供的函数对数据进行归一化处理使数据位于[-1,1]之间。训练结束后切断学习过程使网络处于回想状态,将系统实际输出与网络模型的输出相减就可以获得残差。以合型力传感器为例,采样时间为0.5 s,利用上面的学习样本在时间T∈[1 s,1 000 s]内对RBF神经网络进行训练,结果经过约50步训练误差就达到10-7并急剧减少,如图3所示。
图4为用后12组数据对RBF神经网络进行测试时,跟踪正常合型力传感器测量值y的情况,其最大误差不超过1.5 MPa,所以训练好的RBF神经网络具有一定的泛化能力,可以较好的观测、跟踪合型机构现状。
现针对传感器经常发生的卡死故障、漂移故障和恒增益故障进行模拟仿真实验。当合型力传感器正常工作时,RBFNN观测器输出与合型力传感器测量值y之间的残差δ=-y近似为高斯白噪声序列,其均值近似为零;当传感器发生故障时,由于y不能准确反应合型力数据,导致δ突变,不再满足白噪声特性。根据上面所述的传感器故障诊断原理,设定阀值θ=2.7 MPa,图5表示合型力传感器在T∈[400 s,600 s]内发生卡死故障时的输出残差曲线;图6表示传感器在T∈[600 s,1 000 s]内发生漂移故障;图7表示传感器在T∈[800 s,1 000 s]内发生恒增益故障时的输出残差曲线。
图3 RBFNN训练过程误差收敛情况
图4 合型力传感器正常工作时的残差曲线
图5 合型力传感器发生卡死故障时的残差曲线
图6 合型力传感器出现漂移故障时的残差曲线
通过对各类典型故障的仿真实验,能够准确检测到合型力传感的各类故障。
图7 合型力传感器出现恒增益故障时的残差曲线
4 结 语
在此依据径向基(RBF)神经网络原理,以压铸机控制系统各传感器的输出参数作为RBF神经网络的输入,采用模糊K均值聚类算法选取聚类中心,建立传感器RBF神经网络观测器模型对控制系统传感器进行故障诊断,仿真实验表明径向基神经网络具有较强的非线性处理和逼近能力,泛化能力强,网络运算速度快,能够准确发现和处理故障信号,性能稳定。因此,RBF神经网络故障诊断是压铸机控制系统一个必不可少的新管理工具。
参考文献
[1]彭继慎.压铸机控制技术[M].北京:机械工业出版社,2006.
[2]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[3]王军,吕震中,曹荃,等.基于神经网络的传感器的故障诊断方法与应用[J].自动化仪表,2003,24(10):21-24.
[4]翁桂荣,叶萍.基于RBF的传感器在线故障诊断和信号恢复[J].传感器技术,2003,22(10):50-53.
[5]胡香玲,冯浩,华亮.基于RBF神经网络的变压器保护[J].电气应用,2005,24(10):59-62.
[6]赵望达,刘勇求,贺毅.基于RBF神经网络提高压力传感器精度的新方法[J].传感技术学报,2004,23(4):640-642.
[7]张秀玲,李海滨.一种基于RBF神经网络的数字模式识别方法[J].仪器仪表学报,2002(6):265-267.
[8]张小军,冯宏伟.基于径向基函数神经网络的车型识别技术[J].西北大学学报:自然科学版,2006(2):21-24.
关键词:城区土壤;重金属污染;遗传算法;BP神经网络
中图分类号:X53 文献标识码:A 文章编号:0439-8114(2013)03-0685-03
重金属污染是全球环境污染的突出问题,随着社会和经济的发展,重金属污染危害日益加重。研究重金属污染的分布,并根据分布情况实现对污染源的定位对于有关部门进行及时的环境预防与整治具有重要意义[1]。
近年来兴起的人工神经网络能通过学习实例集自动提取“合理的”求解规则,且具有容错和容差能力以及一定的推广能力。本研究建立基于并行遗传算法的BP神经网络系统,该模型可以实现对污染源位置的定位,从而为相关部门及时进行环境整治提供了理论依据。
1 构建基于遗传算法的BP神经网络模型
1.1 BP神经网络基本原理
BP神经网络是在对复杂的生物BP神经网络研究和理解的基础上发展起来的,因此具有较强的信息处理能力,对复杂的问题具有适应和自学的能力,可以很好地协调多种输入信息的关系[2]。BP神经网络通常由输入层、若干隐含层和输出层组成,每层都包含若干神经元,通过神经元之间的相互作用来完成整个网络的信息处理。其网络拓扑结构如图1。同一层各神经元相互没有连接,相邻层的神经元通过权实现全连接。
1.2 BPANN算法改进
普通的BP神经网络有自身的缺陷,包括易陷入局部最小点、收敛速度慢、学习过程容易出现震荡等。为了改进普通的BP神经网络,引入遗传算法(Genetic algorithm,GA)。遗传算法是一种基于自然选择和基因遗传学原理的优化搜索算法,它将“优胜劣汰,适者生存”的生物进化原理引入待优化参数形成的编码串群体中,按照一定的适配值函数及一系列的遗传操作对个体进行了筛选,从而使适配值高的个体被保留下来,组成新的群体,新群体中包含上一代的大量信息,并且引入新的优于上一代的个体。这样的周而复始,群体中的适应度不断提高,直到满足一定的条件为止,其基本原理如图2[3]。
遗传算法与神经网络算法的结合就是利用GA优化网络的拓扑结构,如网络层数和每层的节点数,以及各层节点间的连接关系。根据某些性能评价准则(如学习速度、泛化能力或结构复杂程度等)搜索结构空间中满足问题要求的最佳BP神经网络。基于遗传算法的神经网络流程如图3。
2 模型应用实例——以青岛市城区土壤重金属污染源的定位为例
青岛是中国重要的经济中心城市和港口城市,是中国重要的外贸口岸之一、国家历史文化名城和风景旅游胜地,作为体现青岛面貌的首要因素——环境,已成为青岛、中国乃至世界大众关注的问题。因此,对青岛的城市环境地球化学研究势在必行。
现以青岛市城区为例,根据从城区采样得到的土壤重金属含量数据建立神经网络模型,对污染源进行定位。对青岛市南区、市北区、四方区、李沧区、崂山区5个城区进行了广泛的土壤地质调查,将所考察的城区按照每平方公里1个采样点对表层土进行取样,共得到319个采样点,并分别检测每个采样点的8种重金属Cd、Cr、Cu、Hg、Ni、Pb、Zn和As的含量[4]。
对每种金属元素进行多次基于遗传算法的BP神经网络模拟后,在所得的数据矩阵中随机选取200个点对应的坐标进行绘图,绘图结果如图4。从图4中可以看出,每种重金属元素在城区中的空间分布,对数据中每种金属元素的空间坐标进行K-means聚类,所得的聚类中心即为污染源预测位置。
3 小结
通过建立基于遗传算法的BP神经网络模型,并将该模型运用于青岛市城区内各种重金属污染源的定位。使得环境管理部门可以在目标地区的土壤进行采样分析的基础上,利用该算法得出目标地区内重金属元素的分布图,根据极大值点可以定位污染源,并由此采取相应的管理措施。该算法的优越性在于可利用部分测量数据估计整体地区的分布情况,但同时也存在不足之处,一是数据获取困难,一般需要依靠卫星测量获取样本数据,二是算法虽然有较高的收敛速度,但缺少动态性,无法进行金属元素的动态分析和分布变化预测。
参考文献:
[1] 马旺海,曹 斌,杨进峰,等.城市重金属污染特征[J]. 中央民族大学学报(自然科学版),2008,17(1):66-73.
[2] 卢文喜,杨忠平,李 平,等.基于改进BP算法的地下水动态预测模型[J].水资源保护,2007,23(3):5-8,59.