HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 神经网络设计

神经网络设计

时间:2022-05-10 21:33:19

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇神经网络设计,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

神经网络设计

第1篇

关键词:人工神经网络;尖峰神经元模型

近年来,人们在计算机智能化领域上取得了很大的进步,但计算机领域还有很多问题无法解决,例如视觉、语言识别和计算机等技术,人们仍不能将计算机系统设计得像生物系统那样灵活。因此,大批研究者转移到仿生科学研究,希望由此找到新的技术,设计出新的智能计算机,其中人工神经网络是其中一个比较热门的领域。随着这个领域的发展,一些团队已经建立起一些创造性的、复杂的神经电路模型,并将其应用到一些项目中,也有研究团队在致力研究人工神经网络的软件和硬件方案,希望能够为智能计算机提供更高层次的理解能力。

人工神经网络模型的并行特性使它与传统的计算机模型相比具有更强的理能力,使它更有机会解决如手写文字识别这类问题。长期以来,大多数研究者都是在CPU上使用模拟的方式进行神经网络的计算,由于CPU工作模式和结构的限制,无法提供最佳的计算性能,因此本文寻求一种新的智能计算硬件平台,在硅芯片上设计神经网络电路。

一、神经网络模型

人工神经网络理论已发展了很多年,并日益趋于成熟,在各领域都得到了一定的应用。人工神经网络的运算主要由计算的基本单位神经元进行,通过若干个神经元构成神经网络以解决现实中的各种问题。

如图1所示,一组神经元构成一个神经网络系统。每一个神经元都有独立的计算单元。神经元计算公式如下:yi(t)=■W■?着ij(t-tij) (1)

公式(1)中yi(t)表示神经元的输出结果,i表示神经元序号,?着ij(t-tij)表示神经元输入值,W■表示每个神经元的权值。

人工神经网络的基本运算包括了乘法和加法运算。为了能够在硬件上执行神经网络的理功能,必须为每个神经元设计独立的加法器和乘法器,我们将其称为加乘法运算单元(MAC),每个神经元都包含了一个MAC单元。

为了使系统能够更好地模拟人类神经系统工作原理,发挥硬件的理能力,本文采用了Gerstner的尖峰神经元模型构建神经元理器的工作流程。在该模型中,每个神经元的膜电位在时间t时表示如下:

ui(t)=■■■W■?着ij(t-tij)+?浊i(t-tij) (2)

?着ij(t)=exp(-■)-exp(-■)*H(t-t■) (3)

公式(2)中,W■表示为第i神经元和第j神经元之间连接的权值,?着ij(t-tij)表示为神经元i能够提供给神经元j的突触后电位(PSP),而?浊i(t-tij)表示倔强函数。公式(3)表示突触后电位(PSP)的计算方法,其中t■和t■为时间常数,H(t-t■) 为Heaviside阶梯函数,t■为轴突传输延时系数。

二、神经元硬件设计

如图2所示,神经网络系统是由多个神经元构成,每个神经元是一个单独的实体,神经元既相互独立,又相互联系,神经元根据所受到外界的刺激(输入)和邻居神经元对自己的影响,做出判断与决策(输出),并影响到周围神经元的反应。为了能够实现神经网络功能,需要模拟神经元单位设计一个特殊的理器用于计算外界刺激而做出的反应,它包含了简单的算数逻辑运算单元、寄存器和控制器,在本文中使用PN表示该理器。

图3显示了一个PN理单元的工作流程图,每个PN理器包括了进行神经元计算必须的运算器和存储器以及相关附属器件。PN理单元的工作流程是:当外部有输入数据通过总线进入PN理器时先存放在输入事件存储器;系统根据事件时间将数据输入到突触后电势寄存器;同时输入值被编号后分别放入公共连接存储器;突触后电势PSP值与其他神经元的权值相乘后与原有膜电位值相加,相加结果更新膜电位存储器值;同时结果与阈值相比较,如果大于阈值则将结果输出到输出存储器中作为该神经元的输出结果存放在输出时间存储器。

系统是由若干个神经元理器构成。如图4所示,人工神经网络系统由若干个神经元共同构成,图5表示了人工神经网络的硬件构成。每一个人工神经网络都是由若干个神经元理单元构成,每个神经元理单元又是由逻辑运算器、存储器和通信单元构成。将这些神经元理器构建在一块电路板或者芯片上,同时理器与理器通过总线连接起来相互通信,共同完成神经网络的运算。系统还为每一个神经元单位配置了一个PN理器,理器之间相互独立,并行计算。当外部刺激(输入)进入系统时,立刻被分配到各个PN理器并行计算神经元对刺激的响应(输出),同时根据计算结果,调整神经元之间的权值系数,并更新存储其中的权值。由于PN理器是并行计算,相对于传统计算机模拟运算,极大地提高了神经网络的计算速度。

本文以Gerstner的尖峰神经元模型为基础,设计了模拟神经元工作的PN理单元,并由若干个PN理单元构成模拟人类神经系统的人工神经网络的硬件系统。相对于在传统计算机上的操作,PN理单元的并行性使新系统有更强的理能力,有效地提高了神经网络的计算速度,使神经网络系统有更好的应用前景。

(作者单位:广东肇庆科技职业技术学院)

参考文献:

[1]Gerstner,W. & Kistler,W.M.Spiking neuron models:single neurons,populations,plasticity. Cambridge,UK:Cambridge University Press,2002.

[2]Mazad S. Zaveri. Dan Hammerstrom1. Performance/price estimates for cortex-scale hardware: A design space exploration,2011,(24).

[3]徐明华,甘强.脉冲神经网络的振荡与分割[J].生物物理学报,1997,(1).

第2篇

关键词:自主角色; 神经网络; 遗传算法

中图分类号: TP183

文献标识码:A

0引言

随着计算机图形学和硬件技术的高速发展,计算机游戏近十几年也取得了很大的发展,游戏软件已成为软件产业中非常重要的内容。游戏的类型主要包括FPS(第一人称射击)、RPG(角色扮演类型)和RTS(即时战略游戏)等几种类型,这些不同类型的游戏都要求游戏控制的角色(NPC)与玩家控制的角色(PLAYER)要有行为的交互,交互的方式直接影响玩家对游戏的兴趣度。因此,对NPC与PLAYER之间的角色交互行为方式的研究已经成为游戏软件中的一个非常重要的研究课题。

目前大多数游戏中的角色行为的交互方式采用的是确定型的交互行为,其特征主要表现在角色的行为都是预先确定的,这种类型的行为实现起来较为简单,也是目前大多数游戏所采用的交互方式。像这种确定性的行为往往体现不出角色的自主性,而且还会导致角色行动单调乏味,其行动很容易被玩家所预测,降低游戏的可玩性。为此,我们需要在游戏软件中设计和实现这样的NPC角色,它能够根据当前环境的变化以及以往的经验知识来动态地改变对PLAYER的行为。具有这种能力的角色,我们称之为自主角色,也称为自适应角色。具有自主和自适应特点的角色可具有推理能力和自适应能力,在游戏环境下可更受玩家的欢迎。

一款拥有自主角色的游戏能够牢牢地吸引玩家的注意力,从而延长这款游戏的生命周期,因此促使游戏开发人员花更多的时间来研究自主角色的实现。一些公司已经开始尝试从人工智能领域发展出更加高级的技术,如采用决策树或者强化学习来实现角色的自主性,也有的像著名的游戏Colin McRae Rally2则采用了学习系统和神经网络来实现角色的自主性。

有关自主角色行为的论文已经有很多做出了卓有成效的成绩,如在Reynolds的文献[1]中,对自主角色的群体行为进行了描述。Blumberg和Galyean[2]中引入更多的行为控制机制,并考虑了行为学习这样一个令人感兴趣的问题。对于自主角色的更高层次的认知能力方面,John David Fungc[3]中指出,认知模型是用于创建虚拟世界的模型“金字塔”的顶层,底层的行为模型作为认知模型和物理学模型之间的缓冲区,并将情景演算(situation calculus)[4]用于高度动态的虚拟世界。

但是,上述各种方法因为侧重点不同,各有优缺点,且相互之间较为独立,因此本文结合上述一些方法的优点,在此基础上提出了基于认知角色建模,采用神经网络和遗传算法相结合的游戏自主角色的设计思路。基于此,各小节安排如下:

第一节确定了基于认知建模方法的游戏自主角色模型;第二节介绍了神经网络在实现自主角色中的应用;第三节说明了遗传算法对神经网络的优化;第四节对自主角色的实验进行了分析。

1基于认知建模的角色自主性模型

由于认知建模方法能够采用精确的数学方式来定义自主角色的行为和学习模式,因此本文采用认知建模方法来对游戏角色的自主性进行建模。这里将游戏中存在的非玩家控制的角色简称为NPC,通过认知建模方法研究NPC的高级行为规划,指导NPC,提高NPC的智能水平能力,使NPC能够对环境作出判断,并根据当前的状态进行推理,进而完成相应的行动序列,有利于创建聪明自主的智能体――具有认知能力的自主的角色。

在计算机游戏中,我们将游戏角色关于他所在世界的内部模型称“认知模型”(Cognitive Model)。认知模型可以用于游戏中,控制一类自主的角色。通过认知模型支配游戏角色对其所在环境的了解程度,如何获取知识,以及如何利用知识选择行动。

NPC的行为分为“预定义的”和“非确定性的”两种,建立的认知模型也各不相同。建立预定义行为的认知模型比较简单,只要将事先定义好的NPC所在环境的领域知识赋予NPC系统,NPC就可以根据人们的要求采取某种行动。而非确定性的行为不容易控制。为了实现人为的控制,我们采取一种折中的方法,即将领域知识和人的指导赋予NPC,使NPC主动地向人们希望它达到的目标发展。可由下面的公式表示:

知识+指导=行为

领域知识能够用来规划目标,而指导对如何达到目标提供一种框架计划。

当然NPC在决定采取什么样的行动时并不需要整个虚拟世界的知识。所以,我们认为NPC的认知模型是角色对其虚拟世界的一种内部简化模型〔simplified model〕。

为此我们在现有游戏系统之上营造一个通过认知模型定义的高级行为规划器来实现对NPC的行为指导。规划器模型设计如图1所示。

NPC的预定义行为和非确定行为都可以形式化为认知模型,通过认知模型来指导NPC高级行为规划器,由于神经网络在非确定中的强大的学习作用,因此本项目通过神经网络来实现NPC高级行为规划器的三个方面:目标引导、行为协调、约束满足。

2基于人工神经网络的角色自主系统

这里,我们采用的是神经网络中的BP网络作为NPC的感知系统。BP算法是一种用于多层前向网络的学习算法,它包括输入层、输出层和隐含层,隐含层可以是多层结构。BP网络的学习过程包括两个阶段:第一阶段计算前向输出;第二阶段从反向调整连接权矩阵。

在前向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层,每一层神经元的输出作为上层神经元的输入.如果在输出层,实际输出值与期望输出值有误差时,则以反向将误差信号逐层修改连接权系数并且反复迭代,最后使实际输出值与期望值的均方差为最小。在修正连接权系数时,通常采用梯度下降算法。

BP神经网络使用的是指导式的学习方法,即在学习过程中,向网络提供有明确输入和输出目标的样本对。BP学习算法是基于最小二乘法LMS 算法,运用梯度下降方法,使网络的实际输出与期望输出的均方差最小。网络的学习过程是一种误差边向后传播边修正连接权的过程。因为BP网络对以分类为主要目的的学习非常有效,所以,我们采用B P网络进行NPC分类的自学习。需要输入NPC自主系统中BP网络的特征参数主要是NPC的生命值,NPC的攻击力,NPC的防御力,NPC的情感值等,玩家虚拟角色的生命值,玩家虚拟角色的攻击力,玩家虚拟角色的防御力,玩家虚拟角色的情感值等。

NPC在虚拟游戏环境下,在与玩家的不断交互中刺激着感知系统,在外界环境发生变化时产生认知模型指导下的自主行为,通过神经网络最终演化成具有自主性的行为系统,同时,利用遗传算法使适应度有一定程度的增加,使NPC更适应外界环境的变化。关于NPC的感知系统的设置如下:

1) 输入参数的确定

NPC的感知系统由人工神经网络构成,虚拟游戏环境的特征参数作为输入送入神经网络进行学习。在我们的游戏项目中,输入主要包括三种类型:布尔类型、枚举类型和连续类型三种,但是这三种类型都需要转化成神经网络所认可的实数类型。

2) 权重的确定

权重有些类似于生物神经网络的树突联结,权重影响了输出变量的值,并且定义了神经网络的行为,实际上训练或者演化神经网络的主要目标就是确定NPC神经网络的权重。为了确定每个输入参数的权重,需要确定激活函数。

3) 激活函数的确定

激活函数确定了输入与输出参数之间的映射关系,针对NPC自主角色的神经网络,我们采用的是非线性激活函数,具体采用的是S型激活函数。

3基于遗传算法的神经网络优化

神经网络的基本特征是大规模并行处理、容错性、自适应性和自组织性,适合处理直觉和形象思维信息。神经网络与遗传算法的结合使神经网络的训练有了一个崭新的面貌,目标函数既不要求连续,也不要求可微,仅要求该问题可计算,而且它的搜索始终遍及整个解空间,因此容易得到全局最优解。用遗传算法优化神经网络,可以使得神经网络具有自进化、自适应能力,从而构造出进化的神经网络(ENN)[5]。

研究NPC的进化,要建立NPC在虚拟环境中进行的各种行为模型。另外,同虚拟环境本身也会发生竞争。由于适应度是NPC竞争力大小的直接反映,为了建立NPC的竞争机制,首先要建立NPC的适应度函数。

首先,NPC的适应度函数和NPC的种类相关。在同一环境下,不同NPC的适应度肯定是不相同的[6]。同时,为了表现NPC自学习对进化的影响,有了学习能力的同种NPC适应度的取值也有所不同。其次,NPC的适应度还与其所处的不同阶段有关。适应度取值在其不同阶段中不是一成不变的。

在环境不发生变化时,NPC的适应度函数F(t)可以用此函数表示:

其中,参数a表示NPC的生命力值;参数k表示NPC的类型,不同的NPC对同一游戏环境的适应性是不一样的,当k取不同的值时,会得到适应度不同的各种NPC。接着按照以下工作步骤操作:

1) 从NPC神经网络中提取权重向量;

2) 用遗传算法演化出一个新的网络权重群体;

3) 把新的权重插入到NPC神经网络;

4) 转到第一步进行重复,直至获得理想的性能。

4试验分析

我们的实验测试场景如下:

在一个仿真的三维游戏环境下,游弋着若干个NPC角色和一个玩家控制的虚拟角色,主角可以漫游整个游戏场景,这些NPC当遇到主角后,可能会对主角采取不同的行为,比如攻击行为,逃避行为,团队作战行为,对话行为等,所有这些行为的决策都取自于神经网络的训练。

在采用神经网络算法之前,所有的NPC无论强弱,都会主动向玩家角色发起攻击,而在采用神经网络算法之后,这些NPC都具有了一个人工大脑,每个NPC在与玩家角色的交互过程不断地学习,不断地演化,最终变成自主角色,具体表现在:NPC根据以往与玩家角色交互过程中的经验,从而产生较为理智的行为,比如当NPC感觉玩家的综合实力要高于自己时,它可能会采取逃避的行为,而当NPC感觉其综合实力要高于玩家时,它往往会主动攻击玩家。

表1和表2列举了应用神经网络算法前后的测试数据。

应用神经网络算法所采取的实验方案如下:

(1) 对于NPC感知系统的输入,包括与虚拟玩家角色的距离, 虚拟玩家的攻击力,防御力,生命力,魔法力,信誉度,NPC自身的攻击力,防御力,生命力,魔法力,信誉度。并将参数归一化,使最终的参数范围位于[-1, 1]之间;

(2) 对于NPC感知系统的输出,包括躲避,单独攻击,潜伏,召唤同伴,团队攻击等行为。即将神经元的输出元设计成五个,这些行为通过一些标志符来确定,例如, 如果代表攻击的输出位为1,则其他位为零。

通过对比两组测试试验,可以发现后一组试验中,NPC能够根据自己的实力和玩家的实力对比,理智的采取一些行为(比如退避,呼唤同伴协同作战)而不是一味盲目攻击, NPC的存活率显然就很高,因此也显得较为智能。

第3篇

关键词:神经网络;智能设计;特征编码;智能推理;基于知识的工程(KBE)

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)16-3917-03

Research and Implementation of Intelligent Design System Based on Artificial Neural Network

WU Zheng

(The CAD Research Center of Tongji University, Shanghai 200092)

Abstract:Axisymmetric part of the design for the introduction of the concept of the feature encoded file, its characteristic features in a coded form to be expressed. In order to achieve intelligent process state model output, the use of artificial neural networks for automatic reasoning capabilities. Through the intelligent reasoning system to remove the experience of design continued exploration and improvement, will be part of the feature modeling input, the system can automatically determine the parts of the process, then automate production. The intelligent system can help developers and designers to quickly produce design example, so developers can focus more on product innovation activities of enterprises to improve product design and R & D has important practical significance.

Key words: neural network; intelligent design; feature coding; intelligent reasoning; KBE

产品工艺设计是产品开发的首要环节,也是关系到产品设计成功与否的核心问题。提高工艺设计集成化、系统化和智能化程度,实现经验设计向科学设计的飞跃是研究人员多年追求的目标。而智能设计作为现阶段的热点技术,吸引了越来越多的专家和学者的目光。[1]伴随着计算机软硬件的成熟,以及图形图像学、CAD、人工智能设计技术和工艺模式理论的发展,显著的提高了设计的质量和效率,大大缩短了设计周期和工时,形成了工艺设计的的新领域,对我国智能设计和计算机辅助设计的发展起到了极其重要的推动作用。[2]

1 人工神经网络智能设计系统模型的表达

1.1 智能设计系统的体系结构

该智能设计系统主要的结构模块如图1所示。本文将该智能设计系统主要划分为以下几个模块,特征造型器主要将零件的特征进行录入,数据会同用户的输入数据共同进入特征编码器;特征编码器相当于一个接口,将形式数据转化为模式映射器能够识别的规范化数据(即特征编码文件),在模式映射器内部,通过神经网络对数据的处理,同时结合已有的经验知识库、材料库、规则设计库、工艺特征库、映射规则和标准库的数据交互,将数据输出到数值公式计算模块。数值公式计算模块主要是在具体的场景中将约束条件进行量化,结合具体的设计要求将工艺设计顺序进行调整。最后将结果反馈到用户界面,实现智能设计。

1.2 KBE思想和本系统的有机结合

在工程实践中,人们发现专家知识一般来源于该领域内专家的经验和积累,具有很大程度的不确定性和模糊性,这对于知识的交流和继承带来了很大的困难。欧洲面向KBE应用的方法和软件工具研究联盟提出了KBE的概念,KBE是计算机辅助工程领域的一个进步,它是一种将面向对象方法(Object Oriented Methods)、AI和CAD技术三者集成的工程方法,能够提供设计过程客户化、变量化和自动化的解决方案[3-4]。,我们认为:KBE是通过知识驱动和繁衍,对工程问题和任务提供最佳解决方案的计算机集成处理技术,是AI和CAx技术的有机融合。[5-6]

KBE系统的要点主要是知识的表示、知识建模、知识推理和知识的繁衍。本系统主要通过特征造型器进行知识的表示,进而在特征编码器中对所得知识建模,形成了特征编码文件。模式映射器利用人工神经网络对于特征编码文件进行不断的映射,实现了知识推理;同时模式映射器将学习所得的知识存储在相应的知识库中,进行知识繁衍。将经验知识和隐形知识转化为显式知识,实现了智能系统的关键一步。我们将KBE的思想结合到本文所开发的系统中来。

2 零件的工艺特征及特征的编码

2.1 特征的确定和数字化表达

首先我们需要确定零件的特征,进而将零件的特征数字化。本文根据以下原则确立零件的特征:

1)现实性。零件的特征是客观存在的,不因人的主观意志的转移而改变该特征。2)可测量性。相比于传统的经验化设计模式,能够准确的测量和量化零件特征是智能设计的重要要求。3)唯一性。作为零件信息的重要载体,特征的无歧义性是需要重点考虑的原则,不能同时将一个特征收录到两个属性中,进而造成建模中零件属性的混乱。

本文主要针对轴对称的零件工艺模式,我们将主要研究零件的以下特征:冲孔、翻边、正向拉深、反向拉深、带孔小阶梯成形法等。

考虑到神经网络我们采用的是S型参数,所以我们将特征编码确定为0到1之间的数,本文共确定了10种特征形状。如表1所示。

通过确定特征参数,进而可以构建特征造型器,特征造型器以零件的实体特征为基础,结合零件的几何信息和拓扑信息,将参数化设计思想和特征编码思想统一,用尺寸驱动的方法来定义特征,便于计算机对于零件特征的识别和处理。

2.2 面向对象的特征建模语言

由于在实际设计征的复杂性和多样性,而面向对象的语言具有数据的封装性、数据与操作的集成性、对象重载、现实世界对象的数据和行为的全面抽象、对象数据的继承性等等许多的优点,目前已成为设计领域广泛采用的设计手段,应用在特征设计领域,可将特征的对象数据类型抽象出来。

特征对象首先具有本身的特征尺寸和属性,考虑到具体的应用,这些尺寸要能够实现参数化,除此之外,还具有公差、材料、技术设计要求等信息;特征的操作类型主要分为两种:一种是成型过程,即所谓的造型映射,另一种操作是特征在零件上的形成位置即有关位置的变动操作。在这两种操作中,造型映射与工艺设计的过程联系紧密,而特征位置操作则与产品的设计过程相关。下面主要是该特征对象的基类型的原型定义。

class Feature

{Stringfeature ;//零件对象的三维实体名。

StringName;//零件特征名。

Stringmaterial;//特征的材料。

intfeature_parametre; //特征尺寸的参数。

intfeature_num.;// 特征类型的编号。

intfeature_code;// 特征的编码。

intpt1,pt2,pt3;//特征基点的坐标。

int angle1,angle2,angle3;//特征在三维空间中与X, Y, Z轴的夹角。

Public:

virtualvoidmodel();//构造三维实体特征。

virtualvoidlocate();//确定特征的空间位置。

voidmove (ap_solid *sol, ap_real tx, ap_real ty, ap_real tz);//将特征移动{tx,ty,tz}。

voidrotate (ap_solid *sol, ap_real rx, ap_real ry, ap_real rz);//将特征旋转。

void chang_feature_para (int class_name, ap_solid *sol, ads_point pt, ap_direc ang, feature_parametre, void model); //该特征的几何尺寸的参数化修改操作。

voidcal_area(); // 特征面积的计算。

voidcal_circl();//特征周长的计算。

}

通过实例化语言,我们能够对零件的特征进行描述,进而便于计算机识别和处理。特征编码的构造加入到零件基类中,具体零件的定义将继承特征编码的操作,并能够进行适当的重载。

3 特征编码器和特征编码文件

将特征数字化表示后,本系统主要通过特征编码器将特征组成特征编码文件,使后续的人工神经网络能够对文件进行处理。有了特征编码,我们能够让机器识别特征;但是为了保存特征的其他信息,如冲孔工艺中孔的直径,翻边的高度等等,我们引入了特征参数的概念。特征参数即为了更明确的定义特征的几何、物理属性,跟随在特征编码后面的一系列数值。图3表示了部分特征编码所对应的特征参数。

我们将特征编码和特征参数组成特征编码文件,输入到模式映射器中。特征编码文件的格式为:每一行表示切仅表示一个特征,其中第一个数字为特征编码,特征参数在特征编码之后给出。图4显示了一个特征编码文件的实例。

4 智能设计系统中工艺模式的生成、映射以及神经网络的构造

4.1 工艺模式映射的过程

我们将零件的特征编码文件输入人工神经网络后,人工神经网络进行反向推理,将零件的成型信息反向输出,同时结合知识库、材料库等已有的信息,输出结果。

工艺模式用于指导工艺计算模块的工作,而经过特征造型之后的零件信息只有特征编码文件。因此,人工神经网络的任务就是根据零件的特征编码组信息,推导出生成零件的各个中间成形形状的特征编码组,以及各个中间形状在零件成形过程中的排列顺序。

因为对于神经网络来讲,得到的是设计者输入的零件模式信息,输出是零件成形的各个中间状态(特征编码表示),这就决定了工艺模式在神经网络中的映射过程是一个“逆顺序”的过程,这一过程又可以描述为“反推导”过程,即:将零件的特征编码组(零件模式)输入到经过训练的神经网络中,由其输出该零件成形的各个过程的中间形状的特征编码(中间形状模式)。我们以计算机的视角来看待零件的分解,即:零件->特征->特征编码文件->人工神经网络。在人工神经网络中,特征编码文件被反编译,特征结构后得出特征形成的顺序,进而输出,即:人工神经网络->特征反编译->特征工艺序列->特征编码组->特征->零件。由此可见,人工神经网络是用于处理工艺模式的主要工具,在前面的特征造型器、特征编码器中生成的零件的工艺模式,以及特征编码组等概念,都是为了便于神经网络的处理而建立的。

最后,由这些“中间形状模式”、“零件模式”等特征编码组信息及其排列顺序,组成该零件成形的“工艺模式”信息文件。这一过程,就是以零件模式作为输入、以经过训练。

4.2 神经网络的比较及选择

人工神经网络用于工艺模式映射的工作主要是以下几个:1)是针对输入的零件模式经过映射后输出该零件成形的中间形状;2)生成按照工艺成形的过程而排列的零件成形中间形状的排列顺序;3)进行反向学习,从输入的特征编码文件中提取零件成型顺序,存储到知识库中。[7]

神经网络主要由以下几类:1)分解映射结构;2)集中映射结构;3)前向网络;4)集中反馈式网络。[8]

我们选择的是集中反馈式的神经网络,相比于其他类型的网络,反馈式结构的优点是:统一的网络便于训练模式的组织和映射工作的开展;输入单元和输出单元的数目相同,可以形成对称的网络结构,使得网络的稳定性和收敛性有了保障;工艺模式的成形顺序性问题不占用网络的实际结构形式,顺序性问题转化为反馈映射的顺序问题,映射的顺序代表成形的顺序;网络在结构上将保证各个单步成形映射的准确性,从而提高网络的训练质量。[9]

表2给出了神经网络训练的相关内容,由于神经网络中节点和隐层数目的不同会极大的影响神经网络的性能,本文主要对各个不同的网络进行了比较,得出了一个最优的网络(即网络7)。

5 实例模型

本文在研究的基础上开发了一个应用实例,该实例主要是设计者将零件的特征编码和特征参数输入系统后,经过神经网络的智能推理,将输出反馈到设计平台上。

系统首先进行特征编码的输入,以确定零件的特征造型;然后输入每一个特征编码对应的特征参数,图5显示了拉深工序对应的特征参数的录入。特征参数录入完成后可以选择继续添加特征或者生成特征编码文件。图6为一个以记事本方式打开的特征编码文件。将特征编码文件输入人工神经网络,对应的输出为特征造型顺序文件(Y.SFM),数值公式计算模块处理该文件,最后给出智能设计工艺流程(图7)。

图5特征参数录入 图6特征编码文件图7 智能设计系统给出的零件成型顺序及计算结果

6 结论

本文提出了轴对称零件成型工艺的产品建模方法,然后给出了面向对象的建模语言,能够量化表示零件的特征,在将零件的特征编码文件通过神经网络映射和输出的同时,运用KBE系统的自学习理念,将习得的知识存储。实践表明,通过人工神经网络和工艺智能设计系统的应用,能够解决实际的零件设计成型问题。

参考文献:

[1] 高伟.工艺设计信息系统中的知识发现技术研究[D].成都:四川大学,2005:22-23.

[2] 罗小宾.机械产品图像识别技术及其在反求设计中的应用研究[D].成都:四川大学,2004:15-16.

[3] The Knowledge Engineering and Management Centre at Coventry University,UK,[EB/OL].kbe.cov.ar.uk.

[4] MOKA-Methodology & soft-ware tools-- Knowledge based engineering Applications[M].ESPRIT proposal EP25418,1997.

[5] Peng Ying-hong,Zhao Zhen,Ruen Xue-yu.Application of KBE technology in Die & Mold Design[J].International Conference on Die end Mold Technology, Beijing,2000,90-86.

[6] Peng Ying-hong,Zhao Zhen,Ruen Xue.KBE technology in Engineering Design[J].International Conference on Engineering end Technological Sciences 2000, Beijing,2000:94-100

[7] 刘振凯.智能CAD人工神经网络专家系统的模型和结构[J].中国机械工程,1997(2).

[8] 肖人彬.智能设计:概念、发展与实践[J].中国机械工程,1997,8(2):61-64.

第4篇

【关键词】神经网络 提钒模型 控制系统

目前我国转炉提钒炉装备均以人工经验操作,导致提钒工艺效率不高。本文以转炉提钒为研究对象,结合转炉提钒的工艺特点,通过BP神经网络建立了提钒冷却剂控制模型、供氧控制模型以及吹炼终点半钢成分和温度的预测模型。

一、 冷却剂模型

提钒过程的热量主要来源于铁水本身带来的物理热和铁水内各元素反应放出的化学热,由于提钒过程中化学反应放出的热量高于提钒过程中的散热,因此整个过程中吹炼温度将逐渐升高,当温度超过了钒与碳氧化顺序交换的转化温度时,铁水中的碳将大量氧化,从而抑制了钒的氧化,为使吹炼温度不高于转化温度,可在吹炼过程中加入冷却剂来调节温度。

(一)在实时控制时,取半钢成分和半钢温度的目标值作为模型的输入。

(二)冷却剂尽量在吹炼前期加入,吹炼后期不再加入任何冷却剂使熔池温度接近或稍超过转化温度。冷却剂主要分两批加入:兑铁前生铁块、绝废渣等用废钢槽由转炉炉口加入,冷固球团在吹炼前3分钟之内从炉顶料仓加入炉内。

(三)在吹炼过程中,溶解于铁水中的氧和铁水中的氧化元素发生的氧化反应都是放热反应,会使铁水温度升高,为了反映上述氧化反应的热效应,就必须将铁水和半钢中的上述元素的含量作为神经网络的输入参数,但这样会大大增加神经网络的输入节点数目,增加训练的负担。为了减少神经网络的输入变量数目,可以将上述元素按照其化学反应的反应热进行折算。

二、供氧模型

根据不同的铁水成分和吹炼方式,耗氧量有很大差别,同时耗氧量的多少也影响着半钢中的碳和余钒的多少。

(一) 在实时控制时,取半钢成分和半钢温度的目标值作为模型的输入;料仓中冷却剂的加入量以冷却剂加入模型的输出量作为本模型的输入量。

(二)冷却剂除了具有冷却能力外,还具有氧化能力,冷却剂中的FeO等物质既是冷却剂又是氧化剂。因此,供氧量的多少不仅和铁水成分、重量有关还与冷却剂的携氧量密切相关。

(三)吹炼完毕后,说铁水中的Si、Mn、Ti变成了氧化产物。为了减少神经网络的输入变量数目,可以按照这些元素的耗氧量将其折算成钒。

三、 终点预测模型

终点预测模型如图2所示。

(一)耗氧量和冷却剂加入量在训练时使用实际的加入量作为输入参数,在实时控制时使用冷却剂加入模型和供氧模型的输出作为本模型的输入参数。

(二)各种加入的冷却剂要分别转换为冷却剂热效应和冷却剂携氧量。

四、模型集成

模型包括冷却剂模型、吹氧模型和终点预测模型3个子模型,通过VC++建立了模型的动态链接库。

链接库主要由4个类组成, 其中类CBpNeuralNetworks为基类,主要用于神经网络的建立、训练、存储和模拟,其它3个派生类分别为:冷却剂控制模型、吹氧控制模型以及半钢成分与温度预测模型,3个派生类的主要功能是完成各自模型的数据预处理和后处理功能。

五、结论

本文利用BP神经网络设计了转炉提钒冷却剂模型、供氧模型、终点预测模型,生产现场的应用情况证实了这一方法的有效性。结果表明,该模型具有较高的一致性和泛化能力。

参考文献:

[1]黄云,齐振亚,董履仁利用人工神经网络系统预报钢水温度[J].炼钢,2001,Vol.17, No.5, 43-46.

第5篇

关键词:神经网络;齿轮;优化设计

中图分类号:TP183文献标识码:A

1 齿轮传动优化设计的研究内容

目前,齿轮优化设计的研究内容大体可以分为下列三个方面:

1)单级齿轮传动,这方面问题有:对齿面接触强有利的最佳齿廓设计;蜗杆传动齿轮副最佳接触位置设计,齿轮副中形成最佳油膜条件的齿轮几何参数设计;齿轮辐板应力和应变值最小化的结构参数优化设计等。

2)多级齿轮传动,这方面涉及到运动学、结构强度、振动等许多方面的问题,如最佳传动级数、最佳传动比分配、最佳几何参数、最佳结构参数的设计等。

3)齿轮传动的动态优化设计[1],这个方面的问题包括动态特性优化、惯性质量最佳分配、动载荷最小化等问题。

2 ANN在齿轮传动优化设计中的应用

BP网络的重要功能之一就是实现从Rn到Rm之间的非线性映射,一个单影层的BP网络,是一个通用的函数逼近器[2]。

鉴于BP网络的这种功能,有专家利用它来实现变厚齿轮RV减数器中设计变量与动态参数之间的映射关系,从而解决了动态优化设计中目标函数难以建立的难题,使复杂的动态优化问题转化为简单的普通优化问题;也有专家学者利用BP网络来实现齿轮传动机构中设计变量到齿面接触疲劳强度和齿根弯曲疲劳强度的映射关系,从而简化了计算中反复计算齿形系数、应力校正系数带来的麻烦;还有专家学者利用BP网络来处理强度计算中大量图表的插值计算问题,为图表的计算机化提供了一条有效的途径等等。

由此看来,在齿轮传动优化设计中,只要是非线性映射或函数逼近的问题,都可以用BP网络加以解决。但有一点必须明确的是BP网络最适合于处理输入输出之间关系不明确而又无法用一个明确的函数关系表达的场合。对于有确切函数关系的输入输出,使用ANN也就没有多大意义了。

3 ANN和遗传算法的齿轮传动离散优化设计

以一单级斜齿圆柱齿轮减速器为例。已知名义功率P=20kw,小齿轮转速n1=1000r/min,齿数比U=3,载荷稳定,预期使用寿命10年,每年工作300个工作日,工作时间占20%,动力机为电动机,工作中有中等振动,传动不逆转,齿轮对称布置。

3.1 数学模型的建立

以体积最小为目标函数,体积最小等价于重量最小。在影响齿轮强度的参数中选择法向模数Mn、小齿数Z1,螺旋角β及系数Φd为设计变量,故数学模型[3]为:

值得注意的是,数学模型当中,目标函数和约束条件的建立是因问题的建立不同而异的。一般情况下,设计者希望优化设计后主要达到什么目的,就选择什么做为目标函数。有时希望达到多个指标,就成了多目标优化设计问题。对于约束条件,应当将设计中要避免的情况全盘考虑,这样才能获得一个实际意义的解。如本例,还应该考虑重合度系数约束,因为螺旋角的变化会影响重合度的大小。当然也有这种可能,约束条件太多,可行域都不存在了。这时,采用任何优化方法都不可能收敛。于是就要仔细研究一下,是约束条件定得不对,还是什么其他问题。

计算技术与自动化2007年6月第26卷第2期钟 波:基于人工神经网络在齿轮优化设计中的应用3.2 方法的优化

对上述约束条件下的极小化问题,有许多优化方法可以求解[5]。

对于本优化问题,齿数是整型变量,模数是离散变量,螺旋角和齿宽系数为连续变量。采用一般优化方法处理含有连续及离散变量的优化设计,处理思路是:首先暂时将有设计变量统一地看作连续变量,采用传统的优化方式求得最优设计点,然后,再将离散设计变量圆整到邻近的离散点[4]。

但这样处理有两个缺陷:

1)圆整后的设计点可能跑出可行域。

2)传统的优化方法大多采用基于梯度的算法,搜索很可能陷于局部级小而不能“自拔”。

遗传算法对处理含连续及离散变量的优化问题有独到之处,许多研究表明了其有效性,故本文采用遗传算法作为优化方法。

与传统的优化方法相比,遗传算法有下列特点:

1)对函数的要求极少,不需要梯度信息,不需要函数连续,因而具有很强的通用化能力。

2)由于同时对设计空间中的多个评估、操作因而有效避免了陷入局部最优解。

3)虽然是一种随机概率搜索方式,但不是在解空间内盲目地穷举,而是一种启发式搜索,因而搜索效率较高。

4)由于处理对象是设计变量的编码,而不是设计变量本身,因而可以方便用来处理含连续及离散变量的优化设计问题。

3.3 BP网络用于逼近各种线图

齿轮传动设计的特点是系数多,决定这些系数要用到各种线图和图表。要在优化设计中将确定这些系数的过程程序化,有时是很繁杂的。而用BP网络来实现这些曲线的插值程序化[5],却非常方便有效。图1是变位系数x=0时结点区域系数相对的螺旋角的关系曲线,图中“+”表示曲线离散化的点,这些点将作为训练样本数据用语网络训练。样本数据为:

利用Matlab工具箱中的工具函数训练网络,训练完成后的网络权值及阈值阵存入指定的文件中。这个过程需要编一段程序来完成[6],程序流程如下:

开始清除内存空间的所有函数及变量从命令式M文件中读入训练样本数据对数据归一化处理调用工具函数initff初始化网络调用trainlm训练网络利用save命令将权值阈值阵存入到指定文件中[6][7]。

图1 神经网络对结点区域系数的

逼近原始曲线及取样点[JZ)]

当在齿轮强度计算中用到该线图时,只需要将存储下来的权值阈值利用load命令加载到内存空间,然后利用工具函数simuff就可实现不同螺旋角对应的结点区域系数的插值计算了。

关于BP网络须说明的是:训练样本数太少,则样本的信息不能反映待逼近曲线的特性,训练样本数太多,又存在获取的困难。一般认为,样本数硎淙虢岬闶即可,这个确切的数据可以动态[2]确定样本数,即将可获取的样本分为训练集和测试集,用训练集训练网络。训练误差达到要求后,再用测试集计算测试误差,若测试误差太大,表明样本数不够,这时,需将测试集纳入训练集中,以加大训练集的容量。

4 优化结果的处理

利用遗传算法对上述优化问题求解。遗传算法初始群体规模取为60,交叉率Pc=0.7,变异率PM=0.01经200次进化迭代后[8],获得最优解。

初始设计点为:

从上面结果可以看出,经遗传算法优化后,目标函数有所下降。降幅不大主要是原始设计已比较接近优化结果的缘故,但优化方法避免了人工设计时的盲目试凑。另外,体积的下降是以牺牲中心距为代价的。在本优化设计中,中心距未加任何约束,其结果不是荐用系列值。若要取为荐用值,因跨度太大会影响优化结果,故本文圆整为172,通过微调螺旋角实现。

5 结 论

第6篇

关键词 神经网络;最短路径;matlab;ArcGIS

中图分类号:TP183 文献标识码:A 文章编号:1671—7597(2013)041-194-01

拥堵问题对城市交通的干扰是巨大的,甚至对道路公共交通设施(公交车)也产生了巨大的干扰,从而对其它的社会生产活动又产生间接干扰。在实际的交通出行中,拥堵在交通网络中向相邻的路段和节点进行传播,这类似与病毒在复杂网络中的传播,把复杂网络解决拥堵的理论应用到实际的公交网络中,就可以解决公交网络的拥塞问题,对拥塞的传播进行有效地控制。本文针对城市拥堵背景下的公交线路选优问题结合上述模型思想分别从公交路线选优模型的构建与运用,软件设计和方案生成比较两个层次方向进行深入研究。

1 模型的构建与形成

1.1 交通流量超标拥堵与公交路线选优模型的关系

交通拥堵的形成与发展是一个随时间和空间不断发生演变的动态过程,所以在研究拥堵分布的过程中,在充分考虑时间维的基础上,将拥堵形成的过程分为“点”、“线”、“面”三个空间层次进行分析研讨,同时在考虑完这三种空间层次后,结合最短路径算法,并将拥堵节点的拥堵程度过高的点作为避开点从而进行路线规划。

1.2 点-线-面拥堵空间分布模型

1.2.1 “拥堵点”——路段交通拥堵加权系数

“交通点”的判断即从交通信息系统中收集拥堵发生的路段信息,从而确定拥堵发生地点,一般情况下,取路段交通流量V与路段通行能力C的比值来判定交通流的状态,则“拥堵点”加权系数为:

1.2.2 “拥堵线”——线路交通拥堵加权系数

“拥堵线”用以判断拥堵点所在路段是否相连,如果路段的起点与终点有重合则表示路段相连,则点贯穿成线,构成“拥堵线”;如若无重合点,则表示“拥堵点”所在路段为相对独立的拥堵路段,故“拥堵线”反映出的道路拥堵情况更为直观和方便决策。

1.3 人工神经网络模型——ARIMA-ANN模型

ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,提出的这种组合系统包含两步。第一步,建立一个多层人工神经网模型来分析交通流时序序列中得非线性部分;第二步,从多层人工神经网的残余部分提出一个差分自回归移动平均模型。

本文模型中采用的指标包括相关路段周边人口分布,路段高峰小时路网容量和交通流量,交通流平移速度(采用归一化处理不同的离散坐标点),机动车数量,红绿灯数量等,模型通过对指标的分类学习实现综合考虑各指标合理权重的条件下对于线路相关拥堵系数的预测。

通过上述模型预测到研究路段的指标分类结果和相关拥堵加权系数以及人口分布加权系数后,下面我们结合最短路径算法实现考虑加入人口分布加权系数和拥堵加权系数后的公交线路方案生成的算法模型。

1.4 加入人口分布加权系数和拥堵加权系数后的加权最短径路算法

在所有向量的权值基础上乘以拥堵系数和人口分布系数(包括拥堵点对应路段的拥堵系数和拥堵线对应拥堵路线的拥堵系数和路段周边人口分布系数)后得到每段径路弧度所对应的人口分布-拥堵加权值。

2 模型的软件实现与运用

在得到上述的综合加权路线选优模型后,我们以C#语言为主框架语言,以MATLAB语言和C++编写模型算法并封装动态链接库(dll),C#通过外部调用dll,结合数据库技术和ArcGIS技术编写了一套基于本算法模型的公交路线免拥堵路线计算设计软件。

笔者编写了一套关于路线设计规划的软件,在录入关于神经网络的阀值与各节点人口分布-拥堵加权系数后,系统自动生成了一套线路走行方案,算法原理采用本文上述算法思想。笔者实现所在学校到成都市火车站的公交路线的选优生成,并与原路线进行了方案比较。在下面的附图中,笔者通过后台数据库录入部分地理坐标点的拥堵值用以检测软件在路线方案自动生成时是否会尽可能的避开拥堵系数大的“拥堵点”和“拥堵线”。经过测试和比较,软件系统生成后的新的路线方案避开了拥堵系数较大的“拥堵点”和“拥堵线”,生成后的新的路线方案虽然走行径路比原有公交路线略长,但是从时间的角度和舒适度的角度综合考虑可以发现是大大优化的

3 结论

本文模型以成都市相关路段历史统计数据为依据,在ArcGIS地理信息系统软件中依据神经网络相关预测模型为基底,通过对可能引起交通拥堵的相关指标和可能引起居民与公共交通设施占有率低下等指标进行了训练学习,实现了对于城市交通“拥堵点”和“拥堵线”的预测,并结合最短路径算法实现对于各中转节点向量边的拥堵系数量值的加权折算,使得算法模型在生成公交路线方案时尽可能考虑到靠近人口分布系数较高的地带并且避开拥堵系数过高的“拥堵点”和“拥堵线”,从而在整体上生成实现公交线路最优方案。在后续研究中,笔者将加强对于复杂网络中网络间彼此影响的研究,从而力争得出更为合理高效的路线选择方法。

参考文献

第7篇

关键词:BP人工神经网络;RBF人工神经网络;经济增长预测

中图分类号:TP183文献标识码:A文章编号:1009-3044(2011)10-2345-03

The Study of Forecast of Zhejiang Province's Economic Growth Using BP and RBF Artificial Neural Network

BAI Xue-bing

(Zhengjiang University of Technology, Hangzhou 310014, China)

Abstract: Based on existing studies of economic forecasting methods, the article studies the Zhejiang province'sEconomic Growth Forecastusing BP and RBF Artificial Neural Network.Thedata research shows Artificial Neural Network hasgood precision, but different Artificial Neural Network have different behavior, some have big error. Artificial Neural Network can provide good reference for the making policy of sector of economy.

Key words: BP artificial neural network; RBF artificial neural network; economic growth forecast

1 经济预测概论

经济预测是与未来有关的旨在减少不确定性对经济活动影响的一种经济分析。它是对将来经济发展的科学认识活动。经济预测不是靠经验、凭直觉的预言或猜测,而是以科学的理论和方法、可靠的资料、精密的计算及对客观规律性的认识所作出的分析和判断。

2 人工神经网络经济预测技术

由于人工神经网络具有大规模并行处理、容错性、自适应和联想功能强等特点,作为非线性智能预测方法的人工神经网络预测方法成为国内外经济预测研究的一个热点。

人工神经网络不断应用于证券预测分析、企业经济战略预测、经济理论创新、经济预测预警等研究中,都得到了一定的效果。

3 BP与RBF神经网络预测模型分析

3.1 经济增长神经网络设计模型

3.1.1 宏观经济预测指标

经济增长率是判断宏观经济运行状况的一个主要指标。经济增长率指的就是不变价国内生产总值增长率(简称国内生产总值增长率。因此,判断宏观经济运行状况要落脚到对国内生产总值的核算上。在本文中我们采用GDP的增长率来作为预测目标。

3.1.2 神经网络设计模型经济模型的设计

本论文采用两种模型对经济进行预测。

1) 第一种 GDP预测模型:第n年的一、二、三产业的增长率作为输入,第n+1年GDP增长率作为输出。

2) 第二种预测模型。第n-3、n-2、n-1、n年的经济增长率作为输入,第n-1、n、n+1年经济增长率作为输出。

这里还要说明两个问题。第一我们用到的数据来自2009年 浙江省统计年鉴,它的网址是 。

3.1.3 神经网络模型结构

设计经济预测神经网络模型前,首先需要确定神经网络的结构,主要包括如下内容:网络的层数,每层的神经元数和激活函数等。采用的神经网络结构如图1。

3.2 使用BP在以浙江省过去的每年的GDP增长指数的基础上进行BP神经网络预测

3.2.1 学习样本的选择

本次实验使用Matlab 软件采用3层BP神经网络建立浙江省经济发展的的预测模型。输入层节点数为n=4,输出层节点m=3.而隐含层节点数的选择是人工神经网络最为关键的一步,它直接影响网络队复杂问题的映射能力,实验中我们采用试凑法来确定最佳节点数。现设置较少的隐节点训练网络,然后逐渐增加网络节点数,用同一样本进行训练,从中确定网络误差最小时对应的节点数,隐层、输出层神经元的转移函数,隐含层和输出层转移函数分别采用tansig和logsig,训练函数选择traindx。

3.2.2 数值归一化处理

对于浙江省经济增长序列Q=(Q1,Q2…,Qt)。设序列的最大值、最小值分别为Qmax、Qmin。对时间序列的值作归一化处理。

令xi=(Qi-Qmin)/(Qmax-Qmin)

3.2.3 样本数据训练和数据预测

采用1978~2003年的数据样本在MatLab7.0软件中对输入网络进行训练.隐层节点数先从4开始训练,逐步增加到12时,当数值 为10时预测结果较好。允许误差为0.001,训练3217次达到训练要求。

采用1978~2004年的数据作为第一组训练数据,2005-年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007-年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表1所示。

3.2.4 数据分析

从2000-2004的拟合数据来看,相对误差比较小,BP网络对整个模拟数据的拟合程度还是比较好的,但是从2005-2009的预测数据来看预测数据的误差还是比较大的,这也说明对未来的预测是很难的。各种不确定的因素在起作用。

3.3 三种产业增加率BP确定法预测GDP

3.3.1 样本数据训练

将1978-2004年数据对输入网络进行训练。然后把需要预测的样本2000-2004年的样本数据输入网络,得到结果,然后用反归一化公式获得结果。在Matlab7.0中调用newff函数,建立一个3个输入节点、18个隐含层节点、一个输出结点的BP神经网络,隐含层和输出层转移函数分别采用tansig和logsig,训练函数选择traindx,允许误差为0.001,训练1748次达到训练要求。

采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表2所示。

3.3.2 数据分析

从预测数据来看预测数据的误差尽管比上一种类型的数据要好,但是误差还是比较大的,但是考虑到预测的能力 ,数据还是可以接受的 。但是数据误差还是比较大的,这也说明对未来的预测是很难的,不是十分确定的,有些文章的数据精确度挺高的,但我想应该是不太可能的,也许有故意凑数据的嫌疑。如果预测一年的话,可以通过调整参数获得近似结果,但是很多年就很困难。

3.4 使用RBF在以浙江省过去的每年的GDP增长指数的基础上进行RBF神经网络预测.

3.4.1 RBF 神经网络模型设计

该种方式与第一种BP神经网络预测方法类似, 以以前四年的GDP增长率作为输入,后两年加以预测的年作为输出。输入层节点数为n=4,输出层节点m=3.而隐含层节点数的选择是采用matlab的newrbe自动来设置.然后用同一样本进行训练。

3.4.2 样本数据训练和数据预测

1) 采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表3所示。这儿采用newrbe函数,spread参数为0.25。这是因为通过测试采用0.25获得的数据结果较好。

3.4.3 数据分析

从实验数据看,RBF对整个模拟数据的曲线拟合程度是相当完美,但是从2005-2009的预测数据来看预测数据的误差还是比较大的,这也说明RBF神经网络尽管曲线的拟合程度比BP网络好 ,但是从预测的能力来讲,并不比BP网络好,反而通过试验显得更差一些。这仍然表明对未来的预测是很难的。各种不确定的因素在起作用。神经网络的预测也只能作为参考之用,不能对各种的突发事件进行预测。

3.5 使用RBF三种产业增加率确定法预测GDP

3.5.1 RBF神经网络模型设计

该种方式与对应的BP神经网络预测方法类似, 以一年的三种产业增长率作为输入,后一年的GDP增长率预测作为输出。本次实验采用RBF神经网络建立浙江省经济发展的的预测模型。输入层节点数为n=3,输出层节点m=1.而隐含层节点数的选择采用RBF自动的newrbe方法实现。

3.5.2 数据处理

1) 采用1978~2004年的数据作为第一组训练数据,2005年数据作为仿真预测数据,通过神经网络预测GDP。采用1978~2005年的数据作为第一组训练数据,2006年数据作为仿真预测数据,通过神经网络预测GDP, 采用1978~2006年的数据作为第一组训练数据,2007-年数据作为仿真预测数据,通过神经网络预测GDP,依次类推,产生结果如表4所示。

3.5.3 数据分析

但是从2005-2009的预测数据来看预测数据的误差比上一组得RBF的误差还要大,几乎有点难以接受。这也说明RBF神经网络尽管曲线的拟合程度比BP网络好,但是从预测的能力来讲,并不比BP网络好,反而我通过试验更差一些。2009年的数据变得极为不合理,从而导致数据的偏差性很高。,从测试数据可看出,但是由于经济运行的复杂性,以及不可预知性,特别是由于2008的美国金融导致的世界范围的经济危机,导致经济数据的不可靠性大大增加,历史数据变得用处不太大。2009年的数据变得极为不合理,从而导致数据的偏差性很高。

4 总结与归纳

从我们的试验来看,各种神经网络的确可以对未来进行预测,但是精度多高却有一些问题,从我们的试验来看BP神经网络的数据要比RBF神经网络的数据要好,但是也只在一定范围内 ,四种检测方法,只有一种数据还略微能够接受。神经网络预测仍然需要不断的完善。

参考文献:

[1] 张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2009.

[2] 高隽.人工神经网络原理及仿真实例[M].2版.北京:机械工业出版社,2007.

[3] 韩力群.人工神经网络理论、设计与应用[M].2版.北京:化学工业出版社,2007.

第8篇

关键词: 神经网络知识库 多神经网络集成 方法研究

随着我国科学技术的不断发展,神经网络技术已经获得广泛的应用,在我国的多个领域中使用,且已经小有成就。但是在使用的过程中还不成熟,仍存在很大的不足和问题,这就需要工作人员进行反复的试验和计算,以获得有关于神经网络的模型。神经网络模型在使用的过程中,会受到操作人员的影响,因此结果表现出来的也就不同。神经网络在实际使用的过程中,操作人员多是缺乏专业知识水平的普通工作人员,这就导致神经网络模型的使用效果得不到保障,因此需要系统的、可靠的神经网络模型操作的应用体系。

一、多神经网络集成方法

1.在神经网络知识库基础上发展而来的神经网络集成应用体系

在神经网络技术应用的过程中,要对工作人员所具备的神经网络方面的知识和经验进行培训,可以通过多元化的神经网络来学习和积累与神经网络有关的知识,神经网络所具备的实用性将获得大幅度的提高。现阶段,我国与神经网络技术有关的工程都较为复杂,大多数的工程都具备独立性较强的子系统、功能单元及部件等,将原本复杂的系统分解成多个简单的小系统。因此工作人员在遇到复杂的系统问题时,可以将复杂的问题分解成多个相对独立的部件、功能单元或者是子系统,进行信息资料的输出或者是输入。使用神经网络技术得到相关子系统的特点信息之后,就能够以此为基础面对系统复杂的问题,例如系统中的辨识度问题、同一个系统中包括多个子系统的神经网络问题等。

在上述想法的基础上,对神经网络知识库进行构建,并逐渐完善神经网络集成体系的框架。是按照将复杂的神经网络问题分解成多个子系统的神经网络问题,而不是针对一个相对较复杂的问题进行的。将复杂问题分解成多个子系统,能够充分体现复杂的神经网络技术所具备功能,并为神经网络问题的分类提供便利,不仅可以提高解决问题的工作效率,而且可以积累神经网络方面的经验。在神经网络问题的实际解决过程中,如果子系统所具备的属性是对数据资料的输出和输入是固定的话,就需要子系统记住这些匹配。也可以是将神经网络子系统中存在的知识库与神经网络中的仪器设备相匹配,那么在进行相关信息的输入时,就可以对神经网络知识库中的连接权、阈值等相关参数进行调用,而不进行反复性质的神经网络学习,这时神经网络所具备的功能就是对函数进行传递。如果在子系统的神经网络知识库中存在与子系统属性相匹配的网络部分,就需要在神经网络知识库中找到与初始值和缺省值相匹配的经验值,将其作为基础就可以对神经网络的子系统的连接权、阈值等相关参数进行训练;如果神经网络的知识库中不存在与子系统属性相匹配的网络部分,就要对神经网络的样本进行训练,并在神经网络问题求解的过程中对网络结构的设计和计算方法等进行学习和训练,以求真正与神经网络的知识库相融合。在神经网络知识库基础上发展而来的多神经网络集成体系如下图所示:

图 在神经网络知识库基础上发展而来的多神经网络集成体系

2.多神经网络集成的方法与流程

从神经网络的有关资料可以看出,多神经的网络集成体系中存在多个子系统且属于多层并联或者串联的结构体系。从资料明显可以看出,子神经网络系统的结构较为简单,为神经网络进行计算和训练等操作提供了便利。在对复杂的网络问题进行分解的过程中,要进行反复的摸索和计算,以求得到最优化的结果,并把结果存储在神经网络的知识库中,为下一次的操作提供经验和学习的基础。在神经网络系统中存在多个层次,可以将位于下一层的输出当做是上一层的输入使用,位于同一层次的神经网络都可以被上一层的神经网络使用,直到到达神经网络的顶层为止。

二、在BP网络集成的基础上进行非线性的研究案例

本文通过复杂的非线性函数案例对神经网络的集成方法进行验证,以有效证明神经网络集成方法所具备的有效性、稳定性、可靠性和可行性。在神经网络函数的研究过程中,人们一直都比较注重对神经网络函数逼近原理进行研究,但是没有更为明确的说明。

1.非线性函数逼近原理的举例描述

通过神经网络进行函数的非线性映射的描述,函数F■(x■,x■)中的x■,x■要符合以下要求:x■,x■∈[-1,1]。函数表示为:

F■(x■,x■)=sin■∈(πx■)+cos■(πx■)+2sin(πx■)cos(πx■)

在函数中根据x■=x■=0.05的原则进行取点的操作,并对函数进行神经网络的输入和输出操作的训练,以求得出函数公式最理想的输出结果。

2.函数问题的解题方法

(1)在函数公式求解的过程中,需要用到神经网络知识库中的逼近原理。

(2)在函数公式求解的过程中,需要进行反复的摸索和拼凑,以实现对神经网络拓扑结构的设计,通过BP算法的使用,实现对函数公式求解的目的。

(3)在函数公式的求解过程中,如果使用多神经网络集成方法的话,就要对神经网络的结构进行设计,以为函数公式的求解提供便利。

F■(x■,x■)=sin■(πx■)+cos■(πx■)+2sin(πx■)cos(πx■)

=(sin(πx■)+cos(πx■))■

根据神经网络中可以将复杂的问题进行分解成多个子系统的原则,将函数公式分解成以下四个简单的函数问题:

f■(x■)=sin(πx■)

f■(x■)=cos(πx■)

f■(f■,f■)=sin(πx■)+cos(πx■)=f■f■

F■(f■)=f■■

对分解之后的函数公式进行求解,通过BP算法的求解,从而达到对函数公式求解的目的。

3.函数求解过程中所使用的方法对比

在使用神经网络进行求解的过程中,神经网络的结构呈现出较为复杂的特点,由于缺少经验作为基础,因此只能进行多次的尝试和摸索,比较花费人力,浪费时间,得到的结果还不理想,存在一系列的问题,例如速度慢、规律复杂等。本文介绍的案例就进行了反复的尝试,得到的输出三维图与最理想的三维图之间还存在差异。

把原来较为复杂的函数公式分解成多个简单的函数公式之后,在通过多神经网络集成方法进行求解的过程中,每个函数公式都很简单,在训练的过程中,也不存在大量的拼凑和尝试,能够在短时间内就确定函数公式结构的参数。将与函数公式有关的阈值和训练值等都存储在神经网络的知识库中,在遇到同类型的函数公式求解时,就可以从神经网络知识库中直接调用即可,不仅计算的速度快,输出结果的精确度也很高。通过神经网络集成方法找到的函数公式的输出三维图,与最优的三维图之间非常的相似,差异不大,可以忽略不计。

三、结语

在神经网络知识库的基础上使用多神经网络集成方法进行问题的求解时,不仅可以大大节省求解所用的时间,而且可以大大提高输出结果的精确度。可以将复杂的问题分解成多个简单的问题,以提高神经网络的工作效率,对计算方法进行创新和发展。

参考文献:

[1]林民龙.基于神经网络集成的增量式学习[D].中国科学技术大学,2012.

[2]唐东波.基于神经网络集成的电信客户流失预测建模及应用[J].大众商务,2010(06).

[3]李明爱,王蕊,郝冬梅.基于神经网络集成技术的运动想象脑电识别方法[J].北京工业大学学报,2011(03).

[4]刘大有,张冬威,李妮娅,刘杰,金弟.基于网络聚类选择的神经网络集成方法及应用[J].吉林大学学报,2011(04).

[5]潘远.粗集约简的神经网络集成在遥感影像分类中的应用[D].辽宁工程技术大学,2012.

第9篇

关键词:仿生算法;神经网络;遗传算法

中图分类号:TP183文献标识码:Adoi: 10.3969/j.issn.1003-6970.2011.03.017

An Improved Algorithm of Bionic Research and Analysis

Yue Tong-sen, Wang Da-hai

(XinXiang Vocational and Technical Collage, Xinxiang 453000,Henan,China)

【Abstract】In this paper the bionic algorithm of neural network and genetic algorithm were analyzed and summarized, aimed at slow speed of neural network training, recognition efficiency low, and genetic algorithm the optimum choice premature convergence problem, combined with neural network method and genetic algorithms of their respective characteristics, puts forward the improved algorithm.Without the destruction of single neurons based on input weights, adopt data pretreatment methods to reduce the number of input layers, so as to improve the ability of evolutionary learning.

【Key words】Bionic algorithm; Neural network; Genetic algorithm

0引言

人工神经网络[1]和遗传算法[2]是仿生算法[3]的典型方法,它们的优化问题一直是众多研究者所倍为关注的研究热点之一。在人工神经网络和遗传算法结构的研究中发现,人工神经网络具有很好的模式分类的特性,遗传算法有很好的动态变更权值的特性,基于此,本文提出了一种改进的基于人工神经网络和遗传算法的算法。本章的改进算法,就是对人工神经网络和遗传算法进行了变换,增强了对输入权值的变化速度,并提出用减少输入层个数的方法是加快神经网络学习的有效方法,取得了良好的实验效果。

1神经网络和遗传算法的特究点

1.1神经网络和遗传算法的不同点

1.神经网络是多层感知机,而遗传算法是单层感知机。神经网络是由输入层,隐含层和输出层够成,但遗传算法的基因组是一个数组,不管基因的长度有多长,其结构仍然是一个单层感知机。

2. 神经网络的隐含神经元个数是不确定的,而输出层和输入层的个数是可以确定的。我们希望输入层的个数用新的方法得到降低,这样神经网络的训练速度就可以提高。同时对于隐含层的层数,一般情况设为1。每层的神经元个数也并不是越多越好,是要根据问题的情况而变动的。但神经网络的隐含层是不确定的,而且隐含层的个数也是不确定的。对于遗传算法,它的二进制的长度是可以确定的,但是交叉和变异的比例是变动的。对于单点交叉比例,我们可以设定为黄金分割点。虽然设定为黄金分割点作为单点交叉比例没有用数学方法严格的证明,但是,大量的实验表明,选择黄金分割点往往可以得到较好的结果。对于变异比例,没有交好的方法确定,只能设计交互式的实验来调试决定。

3.权值的更新方式不一样。神经网络的权值的更新方式是时时的,而遗传算法权值的更新方式是批量的。

4.两者应用的范围不一样。神经网络主要应用于模式匹配,错误诊断,监视病人的状态,特征提取,数据过滤。而遗传算法主要应用在计算机辅助设计,日程安排,经济学的投资研究等。

1.2神经网络和遗传算法的相同点

1.有教师的学习。神经网络的输出是有目标的,当然是确定的。同时对于遗传算法的目标也是确定的。所以两者都是有目标的,也就是有教师的学习。

2.随机近似优化过程。神经网络中,如果把网络的权值初始化为接近于0的值,那么在早期的梯度下降步骤中,网络将表现为一个非常平滑的函数,近似为输入的线性函数,这是因为sigmoid函数本身在权值靠近0时接近线性。同样,遗传算法的初始个体都是随机产生的,它的交叉和变异都是一个不断近似的过程。

3.并行化。神经网络的每个神经元是独立的,如果把每个神经元分配一个处理器,那么就可以采用并行的方式。同样,遗传算法很自然地适合并行实现,有粗粒度并行方法和细粒度并行方法。有粗粒度并行方法就是把群体细分成相对独立的个体群,称为类属,然后为每个类属分配一个不同的计算节点,在每个节点进行标准的GA搜索。细粒度并行方法就是给每个个体分配一个处理器,然后相邻的个体间发生重组。

2算法的研究及改进

结合人工神经网络和遗传算法的研究的本质,通过两种算法结合的研究及改进,提高算法的收敛速度,从大量的数据中模拟生物的特性来完成特定的任务和解决问题的方法和方向。由于遗传算法是单层感知机,而神经网络是多层感知机,所以可以从多层感知机的多层性,我们想象为遗传算法是单层感知机作为神经网络是多层感知机的输入层。这样,我们就可以采用遗传算法的动态变更权值的特性来对神经网络输入层有效性的遗传和变异。这种算法适合与没有输入,只有输出的应用,就像无人驾驶技术中控制行驶的速度和方向的控制一样。基本的框架如图1:

图1结合人工神经网络和遗传算法的框图

Fig.1 Combined with artificial neural network and genetic algorithm diagram

最上面的是智能体,神经网络的输出来控制智能体,控制中心将神经网络的权值用遗传算法的初始体来提供。

2.1遗传算法的基因作为神经网络的权值变量

遗传算法的基因的初始化必须要满足神经网络的输入要求,一般遗传算法的基因都是0,1编码。但是为了达到神经网络的输入要求,是要在(-1,+1)之间随机产生。

2.2遗传传算法中杂交点选择

遗传算法中,一般都是采用随机平均变异[4][5]的方式,但是如果输入是由遗传算法的基因提供的话,为了保证在变异的时候,采用标记变异的方法。我们可以首先根据图2的神经网络来考虑:

图2遗传算法作为人工神经网络和的权值图

Fig.2 Genetic algorithm as artificial neural network and the weights of figure

很显然,(0.3,-0.8,-0.2)是神经元1的权值 ;(0.6,0.1,-0.1)是神经元2的的权值;(0.4,0.5) 神经元3的权值。为了在遗传算法中的杂交过程中,不破坏每个神经元的权值个数,特意标记(3,6)所在的箭头。

2.3引入神经网络输入层的数据预处理

神经网络的计算问题是神经网络应用中最为关键的问题。如何提高网络的训练速度是算法研究的重点。我们在思考问题的时候,总是希望问题越简单越容易解决。同样,我们也可以通过对数据的预处理,来降低问题的难度。

为了减少输入层的个数,我们可以先对数据进行预处理。预处理的方法为如下流程:

(1).计算机器人前进方向Position(x,y)和目标的所在的位置Location(x,y)。

(2).归一化Position(x,y) 和Location(x,y)。

(3).用点乘的计算公式计算两者点乘。

(4).用符号重载的方式计算是顺时针还是相反。

(5).计算角度=第3步的结果*第4步的结果。

3实验结果及分析

3.1实验框架

将本算法应用于扫雪机器人的智能控制中,设计的主要模块:

3.1.1神经网络部分的设计

神经网络的输入由四个变量组成:扫雪机器人方向向量(由两个变量组成,即在X和Y的分量),发现目标,即雪的向量(由两个变量组成,即在X和Y的分量)。神经网络的隐含层由一层组成,而且由10个神经元。神经网络的输出由两个变量组成,V1和V2,分别作用在机器人的左轮和右轮上。神经网络的响应函数采用SIGMOD。

3.1.2遗传算法部分的设计

遗传算法的初始化是为神经网络提供权值,所以是由[-1,1]随机数产生。遗传算法的变异是采用随机变量的变异,选择采用轮转法。

3.1.3扫雪机器人

扫雪机器人用神经网络来控制,当找到目标后,它的适值就加一。这样就随着发现目标越多,它的适值就越大。学习能力是通过不断的学习后,它的适值就会加强。如果直接采用机器人前进方向和目标的所在的位置,那么神经网络的输入为四个变量。

3.2结果与分析

如果直接采用机器人前进方向和目标的所在的位置,那么神经网络的输入为四个变量。通过对扫雪机器人的学习过程,没有进行预处理的数据,即四个变量输入神经网络后的参数设定:神经网络的输入为4,神经元为6个,输出个数为2个,如图3所示:

图3网络的参数设定图

Fig.3 Network parameters set figure

我们设定初始的适值为0,如果发现一个目标后,它所对应的适值就加上1,这样经过50次的进化后,没有进行数据预处理的最大值是25,平均值是10.1333。如表1所示:

将50次的统计结果用柱状图进行对比,如图4所示。

图4进化50代后的加入数据预处理和没有加入预处理的对比图

Fig.4 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram

为了减少输入层的个数,我们可以先对数据进行预处理下面,用统计的方法对数据进行的结果分析,如表2所示。

将进化100代后,对比两者的对比柱状图如图5所示。

图5进化50代后的加入数据预处理和没有加入预处理的对比图

Fig.5 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram

实验结果表明,为了减少输入层的个数,先对数据进行预处理。通过对扫雪机器人的过程的数据分析进行分析,数据预处理后的智能进化学习能力相对于原始数据的智能进化学习能力有明显的提高。

4结束语

本文提出了基于神经网络和遗传算法结合的改进算法,对于遗传算法的变异操作进行改进,不会破坏单个神经元的输入权值的基础上,采用数据预处理的方法来减少输入层的个数,从而提高进化学习的能力。从实验数据中可以看到,本章提出的改进算法加快了学习速度,达到了提高智能学习的预期

目的。

参考文献

[1] 乔俊飞,韩桂红.神经网络结构动态优化设计的分析与展望[J].控制理论与应用,2010,3(13):350-357.

[2] 葛继科,邱玉辉,吴春明,等.遗传算法研究综述[J].计算机应用研究,2008,10(9):2911-2916.

[3] 丁建立,陈增强,袁著祉.智能仿生算法及其网络优化中的应用研究进展[J].计算机工程与应用,2003,12(3):10-15

[4] 巩敦卫,等.交互式遗传算法原来及其应用[M].北京:国防工业出版社,2007.

第10篇

关键词:电气设备;故障诊断;神经网络;学习算法

中图分类号:TP183

近年来,随着电气设备复杂度的增加,其发生故障的概率也逐渐上升。即使是熟练工程师,面对日趋复杂的设备内部电气结构,也难以迅速分析及判别其故障原因。与此同时,涌现出的各种智能算法、专家系统等,为设备诊断问题提供了可行的方案。其中,神经网络以其特有优势在电气设备故障诊断中发挥了重要作用。神经网络理论是人工智能、认知学、脑神经学、信息学等诸多学科融合发展的结果,它是由大量简单的处理单元(称为神经元),通过广泛的互相连接而形成的复杂网络系统。神经网络具有学习能力,可以根据电气设备的正常历史数据训练,将训练结果信息与当前测量数据进行比较,以确定故障。同时它具有滤除噪声的能力,这使其能在噪声环境中有效地在线监测及诊断。其具有的分辩故障原因及类型的能力,为未来实现故障智能诊断奠定了基础。本文介绍神经网络结构及其学习算法,提出一种基于BP网络的电气设备故障诊断方法,通过网络训练及结果测试表明,该方法具有良好的故障诊断能力。[JP]

1 BP神经网络模型

神经网络有很多模型,例如BP网络、Kohonen,Hopfield及ART等。其中,反向传播网络(Back[CD*2]Propagation Network)在神经网络的实际应用中有着十分重要的影响,工程应用中的绝大多数网络模型都采用BP模型或其变形,可以说BP模型体现了神经网络中的精华。

1.1 BP神经网络模型

以三层前向BP网络为例,对神经网络结构进行分析,其组成包括输入层、隐含层和输出层。如图1所示,图中圆圈表示神经元,Wir表示输入层第i个神经元与隐含层第r个神经元的连接权值;Vrj表示隐含层第r个神经元与输出层第j个神经元的连接权值;其间的连线表示神经元之间的相互作用强度。И

从图1的结构中可以得到,隐含层节点的输出函数和输出层节点的输出函数分别为:

式中:Tr和θr分别为隐含层和输出层的单元阈值。在本文设计的BP神经网络结构中,式(1)中的f(•)采用sigmoid函数,即f(x)=(1+e-x)-1。И

1.2 BP学习算法

BP模型的成功得益于BP算法的应用,即误差反向传播算法。BP算法属于梯度下降算法,是一种监督式的学习算法。用网络的实际输出与目标矢量之间的误差来修正网络权值,使输出与期望尽可能接近(网络输出层的误差平方和达到最小);通过反复在误差函数梯度下降方向上调整网络权值的变化,逐渐逼近目标。每次权值和偏差的变化都与网络输出误差的影响成正比,并以反向传播的方式传递到每一层。BP网络是由两部分组成:信息的正向传递和误差的反向传播。

设神经元的输入矢量为[WTHX]X[WTBX]=\[x1,x2,…,xn\],其中n是输入层的神经元数。对应于输入[WTHX]X的输出矢量是Y[WTBX]=\[y1,y2,…,ym\],其中m 是输出层的神经元数。如果要求网络的期望输出是[WTHX]T[WTBX]=\[t1,t2,…,tm\],г蛭蟛詈数可以定义为:

BP算法采用梯度下降法来调整网络的权值,以使上述误差函数减小,即:

Иw(n+1)=w(n)-η(E/w)[JY](3)И

式中:常数Е鞘侨ㄖ档髡速率,通常取值0.01≤η≤1。权值WУ牡髡方法采用以下公式:

式中:ИΔwpq表示某层第p个节点到下一层第q个节点的权值修正量;xp表示节点p的输出;δq表示节点qУ亩说愕燃畚蟛,由输出层的等效误差反传而来:

式中:对应BP模型网络结构(见图1);节点q位于输出层;节点h位于隐层。

2 电气设备故障检测实例

在电气设备中发动机是故障率比较高的设备之一,其在故障诊断中比较具有代表性。在此,以发动机为例,分析BP神经网络在电气设备故障诊断过程中的一般模式及步骤。

2.1 网络样本选取及参数选择

分析发动机的常见故障模式,首先选择具有代表性的故障作为特征向量,取[WTHX]X[WTBX]=[x1,x2,x3,x4]作为神经网络的输入。其中:x1代表功率不足故障;x2代表声音异常故障;x3代表排气温度高故障;x4代表消耗量过大故障。通过分析故障原因,取[WTHX]Y[WTBX]=[y1,y2,y3,y4,y5]作为目标输出向量。其中:y1代表点火不正确;y2代表高压线圈损坏;y3代表出现燃爆现象;y4代表进气排气管故障;y5代表增压积炭过多故障。表1给出了输入故障现象[WTHX]X和输出原因分析Y[WTBX]е间的对应关系。

由此可知,在设计基于三层BP神经网络的发动机故障诊断系统中,输入层神经元节点数N=4,输出层神经元节点数M=5。由公式h=(N+M)+σ可得隐含层神经元节点数h取3~6之间的数。И

2.2 训练及测试

通过输入样本组对所设计的网络进行训练,选择训练误差为10-6。例如,输入样本[WTHX]X[WTBX]=[0,0,1,0],调整网络状态,使其输出接近目标[WTHX]Y[WTBX]=[1,0,0,1,0],即当发生排气温度过高故障时,可能原因是点火不正确以及进气排气管问题。训练网络的过程,实际上就是调整网络参数的过程,具体来说,最主要的就是确定各个网络权值。最终训练好的网络在测试过程中,能较为准确地诊断出故障问题的原因。在工程使用过程中,选择故障检测过程中各种仪器测量出来、有代表意义的测量数据,根据先验知识及专家分析,组成输入样本和目标向量组,对设计的网络结构训练。在训练过程中,可增加输入样本的数量。因为通过大量样本训练,神经网络能具有更好的适应性和鲁棒性,其故障诊断的准确性有所提高。采用C++builder及Matlab混合编程,前者负责做界面系统的开发,后者集中在神经网络算法的设计上,据此进一步提高本工作的实际应用能力。

第11篇

关键词:刀具振动;MATLAB;BP神经网络;RBF神经网络

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)04-0939-03

Research on Cutter Vibration Trend Forecast based on Neural Network

NIU Yu-sheng

(School of Mechanical Engineering&Automatization,North University of China,Taiyuan 030051, China)

Abstract: In the machine processing, cutter vibration usually have a negative effect on the workpiece. Therefore, the research on the trend of cutter vibration is particularly important. The forecast for vibration signals is consider as time -series forecasting. So The BP and RBF neural network were adopted to establish nonlinear models for predicting a time series. The results show that the RBF neural network has higher accuracy.

Key words: cutter vibration; MATLAB; BP neural network; RBF neural network

在机床加工中,刀具的振动会给工件及刀具本身带来不小的负面影响[1]。若在加工过程中产生了振动现象,则会使刀具与工件间产生相对位移,在加工零件表面会产生振痕,导致零件的表面质量以及性能受到影响,尤其是在贵重零件的加工中,会带来难以衡量的损失;其次,振动本身对刀具及刀架系统也会带来磨损。因此,对刀具的振动信号进行预测就有不小的意义。刀具的振动信号以振幅来测量,可以看作是对时间序列的预测。由于人工神经网络的具有高度的非线性映射能力和自适应能力等优点,使其在时间序列预测中得到广泛的关注,此处,分别采用BP神经网络和RBF神经网络对振动信号进行预测。

1刀具振动信号采集

采用手持式测振仪(CZ9500A测振仪),将仪表探头对准被测刀具的刀架上面,则加速度传感器信号经滤波放大得到加速度信号,然后经一级积分得到速度信号,此信号再经一级积分便得到位移信号,这三种信号经测量选择开关选择出一种信号,进行交直流转换和A/D转换,最后送三位半液晶屏显示。只选位移信号,测得数据如下图1。

图1刀具振动信号

由图可看出刀具振动位移没有什么规律,大部分振幅位于0.07-0.23*10-4米之间,且其中有几个峰值过大,在预测时会带来不小困难。

2 BP及RBF神经网络的设计

人工神经网络(Artificial Neural Networks, ANNs),也常称为神经网络(NNs),是模拟生物神经网络进行信息处理的一种数学模型[2]。根据解决时间序列预测需要,故采用BP和RBF神经网络。BP网络是一种多层前馈型神经网络,可以实现从输入到输出的任意非线性映射[3]。RBF网络能以任意精度逼近任意连续函数[4]。网络的设计及运行是在MATLAB语言中完成的。

2.1训练及测试样本集设计

在MATLAB中,刀具振动的时间序列信号data是1行42列的矩阵。为了能够实现多步预测,需对时间序列做下变换。将时间序列步长设为p,运行MATLAB程序如下:

sampleXin=sampleYuan(data, p) data=data(:);

sampleXin=zeros(p+1, 42-p); for j=1:42-p

sampleXin(:,j)=data(j:j+p);

end

则时间序列data将由1行42列转化为p+1行,42-p列的样本集,如图2示。

图中4个部分Ptrain为训练输入向量,Ttrain是训练目标向量,Ptest是测试输入向量,Ttest是测试目标向量。样本集得到后,设定比例ratio=0.8,规定训练样本集和测试样本集比例为4:1.

2.2训练测试

2.2.1对于BP网络

输入层有p个神经元,输出层有1个元,BP网络隐含层h则不确定,需要训练取最佳值。网络隐含层神经元变换函数采用logsig型函数,输出层采用logsig型函数。网络训练函数采用trainlm。

经反复取p,h训练得当p=5,h=6时,效果比较好。见图3。

图3 BP神经网络的结果比较图

2.2.2对于RBF网络

输入层有p个神经元,输出层有1个神经元,隐含层不需要确定。用newrb()创建RBF网络,反复训练,当SPREAD=0.02 , p=6时效果最好。如图4。

3结果比较

两种网络的预测结果如表1所示。

由表1可见,RBF神经网络的预测精度明显好于BP神经网络,预测误差较小,能够满足要求。同时,RBF神经网络的训练时间,次数也要短于和少于BP神经网络。

4结束语

在预测刀具振动趋势时,RBF网络从训练时间,次数以及预测效果上比BP网络效果要好,并且网络稳定。对于刀具的振动趋势研究,具有一定的指导意义。

参考文献:

[1]蓝宗和.小议数控车削加工中刀具振动问题[J].广东科技,2009.6(214):94-96 .

[2]周志华,曹存根.神经网络及其应用[M].北京:清华大学出版社,2004.

第12篇

1小波神经网络学习算法

小波神经网络的网络结构和基本的BP神经网络类似,一般采用输入层、隐含层和输出层三部分。小波神经网络隐含层的转移函数采用小波函数,但小波函数的选取目前还未有统一的理论。Szu构造的Morlet小波函数。

2工程应用

2.1工程概况北京地铁6号线东延部分东部新城站至东小营站区间工程位于北京市通州区,起点为东部新城站,终点为东小营站。该区间由东部新城站向东,沿运河东大街北侧设置,沿线穿越绿地、宋郎路路口,到达东小营站,其中在宋郎路路口和运河东大街东南有多处雨水、电力和电信管线。区间穿越的地层主要有粉细砂层、局部夹粉质粘土层、中粗砂层。工程采用直径为6m的土压平衡盾构机进行施工。

2.2网络设计和数据采集小波神经网络的结构设计对预测结果影响较大,应充分考虑与施工相关的各种因素,如地表沉降的成因、工程地质条件和施工工艺参数等。盾构施工引起的地表沉降易受到以下因素影响:盾构施工区间的水文地质条件对沉降量的影响较大;当盾构机由于某种原因停止推进时,千斤顶会漏油回缩导致盾构机后退,引起盾前土体压力减小;盾尾脱空后,管片和土体之间存在空隙,由于注浆不及时,土体填充盾尾空隙引起土体局部塌落;盾壳移动引起土体的摩擦和剪切作用,在该作用力下土体产生变形;盾构改变开挖方向,往往会引起超挖现象,土体受到的扰动随之加大,引起土体局部变形破坏;开挖面的土体靠土仓压力来维持,但是在施工过程中,土仓压力和开挖面压力并不是出于完全平衡状态,这种不平衡状态容易引起土体的坍塌变形。综合考虑各相关因素,确定在对于地表沉降较为敏感的土体参数和施工参数中选取覆土厚度(H)、压缩模量(Es)、粘聚力(c)、天然密度(ρ)、内摩擦角(Ф)、千斤顶推力(F)和注浆压力(P)共7个参数作为神经网络的输入参数。小波神经网络的隐层节点数选择目前还没有成熟的理论依据,可参考BP神经网络的隐层节点选取,通过经验和实验分析以输入节点的2~4倍综合确定,最终选择为13。小波神经网络预测模型的网络结构为7-13-1。盾构施工引起的短期地表沉降对地表建筑和地下管线影响最大,且该施工区段地层变化较小,掘进速度基本不变,故可以选取盾构机通过该点50m后的稳定沉降数据。在施工单位提供的相关测量数据和地质资料中选取了51组数据,将其中36组作为训练数据,如表1所示。选择15组作为测试数据,如表2所示。

2.3地表沉降预测与分析根据选取的36组数据和已经确定的7-13-1的网络结构,分别建立小波神经网络和BP神经网络的预测模型。设定训练目标为0.001,BP神经网络的初始权值、阈值和小波神经网络的伸缩参数、平移参数分别在[-1,1]之间随机赋值。得到训练结果如图1所示。结果显示,经过1050次训练后小波神经网络的训练误差可以达到训练目标,而BP神经网络需要8500次训练才能达到训练目标。小波神经网络的训练速度相比于BP神经网络有较大优势。对于已经训练好的两种模型,使用相同的测试样本进行预测分析,得到的预测结果如图2所示,预测结果和实际测量值的误差如表3所示。可以看出,BP神经网络和小波神经网络的最小、最大误差分别为3.1%、27.3%,2.8%、14.5%,故小波神经网络的预测精度要好于BP神经网络,且预测结果均在工程允许范围内,可以依据此预测结果对现场施工控制参数的制定提供科学的指导。

3结论

盾构施工引起的地表沉降对施工安全影响较大,对其进行有效地预测,并以此作为依据对施工参数进行优化,可达到降低施工风险的目的,对于提高施工效率、确保施工质量、增加经济效益意义重大。本文选用小波神经网络模型对盾构施工地表沉降进行预测,得到以下结论:(1)小波神经网络的训练速度较传统BP神经网络有较大优势。(2)结合北京地铁六号线实地数据验证了小波神经网络用于盾构施工地表沉降预测的可行性。(3)小波神经网络的初始权值、伸缩参数和平移参数的选取还没有成熟的理论依据,如果参数选取不合适可能使小波神经网络陷入局部极小的情况,因此对于小波神经网络参数的优化选取还有待深入研究。

作者:季雁鹏郝如江宁士亮单位:石家庄铁道大学机械工程学院中国铁建中铁二十二局集团第一工程有限公司