时间:2023-05-30 09:58:49
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇模式识别,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
英文名称:Pattem Recognition and Aitificial Intelligence
主管单位:中国科学技术协会
主办单位:中国自动化学会;国家智能计算机研究开发中心;中国科学院合肥智能机械研究所
出版周期:双月刊
出版地址:安徽省合肥市
语
种:中文
开
本:16开
国际刊号:1003-6059
国内刊号:34-1089/TP
邮发代号:26-69
发行范围:国内外统一发行
创刊时间:1989
期刊收录:
CBST 科学技术文献速报(日)(2009)
EI 工程索引(美)(2009)
中国科学引文数据库(CSCD―2008)
核心期刊:
期刊荣誉:
联系方式
摘 要 该文在人工免疫系统和克隆选择原理的基础上,给出了clonalg算法,并对该算法的实现原理、参数选择等进行了详细研究;给出了利用该算法进行数字识别的实例。 关键词 克隆选择;人工免疫系统;数字识别 1 引言 生物免疫系统是一个高度进化的生物系统,它旨在区分外部有害抗原和自身组织,从而清除抗原并保持有机体的稳定。从计算的角度来看,生物免疫系统是一个高度并行、分布、自适应和自组织的系统,具有很强的学习、识别、记忆和特征提取的能力。人们希望从生物免疫系统的运行机制中获取灵感,开发出面向应用的免疫系统模型——人工免疫系统(artificial immune system, ais),用于解决实际问题。目前,ais已发展成为计算智能研究的一个崭新的分支。其应用领域逐渐扩展到了信息安全、模式识别、智能优化、机器学习、数据挖掘、自动控制、故障诊断等诸多领域,显示出ais强大的信息处理和问题求解能力以及广阔的研究前景。 克隆选择是一种常用的ais算法。本文主要探讨该算法在数字识别中的应用。 克隆选择原理最先由jerne提出,后由burnet给予完整阐述。其大致内容为:当淋巴细胞实现对抗原的识别(即抗体和抗原的亲和度超过一定阀值)后,b细胞被激活并增殖复制产生b细胞克隆,随后克隆细胞经历变异过程,产生对抗原具有特异性的抗体。克隆选择理论描述了获得性免疫的基本特性,并且声明只有成功识别抗原的免疫细胞才得以增殖。经历变异后的免疫细胞分化为效应细胞(抗体)和记忆细胞两种。 克隆选择的主要特征是免疫细胞在抗原刺激下产生克隆增殖,随后通过遗传变异分化为多样性效应细胞(抗体细胞)和记忆细胞。克隆选择对应着一个亲合度成熟(affinity maturation)的过程,即对抗原亲合度较低的个体在克隆选择机制的作用下,经历增殖复制和变异操作后,其亲合度逐步提高而“成熟”的过程。因此亲合度成熟本质上是一个达尔文式的选择和变异的过程,克隆选择原理是通过采用交叉、变异等遗传算子和相应的群体控制机制实现的。 根据克隆选择原理,decastro提出了克隆选择算法(clonalg算法)模型,并在模式识别、组合优化和多峰值函数优化中得到了验证。其算法的核心在于增殖复制算子和变异算子,前者与个体亲合度成正比,保证群体亲合度逐步增大,后者与个体的亲合度成反比例关系,保留最佳个体并改进较差个体。 2 clonalg算法 clonalg算法是根据克隆选择原理设计的免疫算法。解决问题时,一般把问题定义为抗原,而问题的解就是抗体集合。在特定的形态空间中,随机产生的抗体试图与抗原发生匹配,即尝试解决问题。匹配度高的抗体有可能产生更好的解,被赋予更大的克隆概率参与下一次匹配。 抗体和抗原之间的距离d采用汉明距离,如式(1)所示。
抗体和抗原之间的亲和力aff与它们的距离成反比,即aff=1/d。 免疫算法的实现步骤如下: 步骤1 初始化抗体集合,随机产生n个抗体。 步骤2 计算抗体集合ab中所有抗体与抗原ag的亲和力。 步骤3 选择n个亲和力最高的抗体,组成一个新的抗体集合。并将这n个抗体按照亲和力升序排列。 步骤4 将选中的n个抗体按照对应的亲和力进行克隆,产生新的集合c,亲和力越高的抗体,克隆的数量就越多,总的数量计算公式如式(2)。 nc是总的克隆数,式(2)右边是一个和式,其中第i项代表抗体abi产生的克隆数, 是预设的参数因子,n是抗体集合包含的元素个数。 步骤5 新的集合c按照基因重组概率进行基因重组,产生成熟的克隆集合c*。 步骤6 计算成熟克隆集合的亲和力。 步骤7 从成熟克隆集合中选择n个亲和力最高的抗体作为记忆抗体的候选,亲和力超过现有记忆抗体的候选抗体称为新的记忆抗体。 步骤8 替换掉亲和力最低的d个抗体,并用新的随机抗体补充。 步骤9 如果抗体集合没有达到匹配精度要求且进化代数小于最大进化代数,则转到步骤2,否则算法结束。
3 应用clonalg算法识别数字 模式识别技术是根据研究对象的特征和属性,利用一定的分析算法,确定研究对象的归属和类别,并使结果尽可能符合真实。一般模式识别系统都包括问题描述、系统训练和模式识别几个部分。 本系统要解决的问题是识别0到9这十个数字。每个字符都用一个长度l=120的二进制串表示(每一个像素用一个二进制数表示)。原始字符(待识别的字符)(抗原)如图1所示。
图1 待识别的字符(抗原) 抗体指令集由10个抗体组成,即取n=10。每次选中5个亲和力最高的抗体进行克隆,即n=5。参数 =5。变异率初始值pm=0.05,并根据进化情况进行变化。最大进化代数gen=100,匹配精度取0,即要求完全匹配。 10个抗原(待识别数字)都达到了完全匹配,具体匹配情况如表1所示。 表1 数字0-9的完全匹配代数 抗原(待识别字符) 0 1 2 3 4 5 6 7 8 9 完全匹配代数 36 42 54 47 47 53 49 42 40 53 从表1可以看出,该算法的收敛速度是很快的。 由于篇幅所限,下面仅以数字“3”为例,观察一下算法的实现过程。 图2 识别数字“3”的过程 图2中,第一排按照从左向右的次序:第1幅图是原始字符,第2幅图是随机产生的抗体集,第3幅图和第4幅图分别是进化到第10代和第20代的抗体集。第二排按照从左向右的次序:第1幅图,第2幅图分别是进化到第30代,第40代的抗体集。最后一幅图是进化到第47代的抗体集。进化过程中抗体与抗原的距离变化情况如表2所示。 表2 识别“3”时抗体与抗原的距离d的变化 进化代数 5 10 15 20 25 30 35 40 45 47 抗体与抗原的距离d 30 19 12 8 5 3 1 1 1 0 从表2可以看出,实际上进化到35代时,抗体与抗原的距离d=1,在大多数应用中,这已经可以很好地满足要求了。 4 总结 从上面的讨论可以看出,clonalg算法是一种高效、快速收敛的算法,非常适合应用于模式识别。 参考文献 [1] 阎平凡等著,人工神经网络与模拟进化计算,清华大学出版社,2000 [2] 陈慰峰著,医学免疫学,人民出版社,2001 [3] 李涛著,计算机免疫学,电子工业出版社,2004
关键词:CDIO;工程教育;主动学习;经验学习
作者简介:袁立(1978-),女,河北邢台人,北京科技大学自动化学院,副教授;李晓理(1971-),男,辽宁沈阳人,北京科技大学自动化学院,教授,博士生导师。(北京 100083)
基金项目:本文系教育部第五批高等学校特色专业建设项目“自动化CDIO特色专业建设”(项目编号:TS2422)的研究成果。
中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)04-0051-02
CDIO是由美国麻省理工学院、瑞典皇家技术学院、瑞典查尔姆斯技术学院、瑞典林克平大学等四所大学从2000年起合作研究探索的一种新型的工程教育模式。CDIO教育模式力图培养学生能够在现代的、基于团队的环境下构思(Conceive)—设计(Design)—实施(Implement)—运行(Operate)复杂、高附加值的工程产品、过程和系统,让其成为成熟、有责任感的人。[1]CDIO改革有三个总体目标,即教育学生,使他们能够更深层次地掌握技术基础知识,不是通过被动的听讲过程获取知识,而是让学生自己构建他们的知识,面对和纠正自身的错误理解;教育学生能够领导新产品、过程和系统的创造与运行,在此过程中培养学生的个人能力和人际交往能力,个人能力包括工程推理和解决问题的能力、科学探索、系统思维和批判性及创造性思维,人际交往能力包括交流沟通和团队工作能力;第三个目标是使学生能够理解和研究技术发展对社会的重要性和战略影响。可以看出,CDIO模式注重扎实的工程基础理论和专业知识的培养,并通过贯穿整个人才培养过程中的团队设计和实践环节的训练,从而培养既有过硬的专业技能又有良好综合素质的国际化工程师。[2]
作为高等工程教育的一种新的教育理念,CDIO模式受到越来越多工程学科的重视。北京科技大学(以下简称“我校”)自动化专业在2009年以自动化专业工程化、钢铁流程自动化为工程背景和专业特色加入了CDIO项目。“模式识别”课程是模式识别与智能系统学科的基础课,是一门基础理论与工程实践相结合的课程。本课程主要讨论统计模式识别的分类和识别基本原理、方法。要求学生掌握统计模式识别的基本概念、基本识别原理和方法,了解其发展动态,有效地运用所学知识和方法解决实际问题,为研究新的模式识别的理论和方法打下基础。[3,4]那么如何在该课程的教学过程中培养学生的综合素质,满足学科学习和能力学习的双重目标,成为需要迫切思考的问题。本文在深入研究和分析“模式识别”课程现有教学模式的问题和不足的基础上,探索将CDIO教育理念引入该课程,进行教学设计、规划教学方案、确定教学手段、安排教学内容和考核方式,以促进学生综合能力的培养。
一、“模式识别”课程传统教学模式中存在的问题
“模式识别”课程从应用角度来看,属于人工智能、机器学习的领域,从学术内涵角度来看是进行数据处理、信息分析的学科。该课程在纵向上与概率论、数理统计密不可分,在横向上注重与数字图像处理、信号处理、通信原理等专业课程有关联。可见,该课程对于巩固已学知识、开展后续专业课学习及未来工作具有积极的指导意义。
该课程内容本身比较抽象性,其概念、原理和方法都隐藏在数学符号中,讲课过程中学生往往会感到枯燥、难懂。教师的讲解和学生的学习难度都比较大,理论知识学完后学生对于其实际应用有时仍是一头雾水。传统教学模式下存在以下一些问题:在教师的授课环节中,往往以教师的授课为中心,而不是以学生为主体,这种重“教”轻“学”的模式不利于学生对基础知识的掌握;课时的安排上,总课时(32学时)中28学时为理论授课,4学时为实验。在实验环节中,学生上机动手编程,根据课上内容设计相应的分类器实现。这种课时安排不利于充分开展工程项目实践活动,使学生失去了了解模式识别在工程项目中真实应用的机会,限制了其对专业技能的掌握;在实验环节中,实验内容的安排基本上以个体为单位的验证性实验为主,缺乏多人合作的设计性、综合性及创新性的实验,不利于学生团队协作能力、批判思考能力、综合解决问题能力及创新能力的综合培养。
可见,以上重理论轻实践、强调个人学术能力而忽视团队协作精神、重视知识学习而轻视开拓创新的培养模式与CDIO理念还有很大差距。
二、基于CDIO的“模式识别”课程教学改革探索
针对目前“模式识别”课程教学中存在的问题对原有的课程体系进行改革,以适应CDIO教育模式下的人才培养目标。我校按照CDIO教学大纲的标准来进行教学设计和教学活动的安排,进行如下一些主要的变革:
第一,从教学内容的安排上进行改革。在教学过程中优化、精选教学内容,确保教学内容相对稳定而又不断地更新,保持内容的先进性。对基础理论部分如贝叶斯决策理论、线性与非线性判别函数、近邻法和集群、聚类分析、特征提取与选择等知识单元,将主要精力放在精讲、训练与总结这三个环节,对重点、难点讲深讲透。此外,还根据模式识别领域最近的发展,引入最新科技成果,为学生适当补充统计理论与支持向量机、流行学习理论和稀疏编码理论等知识。另外,还从横向上注重与同一层次相关课程(如“数字图像处理”)的关联性,使学生把从不同课程上学到的知识整合起来,为将来从事工程项目活动打下基础。
第二,从教学方式上进行改革。传统授课方式的一般模式是:教授、复述、周作业、期末一个小的设计项目和最终笔试。要改变这种以教师为中心的教学方式,按照CDIO专业计划中提倡的一体化学习的思想来完成教学任务。为了考试而死记硬背理论知识会使学生对学习内容理解肤浅,缺少长期学习的积极性。所以在教学中采用主动学习方式使学生直接参与思考和解决问题的活动,让学生思考概念,特别是新的想法,并要求他们做出明确地反应,使他们明白学到了什么和怎样学习的。
主动学习方法在课堂教学中有许多灵活的手段,比如授课疑点卡、概念问题、小组讨论等等。授课疑点卡通过收集课堂上的反馈来测定学生在理解方面的不足。针对学生提出的问题,教师可以在课程的网页上回答,也可以在下次课的开始时回答。对学生来讲,写下问题的过程有助于他们组织思路并进行更有效地学习;对教师来讲,这些疑点卡能及时纠正学生的错误的理解,并帮助教师改进后续的内容。概念问题是一个多项选择题,用来收集学生对课堂上的反馈,从而了解学生是否理解教学内容并纠正学生的误解之处。教师在课前把“模式识别”的重要概念以及通常可能的错误理解准备成问题,在课堂上适时提出来,学生通过举手来回答即可。根据回答情况,学生可进行讨论或由教师进行点评。小组讨论:对于一些相对简单的内容,让学生提前预读,在课上采用分组讨论、学生讲解、教师总结的方式进行。
第三,采用经验学习法为学生创造建立信心的机会。工程教育的CDIO教学模式正是基于经验学习理论的。经验学习让学生能够在模拟工程师角色和工程实践的环境中进行教学活动。对大多数学生而言,学习和理解理论的动力就是应用理论并与实践相结合。通过实践学习能激发他们更大的积极性,并使他们认识到所学的知识是有用的,学习积极性的提高使他们对所学的知识和即得能力更有信心。其结果是让学生有能力胜任未来工程师的角色。
常用的经验学习方法就是基于项目的学习。在授课过程中增加模式识别应用项目的内容,如字符识别、车牌识别、人脸识别、肤色分割、图像检索等,通过项目讲解帮助学生回顾所学的知识,并将理论与实际相结合,使学生学会分析和解决实际问题的方法。另外,还将教师从事的与“模式识别”相关的科研项目介绍给学生,拓展学生的知识面。从实际效果来看,有些学生对实际工程案例和科研工作很感兴趣,主动申请“模式识别”方向的本科创新项目和发表学术论文。
对于一些典型的“模式识别”工程项目,学生分团队后选择某个工程项目,以团队合作方式收集和整理有关信息资料,提出解决方案,研究结束后做出演示系统并在课堂上进行讲解。
第四,对学习效果的评估方法进行改革,采用多种方法来收集学生在课程学习期间和学习之后等不同时期的学习证据,全面了解学生的学习成绩和学习态度有何转变。第一种方式仍然是传统的笔试。第二种是口试,可以用于概念问题来判定学生对知识的理解层次。口头考核能从深层次上反映学生对概念的理解和应用,因为现实中工程师每天都会应用基础概念进行理性表述,这种方式可以评估学生进行理性表达的能力。第三种是表现评分,通过学生在口头演讲和团队工作等特定任务中的表现情况来进行评估。第四种是项目审查,对团队完成的项目进行评估。模式识别项目主要是从分类性能上对学生完成的项目进行评估。
结合CDIO教育模式,通过以上四方面的改革,能够创设积极的学习情景,激发课堂活力,调动学生的积极性和主动性。这套新的教学体系可以用图1来描述。
三、结束语
本文在CDIO工程教育模式下,探讨了如何对传统“模式识别”课程教学方法进行改革,提出了一种新的教学体系。近两年的授课结果表明,新授课体系在CDIO模式下对激发学生学习兴趣、明确学习方向、转变学习态度、提高专业基础水平和团队合作意识及提高教学效果等方面发挥出了明显的积极作用。
参考文献:
[1]顾佩华,沈民奋,陆小华.重新认识工程教育——国际CDIO培养模式与方法[M].北京:高等教育出版社,2009.
[2]陆鑫,任立勇,王雁东.CDIO模式下软件工程专业课程的教学评价方式[J].计算机教育,2011,(16):64-67.
关键词:遗传算法,混沌,图像分割
0引言
遗传算法是一种全局优化搜索算法,它使用了群体搜索技术,用种群代表一组问题解,通过对当前种群施加选择、交叉和变异等一系列遗传操作,从而产生新的一代种群,并逐渐使种群进化到包含最优解或近似最优解的状态。近几年来借助于混沌改进遗传算法的性能是遗传算法领域研究的热点之一,遗传算法和混沌优化的组合,可以使遗传算法的全局寻优能力,搜索精度,搜索速度等几方面得到较明显的改进。
1混沌的特征和虫口方程
混沌是存在于非线形系统中的一种较为普遍的现象,具有遍历性、随机性等特点,混沌运动能在一定的范围内按照其自身的规律不重复地遍历所有状态。因此,如果利用混沌变量进行优化搜索,无疑会比随机搜索更具有优越性。科技论文。
描述生态学上的虫口模型Logistic映射自May于1976年开始研究以来,受到了非线形科学家的高度关注,Logistic映射是混沌理论发展史上不可多得的典范性的混沌模型,如下式所示:
2混沌遗传算法
基于混沌遗传算法的二维最大熵算法基本步骤如下:
1.设置混沌遗传算法的种群规模以及最大进化代数;
2.生成初始群体。随机产生S 和T ,其中, S ,T ∈(0 ,1) 。然后利用式
计算每个个体的适应值。式(2-1)中的s 和t 分别由以下公式确定:s =(int)( S*255) ,t = (int)(T*255) 。对初始种群执行混沌扰动,如果在C1 步之内找到更优个体,则替换原来的个体,否则保留原个体。科技论文。混沌扰动方式按式(1-1)进行。
3.如果当前进化代数大于G,转步骤5,否则执行变异操作。变异方式按如下公式进行:
其中,fRandom()产生(0,1)之间的随机数,如果变异后的个体具有更优的适应值,则把该个体加入当前种群;
4.执行混沌操作。如果在C2 步之内找到更优解,则替代原来的个体, 否则保留原个体。混沌扰动按公式(1-1)进行。结束后转步骤6。
5. 在较小范围内执行混沌扰动。扰动方式:
其中m1,m2为混沌变量,且m1,m2∈(0,1)。如果变异后的个体具有更优的适应值, 则替换原来的个体,否则保留原个体。
6.按规定的种群规模直接选择最优个体进入下一代。
7.如果满足终止条件, 返回最优解, 否则从步骤3重复上述过程。
8.利用最优解分割图像。
3实验结果与分析
为了检验本算法的效果,用文中提出的基于混沌遗传算法(以下简称为B算法) 和基于传统遗传算法的二维最大熵算法(以下简称为A算法)对Couple.bmp 图像进行了实验比较。科技论文。当文中算法和基于传统遗传算法的二维最大熵算法中各取最大进化代数为10 时,分割效果如图3、4所示。
图1 Couple 原图图2 Couple图像直方图
图3 A算法结果图图4 B算法结果图
4结论
混沌遗传算法是混沌思想与遗传算法思想的结合,比传统遗传算法具有更好的群体多样性、更强的全局寻优能力。文中将混沌遗传算法与二维最大熵图像分割算法结合,应用于图像分割,对比于基于传统遗传算法的二维最大熵算法,文中算法具有更强的稳定性,更快的执行速度,分割效果好。
参考文献
[1]吴薇,邓秋霞,何曰光.基于免疫遗传算法的图像阈值分割.纺织高校基础科学学报,2004,17(2):160-163
[2]薛景浩,章毓晋,林行刚.二维遗传算法用于图像动态分割.自动化学报,2000,26(5):685-689
[3]王小平,曹立明.遗传算法-理论、应用与软件实现.西安交通大学出版社.2002
【关键词】入侵检测系统 人工智能 模式识别
伴随着互联网技术的广泛应用,基于计算机网络的业务应用领域已经逐步深入到社会各行各业范围中,计算机网络的安全性能显得十分关键。计算机网络的安全定义主要包括保密性、完整性、可用性以及认证等四个重要环节。因为计算机网络在理念设计、实践部署以及实际应用过程中存在较大的缺陷,使得计算机网络安全服务无法得到满意的结果,所以研发安全可靠的信息安全互联网产品已经发展成为学术界领域努力的前进方向。入侵检测技术作为扩充计算机系统安全确保能力、提高信息安全基础架构完整性的关键性领域。因为入侵检测的操作过程需要面对复杂的网络环境与变化多端的攻击方式,这就需要入侵检测系统具备灵活性、主动性以及自适应性等优秀性能。模式识别环境下入侵检测技术已经逐步社会重点关注的方向,尤其是模式识别的实际运用,更加是提高入侵检测系统性能的重要方法。
1 入侵检测系统的概述
入侵检测系统的理论定义主要是指在入侵检测过程中所需要具备的各种基本软件与硬件的配置组合,其通过对计算机网络信息系统的实际工作状态进行实时性的有效监测,发现各种类型的攻击意图、攻击行为或者攻击后果同时作出相应的响应,从而可以确保计算机系统资源的安全性、运行性与可靠性。其主要功能分别表现在:监控行为、分析系统用户与执行活动;检测计算机系统的技术配置与操作漏洞;评估系统取决于计算机资源与数据信息的完整性;模式识别已具备的攻击行为、统计分析异常行为;对于操作系统进行日志的操作管理;模式识别违反安全策略的系统用户活动;系统响应入侵行为的事件等。
2 智能入侵检测技术
现阶段大部分入侵检测系统可以符合大部分系统用户的实际需求,然而在重点技术领域(金融、商务以及军事等)的实际应用仍然存在各方面问题,通常表现在:误报率比较高、报警信息比较多;缺少检测未知入侵行为的有效技术;自适应与自学习能力比较低;互操作性比较差,无法形成协同防御的完善体系等。人工智能技术的实际应用,为能够解决上述各种问题积累坚实的基础。模式识别技术的基本原理是:把一个输入模式和储存在计算机系统中的多个参考模式相互对比,寻找出最接近的参考模式,把这种参考模式所代表的类名作为输入模式的类名输出。模式识别技术能够分成学习与识别这两个具体过程。学习是为了构造识别系统而进行的一种行为,参考模式是通过学习之后确定的。在应用识别系统的过程中,必须实时更新参考模式以增强系统的自适应性,这需要对识别结果集进行学习。本质上,模式识别是对未知样本进行类归属判定的过程;而入侵检测也是将一个新的实例与原有的规则集进行比较归类的过程。两者工作机理非常相似。模式识别的应用对于改善入侵检测系统的识别精度、识别能力以及智能特性有着重要的影响。
3 智能入侵检测系统
智能入侵检测系统主要采取模块化思想进行设计,其中包含数据采集模块,特征提取模块,规则处理模块,分析检测模块和异常响应模块等。
系统各个模块的功能如下:
数据采集模块:实时采集计算机网络系统的原始数据信息,同时根据各自不同的网络协议进行解码操作,然后对解码处理之后的数据信息进行分片重组、流重组以及代码转换等种技术处理,还原数据包的原始数据含义与数据包相关之间的实际关系。
特征提取模块:对于数据采集模块直接采集得到的数据信息进行特征化选取,然后对信息数据进行向量化处理,最后生成待检测的数据样本。
规则处理模块:进行规则集的向量化与聚类处理工作。首先根据条读入的处理规则,对于各条规则进行向量化处理,获得一个规则向量集,然后对规则向量集进行聚类分析处理,在向量集规模较小的情况不需要进行聚类入生成精简的参考规则集。
分析检测模块:这是计算机系统的核心控制模块。把待检测的数据样本和参考规则集进行比较分析处理,从而确定是否出现入侵状况。具体的处理过程为:
(1)采取近邻法分析待检测的数据样本和参考规则集。
(2)当欧氏距离d=0的时候,即待检测的数据样本和参考规则集中某部分规则进行匹配处理,从而得到分析结果。
(3)当d≠0的时候则采取k-近邻法进行二次检测处理,从而得到相应的分析结果。
(4)根据具体的分析结果从而判断分析待检测数据样是否出现异常行为。
(5)假如是异常行为,则会马上启动异常响应的处理措施,同时对原规则数据库进行更新操作;假如是正常行为,则直接退出。
异常响应模块:对于入侵行为作出响应(报警、日志记录等)。
4 结语
入侵检测理论是防火墙技术、数据加密技术以及访问控制等各种传统安全技术的重要基础,作为网络信息安全防护体系的关键构成环节。入侵检测系统能够对计算机网络入侵行为作出相应的识别与响应,其不但能够检测来自计算机网络的实际攻击行为,也能够监督系统内部用户未经授权的访问活动。模式识别是处于不断提升发展的新型学科技术,其理论基础与应用范围也处于不断发展的阶段。本文提出将模式识别方法具体运用在入侵检测的技术领域中,把入侵检测的相关问题转变成模式识别问题来进行处理,这实际上是一种富有价值的技术解决方案。基于模式识别的入侵检测系统自适应/学习能力强、成本低和健壮性好,能有效提高系统的安全性。但是,本系统仍存在缺陷:为保证参考规则集的有效性和实时性,需要提取海量的对象行为特征;在高带宽的网络环境下,为缩短检测响应时间,对检测算法的时空效率提出更高的要求。这两点对入侵检测系统的效能来说具有决定性意义,如何快速构建入侵参考模式知识库、进一步提高检测算法的智能性和效率,将是进一步研究的方向。
参考文献
[1]沟口理一郎,石田亨.人工智能[Ml.北京:科学出版社,2005.
[2]蔡自兴,徐光v.人工智能及其应用[M].北京:清华大学出版社,2004.
[3]简清明,曾黄麟,叶晓彤.粗糙集特征选择和支持向量机在入侵检测系统中的应用[J].四川理工学院学报:自然科学版,2009,22(5).
[4]赵丽萍.基于模式识别的入侵检测模型[J].电脑开发与应用,2008,21(6).
[5]胡煜.主分量分析法和K近邻法应用于基因芯片数据分析[J].北华大学学报:自然科学版,2008,9(1).
[关键词] 模式识别 风险分类 适用性
一、引言
贷款风险分类,就是根据借款人的当前经营情况和违约迹象来判断其按时还款的可能性并给予风险等级评价,是银行综合了借款人财务、非财务因素,对贷款未来安全收回可能性的评价。如何判断借款人的每个因素对贷款偿还的影响程度,以及如何将上述各种因素定性和定量分析归纳汇总,作出全面科学的风险评定是贷款风险分类操作的难点和关键。
在现代信用风险度量模型出现以前,测度信贷信用风险的方法主要有:专家制度法、评级法和信用评分法。近年来,一些大的金融机构相继构建了比较规范的、有重大影响的四大信用风险度量模型:JP 摩根的Credit Metrics 方法;KMV公司的KMV 模型;CSFP(Credit Suisse Financial Products) 的Credit Risk + 方法;麦肯锡公司的信用组合观点模型(Credit portfolio View)。这四大信用风险度量模型对中国银行业都有一定的借鉴意义。模型最大的问题是任何一个模型都没有全面考虑到借款人的道德风险,还有借款人的具体情况,如银行合同、贷款合同、担保能力、借款期限等,而且由于经济制度、金融发展水平等方面的差异,因此,借用西方信用风险模型应慎重,我国应用这些大型量化模型的条件还不成熟。
本文把贷款风险分类看作是一个模式识别问题,在此框架下,就统计模式识别领域中最新使用的神经网络方法、分类树法、以及支持向量机三种方法的建模思想、适用性进行比较,并给出有关结论。
二、贷款风险分类是一个模式识别问题
所谓模式识别,就是用计算机的方法来实现人对各种事物或现象的分析、描述、判断和识别。目前我国实行的贷款风险五级分类法(简称风险分类),它是根据贷款对象的第一还款来源与第二还款来源共同特征(财务指标)或属性(非财务指标)进行识别判断而进行分类的,其核心在于它以借款人的偿还能力作为分类标志。
贷款风险分类的模式识别系统的精度及其正确性,主要取决于(1.3)式中的一些参数的估计的精度。训练时如果输入模式样本的类别信息是已知的,这时可以用“有监督”的模式识别技术,让识别系统执行一个合适的学习训练过程,把系统“教”成可使用各种适应修改技术再去识别模式。如果采集到样本模式是未知类别的,这时可用“无监督的模式识别技术,即必须通过系统的学习过程去得到其所属的范畴。
三、模式识别技术的建模思路及其适用性分析
目前用于统计模式识别的方法很多,主要有判别分析法、回归分析法、人工智能(专家系统)、神经网络、决策树法、K近邻法、支持向量机等。本文仅就目前最为流行的人工神经网络、决策树法、支持向量机三种非参数模式识别方法建模思路、适用性进行比较分析。
1.神经网络模型(ANN)
(1)建模思路
人工神经网络(Artficial Neural Networks ANN )是一种具有模式识别能力,自组织、自适应,自学习特点的计算方法。神经网络模型建模思路是,首先找出影响分类的一组因素,作为ANN的输入,然后通过有导师或无导师的训练拟合形成ANN风险分析模型。对于新的样本输入(即一组影响因素值),该模型可产生贷款风险的判别。
(2)适用性分析
神经网络的适用性首先表现为分类的准确性比较高。特别是在测试数据为非线性关系的情况下,尤其如此;其次是神经网络有较强的适应训练样本变化的能力,当训练样本增加新的数据时,能够记忆原有的知识,根据新增的数据作恰当的调整,使之表示的映射关系能够更好的刻画新样本所含的信息。这一点不仅使得神经网络具有较强的适应样本变化的能力,还使它具有动态刻画映射关系能力,也克服了线性判别分析方法的静态特点;再次是其具有鲁棒性。神经网络对于样本的分布、协方差等没有要求,对样本中存在的噪音数据、偏差数据不敏感。监管部门在面对众多监管对象银行时, 可以根据其报表中的监管指标与监控指标的输出结果,迅速、准确地判断商业银行的经营状况,就可以辅助以现场检查的手段,对商业银行进行适当、适时的干预。
神经网络方法的主要缺点一是对样本的依赖性过强,对样本提出了很高的要求。因为它很少有人的主观判断因素的介入;二是解释功能差。它仅能给出一个判断结果,而不能告诉你为什么;三是在神经网络方法中输入特征变量的确定出关键指标问题时,需要依赖于其他的统计分析方法;四是是样本分成多少个种类,这些问题都是神经网络方法无法独自解决的,要依赖于其他方法;五是神经网络的训练速度慢且极易收敛于局部极小点,推广能力差,以及容易出现“过学习”现象。
2.分类树方法(CART)
(1)建模思路
分类树方法(CART)是一种由计算机实现,基于统计理论的非参数识别方法。其建模思路是:在整体样本数据的基础上,生成一个多层次、多节点的树,按广度优先建立直到每个叶节点包含相同的类为止,以充分反映数据间的联系。然后对其进行删减,参照一定规则从中进行选择适当大小的树,用于对新数据进行分类即建造最大树,对树删减,选择适当的树用于新样本分类。
(2)适用性分析
分类树方法在银行贷款风险分类中的适用性首先在于通过借款人经营状况的变化及其破产的可能性的判断,来估计其违约的可能性,进而来推测该借款人持有的贷款风险程度。它不但具有哲学上的二分法的优点,而且其分类标准的选择也包含着经济理论上的合理性。反映申请者信用关系中各项指标之间的相关性是应用分类树于信贷信用分类的有利条件,它可以有效地利用定性变量进行分类。
分类树的缺陷表现在:一是计算量大;二是在一些连续型定量变量的处理上,分类树就显得有些力不从心;三是对结点属性的判定上,往往以叶结点中所含多数样本的属性来决定该叶结点的属性。但如果碰到训练样本中某种样本(譬如好样本,占大多数)。此时分类的结果很可能是几乎每个叶结点都是好样本占多数,或出现一些好坏样本的个数相当的叶结点。于是就可能出现几乎所有的叶结点都是好样本集合,或其中一些结点无法判断。无论哪种情况出现,都将导致对坏样本的辨别率降低,进而导致分类树的效率降低。
3.支持向量机模型(SVM)
(1)建模思路
(2)适用性分析
由于支持向量机出色的学习性能、泛化性能、良好表现和所估计的参数少等特点,能够较好地解决小样本、高维数、非线性、局部极小等问题。鉴于支持向量机的诸多优点,国外学者 Van.Gestel(2003)将支持向量机应用到信贷风险分类与评估领域,并与神经网络及Logistic回归相比较,得到了较好的结果。同时利用支持向量机,能提高学习机的泛化能力,能成功地解决风险分类、函数逼近和时间序列预测等方面,对构建贷款分类模型也具有重要的实践意义。
但SVM是解决一个二分类问题,现实中遇到的大都是多分类问题,如支持向量机无法解决信贷风险的五级分类问题。另外,影响支持向量机模型分类能力的参数选择存在人为确定的主观性等。
四、结论
从信贷风险管理角度看,信贷风险分类与量化管理是一个必然趋势。为了提高贷款分类的准确性,必须将上述两种或两种以上的方法结合起来使用,取长补短。同时,中国银行业在运用这些相对复杂的预测技术时,不仅要根据国内的实际情况和银行业自身发展阶段,科学地制定信贷风险管理流程,还要加强人才培养和数据库建设,尽可能地运用信贷风险管理先进技术将信贷风险损失降到最低限度,实现可持续发展。
参考文献:
[1]J.P. Morgan.Credit Metrics―Technical Document.1997, 4:2
[2]KMV.Global Correlation Factor Structure. San Francisco:KMV Corporation.1996,8 :16~17
[3]Credit Suisse First Boston. Credit Risk+, A Credit Risk management Framework. Credit Suisse First Boston Internation, 1997
[4]McKinsey and Co, Credit Portfolio View. New York, Mckinsey and Co.1997
[5]曹道胜等:商业银行信用风险模型的比较及其应用[J].金融研究,2006年第10期
[6]王振民,中国商业银行贷款风险分析[D].天津大学博士论文,2005年5月,P33
三星手机关闭防误触模式的方法:
1、解锁手机,进入手机桌面;
2、在手机桌面找到“设置”程序并点击进入;
3、在设置页面中找到“智能辅助”选项,并点击进入;
4、在智能辅助的页面中找到“更多”选项,并点击进入;
5、点击“防误触模式”选项,使防误触摸式显示为关闭状态即可。
(来源:文章屋网 )
关键词:胶合板; 声发射; 小波包变换; 神经网络
中图分类号:TN911.7-34; TB52+9文献标识码:A文章编号:1004-373X(2011)21-0096-04
Wavelet Feature Extraction and Neural Network Pattern
Recognition of Plywood Acoustic Emission Signals
XU Feng, ZHAO Ming-zhong, LIU Yun-fei
(College of Information Science and Technology, Nanjing Forestry University, Nanjing 210037, China)
Abstract:
To identify the different damage types of plywood, a feature extraction method of plywood acoustic emission signal based on time-frequency and proportion of energy is proposed by combining wavelet-packet time-frequency analysis with energy spectrum. The research indicates that dilatational wave and flexural wave are main modes of plywood matrix cracks signal with wide frequency spectrum, and the energy of signal is mainly concentrated in the first, second, third, fourth and seventh-band of the wavelet power spectrum. Delamination and fiber fracture signals of five-story plywood are mainly dominated by dilatational wave and flexural wave mode respectively, the former frequency is unitary and amplitude is higher, the latter energy mostly focus on the first, second band. Degumming signal waveform are composed of dilatational wave and flexural wave, and the flexural wave is dominant, whose signal energy focus on the first, second, third and fourth band of the wavelet power spectrum. An intelligent pattern classifier with BP neural network was used in recognition of those four kinds of AE signals, the recognition accuracy of flaws amounted to 92.6%.
Keywords: plywood; acoustic emission; wavelet package transform; neural network
0 引 言
声发射(Acoustic Emission,AE)是材料受外力或内力作用产生变形或断裂时,以弹性波的形式释放出应变能的现象[1]。目前声发射技术作为一种成熟的无损检测方法,已被广泛应用于石油化工工业、电力工业、材料试验等多个领域,但对胶合板的损伤监测,AE技术鲜有报道。
胶合板(也称夹板)是按相邻层木纹方向互相垂直的单板,经组坯胶合而成的板材,在我国已广泛应用于家具工业和建筑工业。胶合板的损伤模式主要包括基体开裂、纤维断裂、脱胶、分层等,每一种损伤都对应特定的声发射信号。然而,不同的损伤模式通常以组合形式出现,类别特征相互重叠[2],同时由于传播介质的各向异性和多源性噪声的污染,加大了AE信号鉴别的难度。因此,提取各声源信号特征与识别其损伤模式是声发射应用的首要任务和核心技术。
由于小波分析同时具有时域和频域表征信号局部特征的能力,所以特别适合分析瞬态特性的声发射信号。文献[3]用小波变换的方法分析了薄板中的弹性波,指出在波的传播过程中,多模式和频散的特性、模式的分离有助于准确提取信号中的信息。文献[4]用Daubechies离散小波进行了多尺度分解,利用频率能量分析玻璃纤维增强复合材料的不同损伤模式。通过区分能量的大小和不同能量所处的频率范围揭示了材料的破损模式。同时,近年来的研究发现,人工神经网络可对数据量多、特征复杂的信号提供准确度较高的自动分类能力。因此,本文结合小波分析和人工神经网络技术对胶合板不同损失声发射信号进行特征提取和模式识别。
1 小波包能量特征提取算法
1.1 小波包定义[5]
给定正交尺度函数Е(t)和小波函数(t),其中:
1.2 基于小波包分解的能量特征提取算法
小波包分解是在多分辨率基础上构成的一种更精细的正交分解方法。它根据被分析信号本身的特点,自适应地选择频带,确定信号在不同频段的分辨率。分解得到的各个频段分量既包含了信号的局部特征,也包含了不同的时间尺度信息,从而精确地给出信号能量随频率和时间的联合分布情况,即各频带能量的变化表征了各种信源的特征。因此,本文提取各尺度下各频段分量的能量占比作为各信号特征向量来识别声源类型。基于小波包分解的能量特征提取步骤如下:
(1) 对原始信号进行k层小波包分解,分别选择第k层从低频到高频包含主要信息的前n(n≤2k)个频段分量的信号特征;
(2) 对小波包分解系数重构(重构信号设为Ski),提取各频段范围的信号;
(3) 求各频带信号的总能量Eki:
И
И
2 人工神经网络模式识别方法
2.1 神经网络的选择
人工神经网络是一个高度非线性的自适应并行分布处理信息系统,其信息处理由神经元之间的相互作用来实现。信息的存贮表现为神经元之间的物理联系。网络的学习取决于神经元连接权系的动态演化过程。神经网络的类型多种多样,但与模式识别的结合最成功的是多层前馈网络,也就是通常简称的BP(Back-propagation Network)网络[6],本文即选其进行模式识别。
2.2 BP网络结构的设计
由BP定理可知, 一个带S型激活函数的三层BP网络,只要隐节点数足够多,能以任意精度逼近有界区域上的任意连续函数,即一个三层的BP网络就能完成任意的n维到m维的映射。BP神经网络最重要的是隐含层的确定。虽然隐层神经元数目的选择不存在一个理想的解析式,但隐单元数目与问题的要求、输入/输出单元的数目都有着直接关系。综合现有文献,隐含层元个数的计算公式为:
И
n1=n+m+a
(7)
И
式中:n1为隐单元数;m为输出神经元数;n为输入单元数;a是[0,10]之间的常数。
输入层节点数一般由一组特征值样本的数据量决定。在分类网络中输出层节点数可取类别数x或┆log x。П疚囊含层采用双曲正切S型激活函数,输出层采用对数S型激活函数。
2.3 训练函数的选择
采用不同的训练函数对网络的性能可能会有影响,比如收敛速度等。本文应用各种典型训练函数对网络进行训练,观察各种训练算法的收敛速度和误差,最后确定Levenberg-Marquardt算法为本识别的最优训练函数。
3 实验和分析
3.1 实验方法[7]
试验对普通胶合板的胶合强度进行测试研究。样品选用德华装饰有限公司的“兔宝宝”牌5层胶合板,其内部为杂木夹芯,外覆桃花芯面板,由环保脲醛胶粘合而成。试样(如图1所示)按GB9846.9定义的普通胶合板力学性能测试试件方法锯制,尺寸为250 mm×25 mm×5 mm。试验测试温度为25 ℃,样品为气干状态。加载系统为深圳新三思有限公司SANS-CMT6104台式万能试验机;采集系统选用美国PAC公司PCI-2声发射采集系统,用两个宽带传感器S9208组成线定位阵列方式,同时采集各个波击的波形。
试验中为保证传感器与材料表面良好耦合,选用真空脂作为耦合剂,传感器采用透明胶带固定在试样的表面。试样两端夹紧于试验机的一对活动夹具中,使其成一直线,试样中心通过活动夹具的轴线,拉伸沿试样长度方向进行,等速加荷,速度为3 mm/min,最大破坏荷重的读数精确到5 N,拉伸过程在准静态条件下进行,直到试样断裂为止。拉伸模型如图2所示。
图1 五层胶合板拉伸试样图(单位:mm)
3.2 胶合板加载声发射信号特征分析
对于厚度方向尺寸远小于其他两个方向的板而言,相应于一定的激励条件,在其中主要形成的是板波(Lamb波)。由文献[8-9]可知,受激励后,板中存在多种模式的板波,但当板厚远小于波长时,主要以两种模式的波为主,即最低阶的对称波S0和最低阶的反对称波A0。前者即是膨胀波,其传播速度是一个定值,没有频散效应;后者亦称弯曲波,它的传播速度与角频率的平方根成正比,有频散效应。一般情况下,板中的波是这两种波的组合,这两种波位移的相对幅度同激励方式有关。研究发现[8],当激励力源作用方向与板平面垂直时,在板中主要产生的是弯曲波。相反,当力源作用方向沿板方向时,产生的主要是膨胀波。一般而言,膨胀波的高频成分要比弯曲波丰富。胶合板受载形变作为强声发射源,其声源有基体开裂、纤维断裂、脱胶、分层等。理想上,纤维断裂总在平面内完成,其类似于一个沿板平面方向的力源,因此,激发的声发射信号应以膨胀波为主,无频散效应;而分层损伤则明显沿板厚方向发生,类似于一个沿板平面垂直方向的力源,因此,所激发的声信号波形当以弯曲波为主,存在频散效应;基体开裂、脱胶产生的声发射信号,其特征介于两者之间,┮话阌ν时表现为膨胀波和弯曲波两种组合形式。
3.3 实验结果分析
本文选用db3小波[10-12]对采集的声发射信号做5层小波包分解,并进行第五层系数重构,计算各叶子能量占比,绘制时频、小波包谱和频谱图,比较各典型信号的特征差异。由实验结果得知,声发射源主要集中在主损伤区或断裂部位。考虑到声源的位置、材料物理特性及波的传播对类别特征的复杂影响[2],将所有样本取自主损伤区宽20 mm范围内的事件。对比四种典型的声发射源波形、频谱和小波包谱图,筛选出四类样本数据集,并应用小波阈值法消噪,得到各类别信号的典型波形如图3~图6所示。观察图3~图6中信号的傅立叶频谱发现,胶合板破坏损伤多以低于300 kHz以下的频率信号为主,且难以区分其特征差别。为获取各损伤信号的特征,必须结合小波包时频和小波包谱图分析。
图2 五层胶合板拉伸模型示意图
基体开裂如图3所示,波形以低幅度较宽脉冲为主,频段较宽,膨胀波和弯曲波模式并举。FFT主峰频率位于40~180 kHz,小波时频图特征峰约集中在100 kHz以下和200 kHz处,发生的时间约在0.5~1.2 ms之间。小波包谱峰位于第一至第四和第七频段内,其中第一、第二频段的能量接近,总和约占总能量的60%,剩余40%几乎集中于第三、四、七段。
图3 胶合板基体开裂原始信号(去噪)
及其频谱、时频、小波包能量谱图
图4为五层胶合板纤维断裂图,由图中得出的信号主要以高幅度较宽脉冲形式出现,频率较低且单一,无频散现象。纤维断裂的FFT峰值主要集中在22~40 kHz,时频图特征峰位于40 kHz处,持续时间约为1 ms,小波谱峰值主要位于第二频段,能量占到总能量的70%以上,第一、四频段能量约占20%。结合样品断口纹理分析,断裂主要沿垂直于纤维方向扩展,呈剪切断裂方式,波形以膨胀波为主导,基本与第3.2节的信号分析一致。
五层胶合板脱胶信号如图5所示,信号以中低幅窄脉冲为主,波形为弯曲波模式和膨胀波模式的混合型,且弯曲波模式占主导。受膨胀波成分的影响,在200 kHz频率处也出现峰值,能量在大于100 kHz频域上有所分布,但主要集中在小于50 kHz的频域。从失效样品查看,明显存在分层和互相滑移现象,与上述分析基本一致。
图4 胶合板纤维断裂原始信号(去噪)
及其频谱、时频、小波包能量谱图
图5 胶合板脱胶原始信号(去噪)
及其频谱、时频、小波包能量谱图
观察图6发现,五层胶合板分层信号中傅里叶频谱的峰值主要位于11~55 kHz,小波时频图的特征峰主要集中在40 kHz处,持续时间约为1.2 ms,小波包谱能量主要集中在第一、二、三、四段,且第一、二段能量所占比重接近,总和占到了总能量的85%。信号多以中幅度宽脉冲形式为主,信号持续时间较长。分层是典型的垂直板平面方向的力源作用,信号明显存在频散现象,波形以弯曲波模式为主,能量主要集中在40 kHz以下。
图3~图6表明,信号的波形、频谱和小波包谱等类别特征均有不同程度的重叠,但对5种类别的信号均显示出一定的鉴别能力,尤其以小波包分析提取的特征更为明显,以该特征作为样本可为后续使用神经网络进行识别提供依据。
3.4 模式识别
按照第1.2所述方法对声发射信号进行5层小波包分解,将整个频段分成32个频带,考虑反应声源信号特征的能量主要集中在前10个频段,因此提取前10个叶子的能量分布为声发射信号特征,以此作为BP网络的训练样本。样本包含胶合板脱胶10组、纤维断裂10组、分层12组和基体开裂8组共计40组。网络在经过81次训练后达到设定的最小期望误差0.001(见┩7)。采用网络对训练数据进行识别,识别正确率达到 100%。证明该网络具有较强的学习能力,能够按照给定的输入/输出正确建模。
图6 胶合板分层原始信号(去噪)
及其频谱、时频、小波包能量谱图
为检验网络的推广应用性能,采用该网络对118组测试样本(脱胶30组、纤维断裂30组、分层28组和基体开裂30组)进行检验,识别正确率达到 92.6%。这表明该人工神经网络的范化能力较高,设计结构合理,达到自动识别声发射信号类别的目标,具有良好的推广价值。
4 结 论
(1) 针对声发射这种瞬间的突变信号,小波分析确实能很好地同时表现出时域和频域的局部特征;
(2) 综合各类模式信号的波形、频谱、小波包时频图和小波包能谱图分布等特征,可确定不同损伤机制所对应的声发射信号特征,为神经网络模式识别提供质量较高的模式样本;
(3) 设计的BP人工神经网络能准确度较高地识别出4种不同损伤机制造成的声发射信号。
由于木质胶合板的声发射研究国内开展的不多,对该类材料的声发射特征的分析及识别还待进一步研究,尤其对多层胶合板声发射特征的定量研究还有待于大量实验数据的积累和归纳。
参考文献
[1]袁振明,马羽宽,何泽云.声发射技术及其应用[M].北京:机械工业出版社,1985.
[2]殷冬萌,王军,刘云飞.木塑复合材料缺陷及损伤的声发射信号特征分析及神经网络模式识别[J].应用声学,2007,26(6):352-356.
[3]JIAO Jing-pin, HE Cun-fu, WU Bin,et al.Application of wavelet transform on modal acoustic emission source location in thin plates with one sensor \[J\]. International Journal of Pressure Vessels and Piping, 2004, 81: 427-431.
[4]QI Gang. Wavelet-based AE characterization of composite materials \[J\]. NDT& E International, 2000, 3(3): 133-144.
[5]胡昌华,张军波,夏军,等.基于Matlab的系统分析与设计:小波分析[M].西安:西安电子科技大学出版社,1999.
[6]毛汉颖,成建国,黄振峰.基于BP神经网络的金属裂纹声发射信号特征参数的提取[J].机械设计,2010,27(2):84-86.
[7]陆仁书.胶合板制造学[M].2版.北京:中国林业出版社,1993.
[8]耿荣生,沈功田,刘时风.基于波形分析的声发射信号处理技术[J].无损检测,2002,24(6):257-261.
[9]LOWE M J S, DILIGENT O. Low-frequency reflection characteristics of the s0 Lamb wave from a rectangular notch in a plate \[J\]. Acoustical Society of America, 2002, 111 (1): 64-74.
[10]徐长发,李国宽.实用小波方法[M].2版.武汉:华中科技大学出版社,2004.
[11]杨晓楠,唐和生,陈荣,等.钢结构损伤识别中db族小波函数选择[J].同济大学学报,2006,34(12):1568-1572.
[12]周小勇,叶银忠.故障信号检测的小波基选择方法[J].控制工程,2003,10(4):308-311.
关键词:仿生;模式识别;神经网络;分类器
中图分类号: F224-39 文献标识码: A 文章编号: 1673-1069(2017)02-154-2
1 仿生模式识别的引入
为了适应现实需要,人们开始希望机器能够代替人类完成某些繁重的识别工作。我们通常所说的模式识别就是指运用机器进行分类识别。以往的识别方法,多数是建立在“分类划分”的基础上,根据给定的分类准则来找寻“最优的分类界面”,具体的实现算法也都是注重于不同类样本的区别,即,一类样本与有限种类已知样本之间的区分。基于此出发点的局限性,识别当中出现的问题是显而易见的:首先,如果遇见未学习过的新事物,常常会牵强地认为它是某一类已学过的旧事物;其次是对未学习过的新事物进行学习时,往往会破坏掉原来的规矩,打乱旧事物的识别。针对以上的缺陷,才有了仿生模式识别的概念。仿生模式的目标是找到同类事物的最佳覆盖面。
2 仿生模式识别在神经网络中的超曲面划分
2.1 多权值神经网络的高维封闭曲面
(5)式中Wji和W′ji是方向权值,它们决定了曲面的方向,W′ji是核心权值,它决定了曲面的几何中心。Xj为第j个输入端的输入;n是输入空间维数;p为幂参数,用以控制曲面的弯曲程度;s表示单项正负号方法的参数,若S=0单项符号只能为正,若S=1时单项的符号和Wji的符号相同;若设置了S=0,则该式就变成了一个封闭超曲面的神经元。f函数的基设置为一个定值时,输入点的轨迹是一个封闭的超曲面,其核心位置由决定。
用p值来改变封闭超曲面的形状,如图1~图8所示。若使权值取不同的值,就相当于将封闭曲面在不同方向进行拉伸或压缩,θ取值不同,则偏离核心位置的程度也不同。
2.2 通用超曲面神经网络的计算式
上式中,Ymi(t+1)是输入空间的第i个神经元在输入第m个对象,在t+1时间的输出状态值。i是神经元数量,最大是1024。Wji与W′ji是第j个输入节点至第i个神经元的“方向”权值和“核心”权值;fki是第i个神经元的输出非线性函数,下标ki是第i个神经元的非线性函数在函数库中的序号;Imj表示的是第m个输入对象中的第j个输入值;W′cgi和是Wcgi第cg个(取值范围[1,256])神经元输出到第i个(取值范围[1,1024])神经元的权值“核心”和“方向”权值;p表示的是幂参数;而S是单项正负符号规则;(t)为当输入为第m个对象时第cg个神经元在时间t的输出状态值,θ([1,1024])是第i个神经元的阈值;λi是神经元非线性函数坐标比例因子;Ci是神经元输入规模比例因子。
由传统的BP神经网络和经向基RBF神经网络及超曲面神经网络对图9中三类事物的分类边界分别为折线和圆环及椭圆的并,可见超曲面神经网络具有更准确的分类效果。
3 总结
仿生模式识别是对事物逐类分别训练“认识”的过程。它的显著优点是对于没有经过训练的对象会拒识,而新增加样本的训练不会影响到原有的识别。因此,仿生模式识别,较之原有的识别模式识别效果更佳,可以广泛应用在人脸识别,语音识别等众多领域。
参 考 文 献
[1] 覃鸿,王守觉.多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与HMM及DTW的比较研究[J].电子学报,2005(5).
【关键词】 图像识别技术 神经网络识别
模式识别研究的目的是用机器来模拟人的各种识别能力―比如说模拟人的视觉与听觉能力,因此图像识别的目的是对文字、图像、图片、景物等模式信息加以处理和识别,以解决计算机与外部环境直接通信这一问题。可以说,图像识别的研究目标是为机器配置视觉“器官”,让机器具有视觉能力,以便直接接受外界的各种视觉信息。
一、图像识别系统
一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。
二、图像识别方法
图像识别的方法很多,可概括为统计(或决策理论)模式识别方法、句法(或结构)模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。
2.1神经网络识别方法
2.1.1人工神经网络的组成
人工神经网络(简称ANN)是由大量处理单元经广泛互连而组成的人工网络,用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。
2.1.2人工神经网络的输出
2.1.3人工神经网络的结构
人工神经网络中,各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。
2.1.4 学习算法
1)感知器模型及其算法
算法思想:首先把连接权和阈值初始化为较小的非零随机数,然后把有n个连接权值的输入送入网络中,经加权运算处理后,得到一个输出,如果输出与所期望的有较大的差别,就对连接权值参数按照某种算法进行自动调整,经过多次反复,直到所得到的输出与所期望的输出间的差别满足要求为止。
2)反向传播模型及其算法
反向传播模型也称B-P模型,是一种用于前向多层的反向传播学习算法。
算法思想是:B-P算法的学习目的是对网络的连接权值进行调整,使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算,即对某一输入信息,经过网络计算后求出它的输出结果;反向传播用于逐层传递误差,修改神经元之间的连接权值,使网络最终得到的输出能够达到期望的误差要求。
B-P算法的学习过程如下:
第一步:选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例,把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层,并按照某种原则(能使误差向减小方向发展),调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤,直到误差达到要求时为止。
3)Hopfield模型及其学习算法
它是一种反馈型的神经网络,在反馈网络中,网络的输出要反复地作为输入再送入网络中,使得网络具有了动态性,因此网络的状态在不断的改变之中。
算法思想是:
(a) 设置互连权值
其中xis是s类样例的第i个分量,它可以为1或0,样例类别数为m,节点数为n。
(b) 未知类别样本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)为节点I在t时刻的输出,当t=0时,Yi(0)就是节点I的初始值,Xi为输入样本的第I个分量。
(c) 迭代直到收敛
人 工 智 能 作 业
拥抱人工智能
学院:
年级:
专业:
学号:
姓名:
拥抱人工智能
摘 要:介绍了人工智能的含义以及模式识别的领域。
关键词 人工智能;模式识别;AlphaGo
1 人工智能
1.1人工智能的含义
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。AlphaGo的胜利,无人驾驶的成功,模式识别的突破性进展,人工智能的的飞速发展一次又一次地挑动着我们的神经。作为人工智能的核心,机器学习也在人工智能的大步发展中备受瞩目,光辉无限。
我所理解的人工智能,就是如下五个定义。定义一:AI就是让人觉得不可思议的计算机程序。定义二:AI就是与人类思考方式相似的计算机程序。定义三:AI就是与人类行为相似的计算机程序。定义四:AI就是会学习的计算机程序。定义五:AI就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程。如今人工智能的时代到来,给予了我们很大的便利。如智能图像理解软件Google照片、智能美图软件美图秀秀、只能搜索排序软件Google、智能出行自动驾驶软件滴滴优步司机、智能机器翻译软件有道翻译官等。
1.2 人工智能的发展历史
迄今为之,人工智能诞生已有62年。1956年,John McCarthy创造人工只能一次。1962年,IBM的阿瑟··萨缪尔开发的西洋跳棋程序就战胜过一位盲人跳棋高手。1987年到1993年现代PC的出现,让人工智能的寒冬再次降临。1997年IBM计算机“深蓝“成功击败世界顶级国际象棋高手之后,国际商用机器公司(IBM)又尝试一轮新的人机博弈。2016年AlphaGo在围棋人机大战中击败韩国职业九段棋手李世石。
1.3 人工智能的复兴
人工智能的复兴可分为以下两次。第一次AI热潮由图灵测试掀起。艾伦.图灵是人工智能的开拓者,他所提出的图灵测试,直到今天仍然是我们判定一部机器是否具有人类智慧的重要手段。假如有一台宣称自己会"思考"的计算机,人们该如何辨别计算机是否真的会思考呢?一个好方法是让测试者和计算机通过键盘和屏幕进行对话,测试者并不知道与之对话的到底是一台计算机还是一个人。如果测试者分不清幕后的对话者是人还是机器,即,如果计算机能在测试中表现出与人等价,或至少无法区分的智能,那么,我们就说这台计算机通过了测试并具备人工智能。第二次AI热潮则由语音识别掀起。20世纪80年代到90年代的第二次AI热潮中,语音识别是当时最具代表性的几项突破性进展之一。今天我们拿出手机,使用苹果手机内置的语音输入法,或者使用中文世界流行的科大讯飞语音输入法,我们就可以直接对着手机说话以录入文字信息。技术上,科大讯飞的语音输入法可以达到每分钟录入400个汉字的输入效率,甚至还支持十几种方言输入。
1.4人工智能所带来的警示
AlphaGo带来的警示是:如果计算机可以在两年内实现大多数人预测要花20年或更长时间才能完成的进步,那么,还有哪些突破会以远超常人预期的速度来临?这些突破会不会超出我们对人工智能的想象,颠覆人类预想中的未来?我们已为这些即将到来的技术突破做好准备了吗?AI真的会让人类大量失业吗?哪种工作最容易被AI取代?这一系列的问题,都引起我们的思考。
1.5 分析人工智能
人工智能的应用场景有:自动驾驶、智慧生活、智慧医疗、艺术创作、智慧金融、和人类同场竞技等。今天的人工智能还不能做什么?情感、审美、自我意识、跨领域的推理、抽象能力、常识等。人工智能时代,程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能,几乎一定可以由机器来完成;反之,那些最能体现人的综合素质的技能,例如,人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美能力和创造性思维,由生活经验及文化熏陶产生的直觉、常识,基于人自身的情感(爱、恨、热情、冷漠等)与他人互动的能力,这些是人工智能时代最有价值,最值得培养、学习的技能。
2 识别模式
如今,机器学习的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中模式识别就是计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。当我们人眼看到一幅画时,我们能够很清晰的知道其中哪里是动物,哪里是山,水,人等等,但是人眼又是如何识别和分辨的呢,其实很简单,人类也是在先验知识和对以往多个此类事物的具体实例进行观察的基础上得到的对此类事物整体性质和特点的认识的,并不是人类原本就有对这类事物的记忆,就好比婴孩时期的我们,并不知道什么是狗,什么是帅哥,什么是美女,但是随着我们的慢慢长大,我们观察的多了,见的多了,再加上过来人的经验指导,我们就知道的多了。 其实,每一种外界的事物都是一种模式,人类平均每天都在进行着很多很多的各种各样的模式识别,人们对外界事物的识别,很大部分是把事物进行分类来完成的。而我们对事物进行辨别,就是模式识别。
2.1 识别模式的主要方法
解决模式识别的方法主要有:模板匹配法,ANN法,基于知识的方法和基于数据的方法。基于知识的方法就是专家系统,句法识别就属于基于知识的,但是句法识别不常用。基于数据的方法也就是基于统计的方法,即依据统计原理来构造分类器,来对未知样本进行预测,这种学习过程是机器学习中研究最多的一个方向,也是模式识别采用的最主要方法。顾名思义,ANN也就是大名鼎鼎的神经网络。模式识别的研究范畴,存在两个极端,要么分类和特征之间的关系完全确定,要么完全随机。
2.2 监督与无监督
简单来说,类别已定的就叫做有监督分类,反之就是无监督分类;前者因为我们有已知划分类别的训练样本来作为学习过程的“导师”,所以很多时候,有监督和无监督,又叫做有导师学习和无导师学习;
后者,在不知道要划分的是什么类别时,我们要做的工作是聚类(clustering),根据样本特征将样本聚成多少类,使属于同一类的样本在一定意义上是相似的,不同类之间的样本则有较大差异,通过聚类得到的类别也称作为聚类,但是通常在聚类中存在一个尺度问题,当设置的尺度不一样,得到的聚类也不一样。所以在很多无监督识别问题中,分类结果并不一定是唯一的,因此在没有特别指定的目的情况下,很难说哪种分类方案更合理。另外,用一种方法在一个样本集上完成了聚类分析,得到了若干个聚类,这种聚类结果只是数学上的一种划分,对应用的实际问题是否有意义,还需要结合更多更专业的知识来进行解释。
2.3 识别模式应用
主要有:语音识别,说话人识别,OCR,复杂图像定目标的识别,根据地震勘探数据对地下储层性质的识别,利用基因表达数据进行癌症的分类等等。
2.4 模式识别系统的构成
一个模式识别系统通常包括典型的四个部分(如下图):对原始数据的获取和预处理,特征提取与特征选择,分来或聚类,后处理;以上四个部分,无论是监督的还是无监督的都共有的,可以说是整个系统的核心所在,也是模式识别学科的主要研究内容。
3 总结与期望
AI来了,有思想的人生并不会因此而黯然失色,因为我们全部的尊严就在于思想。机器带给人类的不是失业,而是更大的自由与更加个性化的人生体验。未来也将是一个人类和机器共存、协作完成各类工作的全新时代。正如谭铁牛院士在中科院第十九次院士大会上的报告《人工智能:天使还是魔鬼?》所说的那样,高科技本身没有天使和魔鬼之分,人工智能也是如此,这一把双刃剑,是天使还是魔鬼取决于人类自身。人工智能在天使手里是天使,在魔鬼手里就是魔鬼。因此我们有必要未雨绸缪形成合力,确保人工智能正面效应,确保人工智能造福于人类。
参考文献
[1]张学工,模式识别[M].北京:清华大学出版社,2000.1
1 交通方式识别关键技术研究
1.1 交通方式识别概述
模式是客观事物活动的方式,它包括客观事物本身,也包括有客观事物在时间和空间分布的信息。时间万物都有其独特性,这种独特性可用三个方面来理解,即可观察性、可区分性和相似性。
在AI(人工智能)领域,模式识别已经是一个重要的分支,和人类自身的识别系统相比,计算机的模式识别,其优势在于计算机拥有极强的计算能力,他可以储存数量极大的样本,并通过对这些样本的分析来提取特征,而完成这些工作,计算机是高效的。如图1所示为计算机模式识别系统的五个基本组成单元。
如图1所示,现阶段的模式识别系统一般都是由五个基本单元来组成。
(1)数据获取单元;(2)预处理单元;(3)特征提取和选择单元;(4)分类器设计单元;(5)决策单元。
1.2 定位技术研究
1.2.1 基站定位技术
在各种定位技术中,基站定位技术是最早开始应用的,基站定位目前采用的主要技术是COO(Cell of Origin)技术,COO技术的基本原理是,在移动终端登录到网络以后会上报自己的小区ID,移动网络会据此估算用户的当前位置,如图2所示。
1.2.2 GPS定位技术
GPS由卫星、地面监控系统和移动终端三个部分组成。卫星提供精密的时间标准并提供定位信息,地面监控系统主要是对卫星工作状态和运行轨道的监控。
1.2.3 A-GPS定位技术
A-GPS定位技术,即辅助GPS定位技术,它是一种对GPS定位方法的改进,A-GPS定位技术仍然无法解决数据缺失和数据漂移问题,但由于有A-GPS服务器的存在,它可以起到很多辅助的作用。
1.3 典型识别算法研究
在数据挖掘、机器学习和模式识别等领域中,都需要分类算法,分类算法可以分为三个步骤:(1)对已知类别训练集进行分析;(2)生成分类规则;(3)通过规则预测新数据的类别。
2 基于智能手机功能的交通方式识别研究
2.1 数据采集
按照现阶段智能手机的流行配置,本系统要求智能手机含有GPS模块、加速度传感器、陀螺仪、声音传感器和SIM卡。因为现在一般的智能手机都能够满足这个要求,本文就不再赘述手机选型。但是采样频率还是需要预先设定:GPS数据每秒采样1次,加速度传感器和陀螺仪的采样频率为32Hz,声音传感器每秒采样30次。
2.2 特征提取
特征量主要包括时域上的特征量,如均值、过均值率、标准差、中位数、最大值与最小值的差、个数等,频域上的特征量包括和、方差两类。
(1)与速度相关的特征量;(2)与加速度相关的特征量;(3)与声音相关的特征量;(4)与交通站点相关的特征量。
2.3 基于改进随机森林算法的模式识别
获取所有的特征之后,随机森林算法过程可做如下描述:(1)输入的数据即样本集,每个样本包含有若干个特征属性和一个类别属性。(2)训练样本集由Bagging方法随机抽取,最后形成的是由N个样本组成的训练样本集。(3)从样本的特征属性中抽取部分属性作为分裂属性。(4)以上步骤重复n次,最后形成由n棵决策树构成的森林,最后再进行汇总排序。
2.4 特征量有效性的验证
特征量有效性的验证即比较使用和不使用的情况下F值的大小就可以了。
2.4.1 陀螺仪
如图3所示为陀螺仪有效性验证结果,验证结果表明,在不使用陀螺仪的情况下, 8种类别的F值均有下降,这也说明,陀螺仪的引入对于交通方式识别起到了一定的作用。
2.4.2 声音传感器
如图4所示为声音传感器有效性验证结果,验证结果表明,相比较陀螺仪,声音传感器的引入对于交通方式识别起到的作用更大。
2.5 模型简化
(1)特征重要性排序;(2)模型简化结果。
模型简化包含两个部分,一个是特征集的简化,那么在特征集简化之后,就可以进行模型本身的简化。