HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 数字图像处理综述

数字图像处理综述

时间:2023-06-08 11:17:57

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇数字图像处理综述,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

数字图像处理综述

第1篇

【关键词】视觉测量 数字图像处理 开放性实验

【中图分类号】G642 【文献标识码】A 【文章编号】1006-9682(2012)10-0001-03

一、引 言

数字图像处理作为一门学科大约形成于20世纪60年代初期,并首次在航空航天领域取得了成功应用。数字图像处理技术的发展除了与计算机技术、信息技术的快速发展密切相关以外,还得益于其在航空航天、工业、生物医学、军事、通信工程、商务、环境、林业等诸多领域的广泛应用,正是这些应用需求,促进了数字图像处理技术的深入研究和快速发展。“数字图像处理”课程是随着计算机和信息技术发展应运而生的一门新兴课程,已成为信息类专业本科生的重要专业课。通过该课程的学习,要求学生掌握数字图像处理的基本概念和原理,能够对图像进行各种处理,如图像增强、图像运算、图像编码、边缘检测等,为图像通信、模式识别、计算机视觉以及其他交叉学科等工程领域的应用奠定基础。

“数字图像处理”课程的理论教学很抽象,仅仅通过理论教学学生很难掌握数字图像处理的基本原理。如果把数字图像处理的广泛应用引入课堂理论教学,将具体知识点与其在实践中的使用相结合,同时为学生提供边学边实践的机会,不仅可以提高学生的学习兴趣,加深对抽象理论知识的理解,增强其动手实践的能力,还可以拓展学生的视野,与目前学科前沿技术相衔接。

二、视觉测量技术

在现代三维测量新技术中,视觉测量是由计算机视觉、图像处理、模式识别等多学科交叉结合而形成的科学。图1所示,视觉测量是一种非接触性测量手段,以数字图像作为信息载体,对被测目标进行成像,通过提取多个像面的二维像点信息,标定相机内、外参数,并重建、优化被测目标的三维信息,实现测量。视觉测量基于严谨的理论和现代的硬软件设施,可以达到相当高的精度和可靠性,便于对大型工件、设备的尺寸、位置、三维轮廓等进行高精度测量,而且移动方便,可快速灵活地构建适于不同测量对象的系统,进行现场测量。目前,视觉测量技术已经广泛应用于建筑工程、航空航天、汽车制造、生物医学、考古等各个领域。[1~5]因此,视觉测量技术正在深入工业生产和社会生活的各个领域,研究和应用新的基于光学、数字图像和视觉信息融合的三维测量方法,既具有重要的理论意义,又具有重大的实用价值,应用前景非常广阔。

根据视觉测量的基本原理,利用数字图像处理技术获取的二维信息是视觉测量中相机标定、三维重建等环节的基础,对于系统的测量精度、稳定性等方面具有决定性的影响,是视觉测量领域的关键技术。在长期的数字图像处理课程教学以及视觉测量研究工作中发现,可以将视觉测量中关于数字图像处理的应用内容引入课堂教学中,与具体理论知识相结合,加深学生对于课程理论的理解,使其接触到科学研究的前沿内容。此外,通过设置开放性实验等环节,引导有兴趣和能力的学生进行实践能力的培养,使学到的知识“活”起来。

三、视觉测量与数字图像处理课程的融合

为了改善数字图像处理课程的教学效果,提高教学效率,将视觉测量技术与数字图像处理课程相融合,本文主要在教学方法和教学手段改革、视觉测量需求与理论知识点结合、实践动手能力提高等方面进行了研究。

1.教学方法和教学手段改革

为了贯彻学生是教育主体的教育思路,使学生学会学习,并充分激发学生的创新能力和素质培养,促进学生个性的发展,同时有利于师生彼此促进共同进步的原则,针对数字图像处理课程的特点,采取了以下措施:

(1)重视数字图像处理课程的基础理论教学。数字图像处理内容丰富,应用灵活广泛,但学生在掌握某些具体应用技术时感到理解困难。因此,在实际教学上,首先需要注重相关的基础理论教学。[6]例如,数字图像的本质是数字信号,所以在课程前期阶段,专门有针对性地复习和讲解了信号分析与处理方面的基本理论,包括数字信号处理的常用方法、离散傅里叶变换和快速傅里叶变换、离散余弦变换等,这些理论在数字图像处理课程中有具体应用。这不仅有利于对数字图像处理内容的掌握,也可以反过来加深对相关理论的理解。另一方面注意授课内容的精选,内容不在于多,而在于少而精,突出重点,使学生在有限学时内有最大的收获。例如,在频域空间进行图像增强时,不能将频域空间的所有方法都对学生讲授,而是突出讲解了关于频域空间与时域空间处理之间的关系,针对频域图像平滑介绍一种低频滤波器,分析其原理和特点。这样不仅节省了教学时间,而且重点突出,同时也引导学生查阅其他相关方法,让他们自己去动脑思考,提高其思维能力。

(2)完善和改革课堂教学方法。在课堂教学过程中,我们始终重视启发式教学,遵循“提出问题”、“启发式思考”、“解决问题”的教学过程,使用“问题教学法”引导学生去思考、分析问题,激发学生学习的积极性,提高教学效果。课堂开始时,根据授课内容,提前向学生抛出相关问题,在讲课过程中则围绕该问题讲解课程内容,最后提出问题的解决方法。例如,在讲解“直方图均衡化图像增强技术”一节内容时,首先向学生展示了两幅曝光不足和曝光过量的图片,并且为了提高学生的学习兴趣,认识数字图像处理的实际应用,图片取自于视觉测量、航空交会对接定位等领域的实际图片,向学生提问,“如果实际应用中,由于环境光的影响,拍摄到了这样的图片,应该怎么办?”课堂讲解过程中,随着直方图、直方图增强技术的理论、直方图均衡化方法等内容的展开,使学生逐渐理解并掌握直方图均衡化方法,最后,给学生演示了直方图均衡化方法的实现,并看到了利用该方法对图片增强前后的图片效果。这种启发引导式的课堂教学方法,取得了良好的效果。

(3)传统和现代化教学手段相结合。随着计算机、通信技术应用的迅速普及,国内高校的课堂教学已普遍采用了多媒体技术,利用计算机、投影仪、幻灯机等现代化教学设备,结合计算机辅助教学(CAI)展示教学内容。这些现代化技术的确为课堂带来了很多丰富多彩的教学手段。数字图像处理是以图像为处理对象,其输出的形式主要以图像和图形为主,该课程也十分适宜将教学内容制成课件,采用多媒体计算机开展现代化教学。借助多媒体,使学生较直观地看到各种图像的处理需求、处理过程、处理效果等,这是普通教材和参考资料所无法比拟的。因此,我们针对课堂教学需求,进行了多媒体课程教学资源建设,如教学大纲、教学日历、授课教案和课件等通过多媒体平成,便于讲课,同时也便于学生课后的复习。例如,将视觉测量原理、过程等,通过多媒体课件的形式演示出来,相比较口头介绍等方法具有更加直观的效果。除了多媒体教学手段,传统的板书式教学作为补充手段也在数字图像处理课程中得到应用,主要用在课堂教学内容框架展示、理论推导等方面。

2.视觉测量与理论知识点结合

为了提高算法对于目标特征的识别效果,视觉测量通常采用圆形或方形特征点(图2),在获取的图像中对特征的成像位置进行识别和精确定位。视觉测量对于图像处理的要求主要包括图像预处理、特征粗定位、特征精定位等内容,对应数字图像处理课程中的图像增强、边缘检测、特征识别、几何运算等知识点。[7]

图2 视觉测量常用特征点

(1)图像预处理。图像预处理的主要方法包括彩色图像灰度化、图像增强等,为此,在讲解彩色图像内容时,介绍了RGB、HSI等彩色模型以及不同彩色模型之间的转换,并引出如何将彩色信息转换成灰度信息。通过分析彩色表示模型,建立了彩色到灰度图像的转换。

向学生展示常用视觉测量图像效果的基础上,为了减少图像噪声的影响、提高图像识别效果,提出改善图像质量的目标,需要进行图像增强。结合图像增强中常用的直方图增强技术、空域和频域图像增强方法在视觉测量图像处理中的实际应用,给学生展示直观的处理效果,加深对图像增强方法的理解。

(2)特征点粗定位。数字图像处理的边缘检测是该课程比较重要的一部分内容,边缘检测中包含了多种方法,便于学生对不同边缘检测算法的作用效果有直观印象,将各种算法应用于视觉测量图像征点的边缘检测,并有针对性地选择相应参数,使学生不仅学习了各种边缘检测算法的使用,也看到了算法的特点。

根据视觉成像的特点,圆形特征点成像后一般为椭圆,所以,利用边缘检测得到的边缘像点数据,讲解用边缘点进行指定特征识别的方法,如基于Hough变换的特征检测方法。为了引导学生思考,采用启发式讲课方法,讲解了Hough变换检测直线的方法,引出如何用Hough变换检测像面上的圆或椭圆,并鼓励有能力的学生实现相应算法。

(3)特征点精定位。特征点精定位的目的是在实现特征点粗定位的基础上,对圆形特征点中心在像面上的精确坐标进行定位。精确定位主要设计到数字图像处理中的点运算,但需要考虑采用的具体定位算法,如灰度重心法、加权灰度重心法、椭圆拟合法等。引导学生通过文献资料查找和实现相关定位算法,并且与国际领先的专业软件进行定位精度对比。通过比较,可以使学生发现不同算法之间的区别,并分析不同的原因。进一步,引导学生尝试对定位算法做一定的改进,这种改进,不需要从算法根本上做出很大的创新,只是从某一方面进行微小的变化,使其能够适合特定的应用需求。例如,如果对视觉测量像面上特征点定位采用加权灰度重心法时,通过调整加权系数,得到不用的效果,从而分析加权系数对于定位精度的影响,并据此得出适用于该需求的结论。

四、开放性实验

长期以来,“数字图像处理”课程教学主要采用课堂理论教学,教学内容也多为经典的内容,很难反映课程内容的时代特征。实验教学是高等教育的重要组成部分,是抽象思维与形象思维、传授知识与训练技能相结合的过程,在人才培养中具有课堂理论教学环节不可替代的作用,对培养理工科大学生的创造性是不可缺少的。虽然目前大多数课程都设置了实践环节,但也普遍存在着很多问题,[8]例如,实验课成绩占课程成绩比例小,学生对实验的重视度不够,存在着抄袭他人实验结果和报告的现象;实验模式单一,实验内容陈旧、呆板,多为验证性实验,缺乏创新性和挑战性,学生完全处于被动状态,最终导致实验不认真,敷衍了事,所学的知识和操作技术遗忘快;不能保证每个学生都有充分的时间和机会做实验,个别学生逐渐养成依赖心理,最终只有一部分学生得到了锻炼;理论课与实验课教学老师分离,造成理论和实践环节脱节等。

针对目前“数字图像处理”课程实验的现状,根据视觉测量像面特征点定位需求,开设相关开放性实验项目“视觉测量特征点提取定位实验”,实验要求学生结合数字图像处理课程知识理论,对视觉测量采集的数字图像进行处理,提取相关特征点。针对视觉测量中常用的特征点(圆形、方形)进行自动检测,并实现高精度定位,主要实验内容包括:图像预处理、特征点粗定位、特征点精定位、算法设计与实现、实验结果分析等。

教师在开放性实验项目中承担的角色主要是方案设计和实施过程中的指导、监督,对方案的具体实现方法不做限制性要求,主要由学生结合课堂教学内容以及查阅文献资料来设计并完成。为了提高项目完成的效率,教师可以通过适当的引导为学生指出主要方向。

对于单个学生来说,这样的实验项目有些困难,“团队合作”也是新时期对科技人才素质的要求,所以可以通过建立项目小组的方式开展实验。小组成员将实验内容进行分工,每人负责不同的部分,通过相互合作、帮助,完成整个实验项目。通过这种形式,也在某种程度上锻炼了学生的团队合作意识和合作方法。

五、结束语

通过将视觉测量领域研究成果引入“数字图像处理”课程,并在教学方法、教学手段、教学内容、开放性实践等方面的改革和尝试,逐步做到科学研究成果与课堂理论教学的有机结合,不仅丰富了课程的教学内容,提高了学生的学习兴趣,加深了对理论知识的理解,而且使学生接触到科学研究的前沿领域,开拓了视野,对创新能力的培养锻炼等方面也具有重要意义。

参考文献

1 E.M. Mikhail, J.S. Bethel. Introduction to Modern Photogramme

-try[M]. New York: John Wiley & Sons,2001

2 胡安文、季铮、盛庆红.基于近景数字视觉测量的飞机表面模型重建[J].地理空间信息,2004(6):23~25

3 Nicola D’Apuzzo. Overview of 3D surface digitization technologi-es in Europe[C]. Three-Dimensional Image Capture and Applications VI, Proc. of SPIE-IS&T Electronic Imaging, San Jose (CA),2006

4 刘常杰、邾继贵、叶声华.汽车白车身机器视觉检测系统[J].汽车工程,2000(6):373~376

5 彭三城、孙星明、刘国华.三维人体自动测量技术综述[J].计算机应用研究,2005(4):1~5

6 Wang Jun, Dong Mingli, Liang Bo. A fast target location method for the photogrammetry system[C].Proc. of SPIE-ISMCM, Beijing,2011

第2篇

关键词:网络 ASP ACCESS

中图分类号:G6 文献标识码:A 文章编号:1674-098X(2013)03(b)-0-01

1 研究背景

2003年4月,中国教育部了《关于启动高等学校教学质量与教学改革工程精品课程建设工作的通知》,提出精品课程是具有一流教师队伍、一流教学内容、一流教学方法、一流教学管理等特质的示范性课程。经过几年的推行实施,国家精品课程在数量上已具有一定规模,质量上也在逐年提高,但是在课程资源等方面仍然存在不足之处:(1)课程资源库建设。在《国家精品课程评价指标体系》中,课程资源主要是通过教学内容和教学条件两大项来评价,他们是课程的核心部分,是教学信息设计、组织与呈现等教学设计思想的具体化表现。经过这几年的努力,课程资源建设模块逐渐约定俗成,绝大多数课程均有课程介绍、教学大纲、教学安排、授课录像和试卷习题等,而实验/实践稍差,学习/教学指导、电子教材和素材库等最为薄弱;(2)课程资源类型。精品课程充分发挥现代教育技术强大功能,采用各种多媒体技术来呈现教学信息,如音/视频、PowerPoint、Word、Flash等,课程资源类型可以分为演示型、过程型、交互型、管理型和评价型5种,但是现在绝大多数课程都不重视过程型和交互型资源的建设,更是忽略知识管理型和评价型资源的建设[1]。

2 需求分析

精品课程网站的设计与开发,充分发挥计算机在呈现信息、提供联系、激发动机、学习评价方面等方面优势,弥补了教师、课本、视听媒体的不足;计算机作为使用者收集和组织信息、探究与批判性思考、合作与交流的工具,能很好的激发学习者的学习动机,促进有意义学习的发生;另外,精品课程的设计与开发,突破了时空限制,具有传播范围广的特点,任何人、任何时间、任何地点都可以按各自的兴趣选择任何课程进行学习。总之,精品课程网站的设计很好的适应了当今世界国际化、信息化、知识化等特征的要求,学习者能更好的实现自主学习。《遥感数字图像处理》是一门专业基础课,是以理论联系实践为主,注重运用,重视上机实践的一门课程。对于这样一门操作性较强的课程,设计与开发它的精品课程网站是非常有必要的。《遥感数字图像处理》精品课程网站的设计与开发依托了校级《遥感数字图像处理》精品课程的建设,面向遥感数字图像处理专业的学生,旨在辅助学生完成对本门课程的自主学习,实现学习效果的最优化,其目的是为了让学生通过学习,打牢遥感数字图像处理的基础知识,进而可以运用到实践中。通过该课程的学习,使学生树立正确的遥感数字图像处理的概念,培养学生良好的计算机实践习惯,实事求是的科学态度和严谨细致的工作作风,为后继课程的学习和将来参加社会生产实践打下基础。

3 主要技术简介

3.1 ASP技术简介

ASP是Microsoft Active Server Pages的简称,是服务器端脚本编写的环境,可以创建和运行动态、交互的Web服务器应用程序,即可以组合HTML页、脚本命令和Web页和基于Web的功能强大的应用程序。ASP不是一种语言,它所使用的语言是Javascript或VBScript,或者是这两种语言的结合体。总的来说,ASP具有以下的特点:(1)使用简单易懂的脚本语言(Javascript或VBScript等),结合HTML就可以快速开发出各种各样的应用程序;(2)不需要编译,容易编写,而且代码在服务器端直接执行;(3)ASP源程序在服务器端被执行后,将执行结果返回给客户端,从而提高了源程序的安全性;(4)可使用服务器端脚本来产生客户端脚本;(5)由于ASP程序在服务器端执行,因此只要客户端使用的浏览器可以执行HTML代码即可。这样便最高限度地保证了ASP程序的通用性;(6)可以使用VB等多种编程语言来开发ActiveX服务器组件来扩充服务器端程序的功能;(7)使用普通的文本编辑器即可对ASP程序进行设计、修改;(8)ASP提供了几种内置对象使得脚本功能更强大,在其他方面,这些对象完成从浏览器中检索或向浏览器发送信息的功能。总之,ASP是目前网页制作技术中最容易学习、灵活性也最大的工具之一。更重要的是它拥有非常好的可扩充性。像标准的HTML文件一样,ASP包含可以被Web浏览器显示并解释的HTML标签。通常放入HTML文件的Java小程序、闪烁文本、用户端脚本、用户端ActiveX控件都可以放入Active Server Pages中[4]。

3.2 ACCESS技术简介

Microsoft Office Access(前名 Microsoft Access)是由微软的关联式数据库管理系统,是 Microsoft Office的主要成员之一。Access能够存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容数据库内的资料。Access 数据库由七种对象组成,它们是表、查询、窗体、报表、宏、页和模块。

表(Table)―是数据库的基本对象之一,是创建其他对象的基础。表由记录组成,记录由字段组成,表用来存贮数据库的数据,因此又称数据表。

查询(Query)―查询可以按索引查找到需要的记录,按要求筛选记录并能连接若干个表的字段从而组成新表。

窗体(Form)―窗体提供了一种方便的浏览、输入及更改数据的窗口。还可以创建子窗体显示相关联的表的内容。窗体也称表单。

报表(Report)―报表的功能是将数据库中的数据汇总,然后打印,以便

分析。

宏(Macro)―宏相当于DOS中的批处理,用来自动执行一系列操作流程。Access列出了一些常用的操作以方便用户选择,使用起来十分便捷。

模块(Module)―模块的功能和宏相似,但其操作比宏更加精细和复杂,用户可根据自己的需求编写程序。

页―是特殊的直接连接到数据库中数据的一种WEB页。通过数据访问页可将数据到Internet 或Intranet上,而且可以适用浏览器进行数据的维护和操作。

参考文献

[1] 许坦,石.精品课程发展现状综述[J].中国电化教育,2007(5):244.

[2] 何克抗,李克东.教育技术学研究方法[M].北京师范大学出版社,2006.

第3篇

关键词:CCD、轨迹、图像处理

视觉在人类生活中起着非常重要的作用,人们每天都通过眼睛采集大量的信息,这些信息经过大脑的处理,成为人们认知和理解世界的基础。机器人视觉信息主要指CCD摄像机采集的二维图像信息。视觉信息能否被正确、实时地处理直接关系到机器人对障碍物的避碰、对路标的识别以及对路径的跟踪,对系统的实时性和鲁棒性具有决定性的作用。视觉信息的处理技术是移动机器人研究中关键的技术之一。为了简化视觉信息处理,通常把移动机器人的工作环境分为结构化道路环境和非结构化道路环境。结构化道路的检测相对来说较易实现,其检测技术一般都以边缘检测为基础,辅以Hough变换、模式匹配等,并利用最小二乘法对应于道路边界的线条,得出道路的几何描述。由于非结构化道路的环境复杂、特征描述困难,使得非结构化道路的检测及信息处理复杂化。

近年来,机器人视觉导航技术有了很大的发展。移动机器人的工作环境可能比较复杂,因此,提高图像识别的准确性以实现移动机器人的准确定位是移动机器人完成其导航任务的首要前提;同时,由于移动机器人在导航过程中需要实时的采集并分析图像信息,从而实现对作业环境的识别以进行准确的路径跟踪。因此,如何在提高图像识别的准确性的同时达到较好的实时性是移动机器人视觉技术的一个发展方向

   1.图像处理

数字图像处理,是对数字图像信息进行加工以满足人的视觉心理或应用需求的行为,数字图像处理的英文名称是"Digital Image Processing'',通常所说的数字图像处理是指用计算机对图像进行的处理,因此也称为计算机图像处理。图像处理就是用一系列的特定操作来改变图像的像素,以达到特定的目标,比如使图像更清晰,或者从图像中提取某些特定的信息等。

CCD摄像头的主要工作原理具体而言,就是摄像头连续地扫描图像上的一行,输出就是一段连续的电压视频信号,该电压信号的高低起伏正反映了该行图像的灰度变化情况。当扫描完一行,视频信号端就输出低于最低视频信号电压的电平(如0.3v),并保持一段时间。这样相当于,紧接着每行图像对应的电压信号之后会有一个电压"凹槽",此"凹槽"叫做行同步脉冲,它是扫描换行的标志。然后就需要跳行,跳过一行后(因为摄像头是隔行扫描的方式),开始扫描新的一行,如此下去,直到扫描完该行的视频信号,接着就会出现一段场消隐区。此区中有若干个复合消隐脉冲,其中会有个脉冲远宽于(即持续时间长于)其它的消隐脉冲,该消隐脉冲又称为场同步脉冲,它是扫描换行的标志。场同步脉冲标志着新的一场的到来,不过,场消隐区恰好跨在上一场的结尾部分和下一场的开始部分,要等到场消隐区过去,下一场的视频信号才真正到来。摄像头每秒扫描25幅图像,每幅又分奇、偶两场,先奇场后偶场,故每秒扫描50场图像。奇场时只扫描图像中的奇数行,偶场时则只扫描偶数行。

选择一款具有全电视信号输出的黑白CCD图像传感器,用LMl881进行信号分离,结合A/D采样,实现了视频信号的采集。在总线周期为400M的情况下,每行采集72个有效数据,摄像头每场信号有320行,其中第23到310行为视频信号。我们从中均匀采集了24行,最后得到一个24×72的二维数组。

CCD采集的原始数据包含了黑线的位置信息,为了稳定可靠地提取这一信息,有一下几种方法:

(1)二值化算法

算法的思路是:设定一个阈值value,对于视频信号矩阵中每一行,从左至右比较各像素值和阈值的大小。若像素值大于等于阈值,则判定该像素对应的是白色道路;反之,则判定对应的是目标指引线。记下第一次和最后一次出现像素值小于阈值时的像素点的列号,算出两者的平均值,以此作为该行上目标指引线的位置。该算法的思想简单,具体实现时还可以一旦检测到左边缘后就退出该行扫描,这样上面的流程图将变得更加简洁。但是这种提取算法鲁棒性较差,当拍摄图像中只有目标指引线一条黑线时,还能准确提取出目标指引线。但当光强有大幅度的变化,或图像中出现其它黑色图像的干扰时,并且离机器人比较近的黑线比较的明显,离机器人越来越远时黑线越来越淡,该算法提取的位置有可能与目标指引线的实际位置偏离较大。

(2)直接边缘检测算法

算法的思路是:设定一个阈值,对于视频信号矩阵中每一行,从左至右求出相邻两像素值的差值(左减右)。若差值大于等于阈值,则判定下一个的像素点对应的是目标指引线的左边缘,以此像点作为该列的特征点,记录下此像素点的列号,作为该行上目标指引线的位置。当然,可能出现差值始终小于阈值的情况,此时一种方法是令该行上目标指引线位置为0,通过进一步滤波或拟合来修正;另一种方法是让该行上目标指引线位置和通过上一场视频数据求得的位置一样。

该算法较二值化方法而言,抗环境光强变化干扰的能力更强.同时还能削弱或消除垂直交叉黑色指引线的干扰。因为该算法在视频信号矩阵中是由左至右来寻找目标指引线的左边缘的,所以当黑色图像出现在目标指引线左方时,该算法无法排除干扰,而当其出现在右方时,则可以排除干扰。

(3)跟踪边缘检测法

这种算法跟直接边缘榆测算法一样,也是寻找出目标指引线的左边缘,仍然用左边缘的位置代表目标指引线的位置。但跟踪边缘检测从视频信号矩阵每行中寻找左边缘的方法与直接边缘检测法不同。

因为目标指引线是连续曲线,所以相邻两行的左边缘点比较靠近。跟踪边缘检测正是利用了这一特性,对直接边缘检测进行了简化。其思路是:若已寻找到某行的左边缘,则下一次就在上一个左边缘附近进行搜寻。这种方法的特点是始终跟踪每行左边缘的附近,去寻找下一列的左边缘,所以称为"跟踪"边缘检测算法。

在首行边缘检测正确的前提下,该算法具有较强的抗干扰性,能更有效地消除垂直交叉黑色指引线的干扰,以及指引线外黑色图像的影响,始终跟踪目标指引线。

另外,较之前两种算法,跟踪边缘检测算法的时间复杂度更低,因此效率更高。但值得注意的是第一行的左边缘位置对整个目标指引线的搜寻影响 很大,一旦它的位置和实际导引线偏差较大,就会产生一连串的错误,这是不可容忍的。

通过比较本系统选择了效率更高,更可靠的跟踪边缘检测法。流程图如图所示:

                           

2.结论

本文中图像处理和路径信息识别的方法,并对不同时刻不同位置采集到的图像的处理效果进行比较研究,结合实际环境中的图像特点,确定出适合于本研究的图像处理算法。提出了改善路径信息辨识速度和精度的方法。

参考文献:

[1]张文志,吕恬生.基于改进的遗传算法和模糊逻辑控制的移动机器人导航[J].机器人.2003,

25(1):1

[2]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报.2000,26(1):44-45

[3]吴文琪,孙增圻.机器视觉中的摄像机定标方法综述[J].计算机应用研究.2004,21(2):4-5

第4篇

关键词:图像;拼接技术;综述

中图分类号:TP391 文献标识码:A文章编号:1007-9599 (2011) 11-0000-01

Image Stitching Technology Overview

Cai Jian

(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)

Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.

Keywords:Image;Stitching technology;Overreview

而在人们的实际生活应用中,所需要的目标场景往往超出普通数码相机、监控摄像机等的视角范围。这些相机,往往在增大视角会降低采集图像的精度,而提高精度又只能窥豹一斑。因此,为了得到应用所需的高分辨、大视角的图像,人们不得不使用广角镜头和全景拍摄相机,这加大了生产、生活的成本,且使用技术不为一般人所能熟悉。所谓图像拼接技术,就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。图像拼接的流程大致分为:获取待拼接的图像,进行图像预处理,图像重叠区域配准,图像的无缝融合,输出所得拼接图像。其中,图像配准和图像融合是图像拼接成功的关机,是拼接的关键技术。因此,国内外学者多围绕此两项技术展开研究和讨论。

图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的效率。

一、图像拼接的应用价值

目前,图像拼接技术已经数据图像处理研究的热门方向之一,被广泛地应用在文物保护(古迹、古文字资料的拼接)、工业监控、刑事案件侦破、医学图像分析、摄影测量学、机器视觉、虚拟现实技术、超分辨率重构、军事地形图像生成等领域,有着实际的应用意义和研究价值。主要表现为:

(一)全景图和超宽视角图像的合成。将普通图像或视频图像进行无缝拼接,得到超宽视角甚至360°的全景图,这样就可以用普通相机实现场面宏大的景物拍摄;

(二)碎片图像的组合。将医学和科研的显微碎片图像或者空间、海底探测得到的局部图像合成大幅的整体图像;

(三)虚拟现实。图像拼接是虚拟现实领域里场景绘制(Image-based Rendering,IBR)方法中的一项基本技术,利用图像拼接技术可以生成全方位图像,用全景图表示实景可代替3D场景建模和绘制。

例如2003年,美国“勇气号”和“机遇号”火星探测器发回了大量的火星地面照片,科学家们就是运用图像拼接技术合成了火星表面的宽视角全景图像。

二、图像拼接的方法

图像拼接的方法很多,不同的算法步骤会有一定差异,但大致的过程是相同的。一般来说,图像拼接主要包括以下步骤:

(一)图像预处理。包括数字图像处理的基本操作(如去噪、边缘提取、直方图处理等)、建立图像的匹配模板以及对图像进行某种变换(如傅里叶变换、小波变换等)等操作。

(二)图像配准。就是采用一定的匹配策略,找出待拼接图像中的模板或特征点在参考图像中对应的位置,进而确定两幅图像之间的变换关系。

(三)建立变换模型。根据模板或者图像特征之间的对应关系,计算出数学模型中的各参数值,从而建立两幅图像的数学变换模型。

(四)统一坐标变换。根据建立的数学转换模型,将待拼接图像转换到参考图像的坐标系中,完成统一坐标变换。

(五)融合重构。将带拼接图像的重合区域进行融合得到拼接重构的平滑无缝全景图像。

三、国内外研究现状

1975年,Kuglin和Hines提出了相位相关算法,该方法具有场景无关性,能将纯二维平移的图像进行精确对齐。1987年,De Castro和Morandi等人使用傅立叶变换将具有旋转变换的图像做对齐,由此产生扩展相位相关法。1996年,Reddy和Chaterji改进了De Castro的算法,基于快速傅立叶变换,利用极坐标和互功率谱,实现了具有平移、旋转和缩放变换的图像配准。

相位相关法虽然计算简单精确,但要求待配准图像之间有较大的重叠比率,同时计算量和适用范围与图像的大小有很大的关系。因此,出现了基于图像几何特征的配准方法。

1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于几何角模型的图像对齐算法。1999年,Bao P.和Xu D.利用小波变换提取保留边(edge-preserving)的视觉模型进行图像的对齐,Nielsen F.则提出了基于几何点特征优化的匹配方法。

随着人们对图像的分析和理解的深入,图像拼接技术的研究也趋于成熟,图像拼接利用的配准特征也从图像的低级特征发展到利用高级特征。

1996年,Richard Szeliksi提出了基于运动的全景图像拼接模型,模型通过采用Levenberg-Marquardt迭代非线性最小化方法(L-M算法)求出图像间的几何变换关系进行配准。此算法效果好、速度快,且能应对平移、旋转和仿射等变换图像的拼接,因此成为图像拼接领域的经典算法。2000年,Shmuel Peleg、Benny Rousso等在其基础上,根据相机的不同运动,自适应的选择拼接模型,通过把图像分割成条进行多重投影,提出了自适应的图像拼接模型,使自适应拼接成为拼接领域研究的又一方向。

国内学者也对图像拼接技术做了大量研究。张祖勋提出了多级影像概率松弛整体匹配技术,对不同传感器、不同空间分辨率的影像进行配准。杜威、李华二人将视频纹理和全景图结合起来,提出一种应用于动态场景的全景图表示方法。赵向阳、独立民提出了基于Harris特征点匹配的自动拼接算法。侯舒维、郭宝龙采用简单的边缘信息阈值法、金字塔式分层搜索策略,提出了一种灰度图像上的快速自动拼接算法。方青、王博亮提出了一种基于比值模版匹配的彩色图像拼接算法。

参考文献:

[1]王娟,师军,吴宪祥.图像拼接技术综述[J].计算机应用研究,2008,25(7):1940-1943,1947

第5篇

关键词:字符切分 图像预处理 小数点 小面积剔除

中图分类号:G64 文献标识码:A 文章编号:1672-3791(2015)05(b)-0222-02

Abstract:The purpose of character segmentation is to cut out entire character string and turn it into a single digital image.Character segmentation is one of the key steps in the digital character recognition.After preprocessing,due to adhesions caused by a decimal point, character segmentation cannot be done correctly.In order to solve the problem of adhesions by decimal, proposing a method by excluding small areas to remove the decimal point.First,we get the statistical area of the various parts of the image,and then determine the threshold to distinguish the decimal from numeric characters,finally exclude the decimal point.After that,we preprocess the image,use linear projection segmentation to pick out the character.The experiment indiclrte that the method works well.

Keywords:Character segmentation;Preprocess;Decimal;Exclude small areas

字符切分主要是指把整个待识别字符串图像中的单个字符都切割提取出来,让它成为单个数字图像以便识别。字符切分准确与否,直接影响着提取到正确的数字特征的成功率,而且识别的正确性也就大大降低了。在字符切分的过程中存在着很多不同的因素,影响着字符的切分,如数字字符大小的不同、数字字符字体的多样性、数字字符的倾斜以及图像预处理结果的清晰程度,都影响着数字字符的切分。

根据黑点数统计进行投影的直线切分方法是一种比较直观和简单的方法,其基本思路为:先对图像进行垂直投影,然后再根据其对应的投影曲线,选取曲线中大波谷作为切分区域。在一般情况下,字符串中的字符间隙都是没有笔画部分,经过垂直投影后在间隙处出现大波谷的部分,根据大波谷来判断进行切分是可以正确切分这些没有粘连和重叠区域的数字串,对于有粘连和重叠区域的数字字符串就无法正确切分了。所以对于印刷体的数字串或者字符间距较大的数字串、书写工整的数字串的切分这种切分,方法都适用。

该文主要研究小数点造成数字字符粘连情况下的直线切分法实现字符切分,采用小面积剔除方法将小数点剔除来解决小数点造成的字符粘连问题,保证字符能顺利切分。

1 直线切分方法

该文使用直线切分方法对数字字符进行切分。直线切分方法是一种相对比较传统的数字字符切分方法,它对简单的二维目标切分非常有效。切分过程中的主要难点在于判断是否有数字字符粘连或者断裂,以及粘连,断裂的数字的处理。

统计图像在水平和竖直方向上的投影,是很常用的一种简单实用方法。它的基本思想是统计出图像在水平投影和竖直投影,然后再分析投影统计值的变化,来具体分析出含有七段式数字显示仪表中的数字字符的位置。这种方法处理的图像主要是二值图像。将经过灰度处理、二值化、膨胀、腐蚀和平滑后的图像用来切分,经过这些预处理后的图像如图1。

由式(1)和式(2)可以得出,水平方向上的投影是图像A列数的一个函数。其中第行对应的投影值,是这一行中黑色像素点的个数。竖直方向上的投影,是图像A行数的一个函数。其中第j列对应的投影值,是这一列中黑色像素点的个数。

使用公式(1)和(2)对待切分数字字符图像进行投影统计,得到图像的水平和竖直投影如图2和3。

由图像的竖直投影可知数字与数字之间存在空白,那么沿着这些空白将数字字符切分,同时依据水平方向投影截去图像上下的空白,得到数字字符切分结果如图4。

2 粘连字符切分

但是,预处理后的图像在使用投影法切分字符的时候,发现会出现字符粘连的在一起。在图像膨胀处理的时候,为了消除七段码之间的间隙、孔洞,但同时将小数点也采取了膨胀处理,导致小数点与前后两个数字字符粘连在一起,如图5。这样的字符粘连在一起使得字符切分的时候前面两个字符没有切分开来,如图6,这样就会造成字符无法识别。

字符切分直接影响字符识别的正确率,如图6这种类型情况就必须将小数点影响解决才能正确切分字符。那么就得在预处理中图像膨胀前将小数点去掉。

此时考虑单个字符与小数点的区别,发现小数点所占面积远小于字符所占面积,如图7。

由图7可以看出,小数点的面积在七段码数字中面积最小,采取剔除小面积区域方法将小数点删除,解决字符粘连的问题,再进行膨胀就不会出现字符粘连情况。字符切分情况如图8。

3 结语

结合直线切分方法,利用水平投影与竖直投影,解决了包含小数点时造成字符粘连的问题,将数字字符从图像中提取出来,为后续作字符识别提供保障。小面积剔除法去除小数点,解决粘连问题效果良好。

参考文献

[1] 张春伶.图像分割算法综述与探索[J].科技创新与应用,2012(10):55-56.

[2] 丁可.数字图像处理技术研究与发展方向[J].经济研究导刊,2013(18):246-247.

第6篇

由于数码图像的普及,以及图像处理和信息提取等技术的快速发展,使人们对图像本身有了更高的要求,并且图像在越来越多的司法或其它鉴定场合成为关键证物,如何在纷乱复杂的图像中去伪存真,提取更完备更正确信息成为了当前数字图像研究中的一个热点。图像取证正是在这个背景下应运而生。

2.图像取证技术的研究意义

自进入二十一世纪以来,随着个人电脑和其他数码设备的大规模普及,图像几乎成了人们每天都能接触到的东西,成为了人们生活中有意或无意都会留下的一个参照物,所以其中包含的巨量的信息是我们取之不尽用之不竭的资源。在司法或其它鉴定领域,只要我们能合理的利用图像直接或间接包含的信息,我们就能获取我们能够想了解的任何一个方面,所以,对图像取证技术的研究具有重大现实意义。只要拥有优越的图像取证方法,我们就能够从图像中看出端倪,进而获取方方面面我们可能用到的信息,为进一步的司法举证或者其他鉴定工作打下良好基础,同时在这个信息时代中借助高科技提供充足的线索,使鉴定人员能够事半功倍的还原现场,大幅度的提升判断速度和工作效率。

3.图像取证技术的分类

人们应用图像取证技术去解决问题的追求主要有以下五个方面:

一是原始证据图像品质达不到需求,需要对图像进行各种优化处理来对图像中的细节信息进行分辨,以便更加细致的对照。在现实生活中,我们经常会遇到数码设备由于光线、环境以及设备自身性能的问题而得到的不清晰的图像,导致图像中的关键目标无法进行分辨,这类图像亟需一种有效的优化方法来区分其中的关键目标,以便为司法或者其他鉴定工作服务;

二是图像资料数量巨大,人们需要更加智能的技术来对图像中感兴趣的信息进行快速检索。当前的软硬件条件下各式各样的图像信息数量庞大,尤其是各种监控设备的广泛应用使得图像数量规模变得更加令人叹为观止,有统计显示,对于一段时长6小时的监控录像,有时甚至需要使用其时长60%以上的工作时间才能完成取证工作,所以人们在这些纷繁复杂的图像信息中寻觅自己关注的特定信息步履维艰,非常需要一种有效的针对图像内容的检索方法来快速的识别自己感兴趣的图像;

三是随着各种图像处理技术的发展和图像处理工具大规模应用,图像变得越来越容易被篡改和伪造,网络上的PS风气日益流行,并且这种修改是肉眼无法觉察的,使得我们在这些真假难辨的图像面前如坠云雾,更有甚者,一些图片伪造者别有用心,希望借其“作品”扰乱视听,歪曲事实,如大名鼎鼎的“华南虎”事件,这类问题造成诸多方面的负面影响,导致政府公信力或者公众判断力下降,破坏社会的安定团结,造成许多恶劣后果。另外许多拥有严格版权的图像也有被侵权之忧,人们需要一种有效的区分图片真伪和来源的方法;

四是图像资料中隐含的间接信息的提取,比如图像中物体的速度或者景深等三维信息,这些都是图像所能提供的间接信息,我们可以根据图像的成像原理,来对其间接信息进行分析和提取,检测图像中目标的位置或速度,来实现一些极具现实意义的应用,比如汽车超速检测等;

五是在有足够的线索时将其他信息转换为图像信息,比如模拟画像和合成照片等参考物证,这些应用是另一个意义上的图像取证。

以上五个方面的应用是建立在当前的硬件应用环境之上的,可概括为增强取证、图像篡改检测、图像间接信息提取、图像内容智能检索、基于信息的图像构建五个方面,对图像取证技术的研究能够在目前这个环境下为人们提供充足的证据,以便对某一事物进行全方位的考察。

4.主要研究方法与现状

本文论述的图像取证问题范围涵盖图像,下面对这图像取证五个方面问题的研究方法与现状分别进行介绍。

4.1 图像增强

从信号图像出现开始,人们便致力于改善图像显示效果,最早的图像增强可追溯到1921年美国和欧洲进行海底电缆通信时,为了改善模拟信号图像的还原效果,研究人员将图像的灰度等级从5个增加到了15个,大大改善了图像复原的效果。到了20世纪60年代,第一台可以进行数字图像处理的计算机研制成功,人们开始用几何校正和灰度变换等方法进行图像增强,到了70年代初,研究者已经将图像增强技术应用到医学图像、地球遥感监测和天文学图像等领域,80年代之后,硬件的快速发展让人们有更充足的图像增强算法来进行选择,进入90年代之后,图像增强技术更广泛的应用到人们的生活和生产等领域,研究者们开始尝试将这些算法嵌入到数码设备中。

目前国内外关于图像增强方法主要有基于空域的方法、基于变换域的方法和基于机器学习或贝叶斯统计的方法等。其中基于空域的方法主要是从子图像乃至像素级别对图像进行直方图均衡[1—2]、线性对比度调整、反锐化掩膜、自适应优化[3]等处理,前两者主要对图像亮度对比度进行优化,后两者主要针对图像边缘细节进行优化。基于变换域的方法包括傅里叶(Fourier)变换、小波(Wavelet)变换、曲波(Curvelet)、脊波(Redgelet)和轮廓波(Contourlet)变换、离散余弦(Discrete Cosine Transform)变换等,其原理是将图像变换到其他空间,然后利用此空间对信号处理的优势进行处理,然后再将此空间里的信号重构为空域图像的形式,以实现优化处理。

较之空域图像增强方法不同,变换域增强方法有其独到的优势。基于空域的图像增强方法往往针对性较强,如直方图均衡方法主要针对图像的对比度进行优化增强,自适应优化和反锐化掩膜主要将图像的边缘细节进行效果提升,而变换域方法有时候能够取得一举多得的效果。

随着数学理论的发展,又出现了许多新的图像增强方法,其中最具代表性的有基于数学形态学的方法、基于模糊数学的方法、基于人工智能的方法和基于偏微分方程的方法等。

4.2 图像篡改伪造检测

自1814年第一张照片问世之后不久,便出现了对照片的修改和加工,1865年著名摄影家Mathew Brady拍摄的一张照片在后期人为的增加了一个人物,从此之后,各种出于政治或者其他目的的图像篡改便流行开来,大部分都是通过拼接手段对照片中的人物或者物品进行增加或者移除,进入数码时代之后,图像篡改变的更加简单易行,随着数码技术和工具的普及,对图像是否为篡改和伪造的甄别成为了计算机领域又一个前沿课题,由于图像篡改检测涉及到司法、舆论、政府公信力和传媒等多方面的利害关系,当前学术界开始对图像篡改检测投入更多的精力进行研究。

Shih—fu chang等人通过研究CCD失真校正、非线性伽马校正、色彩插值、白平衡和传感器噪声等对图像生成的影响,并对这些影响形成的特征进行检测,从而对图像的来源和图像是否拼接进行鉴定。Hany Farid等人利用小波分解和高阶统计建模等方法来对图像素材(包括数码照片、扫描图像和计算机生成图像)进行盲检测,根据来源不同的图像具有各异的高阶统计的特性,结合机器学习和数据挖掘技术,来进行来源检测。Hany Farid和A.Popescu还根据DCT系数直方图中的类采样效应来进行二次压缩检测,并且通过EM算法(Expectation/Maximization)进行数字图像重采样检测。J.Fridrich等人利用数码相机的模式噪声来作为检测标准来判断相机,进行相机识别。马里兰大学的吴旻利用对图像不同块之间DCT系数的相关性、信噪比进行统计和双谱分析的方法,对图像的空域滤波、压缩、重采样、亮度调整等篡改操作进行检测。

在图像防伪方面,数字水印技术是当前研究的热点,并且在国内外的研究中取得了初步的进展。数字图像篡改取证的研究近年来受到了世界上各国研究机构和研究者的重视,在许多国际重要期刊与国际会议上,图像盲取证越来越多的成为一个重要专题,IEEE、Springer都为图像盲取证设置了独立的期刊,数字图像取证科学的前沿性和重要性由此凸显出来,一些图像相关厂商也在其产品中增加关于图像篡改取证的模块,图像处理工具大亨Adobe正准备在其招牌产品Photoshop中增加图像防伪外挂程序,来进行图像真伪和篡改的识别。

数字图像真伪甄别涉及到图像处理分析技术、数理统计、模式识别、数据挖掘、成像原理、计算机视觉等方面的知识,是一项比较复杂的系统工程。

4.3 图像间接信息的提取

成像的过程是将三维景物通过光学系统变换到二维平面上的过程,按照感光媒介不同可分为传统成像系统和现代成像系统,其代表分别为化学胶片和CCD(或CMOS)。在成像的过程中,拍摄目标所包含的各种相关信息也被悉数记录,在计算技术发达的今天,国内外研究者寄希望于将包含在图像中的这些蛛丝马迹加以综合运用,以便获取许多我们以前只有通过物理测量或人工识别才可以获取的信息,这些应用在现代被归类为机器视觉。

机器视觉主要通过将观察对象进行数字化,根据人类的判别规则来对观察目标进行判别,或者逆用成像原理来获取观察目标的物理数据,从而实现对数字化图像信息进行自动化的识别,这些需要识别的信息主要包括被拍摄目标与相机之间的距离、目标运动速度、图像中包含的文字乃至人物等等,对图像中的这些信息进行精确识别一直都是机器视觉领域的研究重点和难点。在现代的生产生活中,机器视觉已经越来越多的被应用到实际,完成一些重复性和机械性的识别工作,以弥补人眼长时间连续进行机械性识别易产生疲劳和不稳定的不足,减轻人类的劳动强度,在一些智能机器人中,也置入了机器视觉模块,以便判断周围环境,为高级人工智能程序提供输入信息。

1987年,Pentland首先提出了图像模糊程度与物体距离之间的关系,并将离焦图像的点扩散函数近似为类高斯函数来进行计算。1988年,Subbarao和Gurumoorthy等人取消了对点扩散函数的限制,利用线扩散函数的扩散参数来代表物体与镜头之间的距离,只需点扩散函数具有圆对称性就可以。1999年,Schechner和Kiryati采用灵敏分析的方法来使用圆柱形点扩散函数估计测距误差和不同频率成分的关系,使离焦测距算法在精度上有了更高的提升。

国内外也有许多学者根据图像中运动模糊位移来测算物体的相对运动速度,Cannon等利用频域中的零值条纹在理论上证明从匀速直线运动模糊图像中估计运动方向和相对运动尺度的可行性,但并没有给出自动鉴别的方法。

在三维重建方面,目前的主要做法是找到图像的被动线索和主动线索,然后根据同一场景的多个角度的图像来进行参数化建模。

4.4 图像内容智能检索

基于图像内容的检索是计算机领域拥有战略意义的新课题,由于其潜在应用价值极大,所以国内外对于这方面的研究都比较重视,从九十年代至今,已经有许多趋近成熟的系统问世。

国际商用公司(IBM)率先研发出第一个图像内容检索系统QBIC,其后麻省理工学院(MIT)也凭借其人才优势研发出了PhotoBook图像检索系统。美国哥伦比亚大学也开发出了VisualSeek,这类系统主要针对如何选择合适的全局特征来描述图像中的内容。为了解决图像内容检索算法实用性比较差的问题,后来的研究者提出了Image Retrieval算法,各国科学家沿着这一方向又研发出了Netra、BlobWorld、SLMPLIcity等系统。

华裔科学家黄煦涛首先将相关反馈技术应用于图像检索,以减少机器低层特征与人类高层语义之间的差异,提高检索结果的针对性。

4.5 基于信息构建图像

在计算机模拟画像方面,早期公安部组织研发了PZY—110型人像组合仪,不过未能在全国推广普及。九十年代由公安部和清华大学开发的自动模拟画像系统通过了专家鉴定。2001年中国刑警学院的赵成文教授的“警星CCK—Ⅲ人像模拟组合系统”开发成功,并达到了国际先进水平。

在颅骨面貌复原方面,我国的吉林大学和意大利都灵大学都采用了首先人工堆颅骨外观修正,再对颅骨各个面的二维图像进行采样并建模。

加拿大哥伦比亚大学的Imager Lab采用参数化人脸模型的办法来进行建模,Giuseppe等人采用CT切片的叠加来进行三维网格建模,取得了较好的复原效果。

5.总结

数字图像取证技术由于起步较晚,尚未形成系统的理论体系和研究模型。本文对图像取证技术及其研究内容做了综述,并总结了图像取证技术五个方面当前的国内外研究方法与现状。图像取证技术是在当前硬件环境下发展起来的一个新兴领域,它包括到图像质量优化、图像真伪鉴别、图像间接信息提取、图像内容智能检索、基于信息构建图像等方面,涉及到信号与信号处理、成像原理、计算机视觉、数学形态学、统计学乃至密码学等领域,是人们从繁杂的图像信息中搜索有价值线索的利器,是与现实生活息息相关的一个研究方向,对于司法取证、图像信息智能过滤和提取、敏感图像真伪鉴别等有很大应用价值,极具现实意义。

参考文献

[1]刘国军,唐降龙,黄剑华等.基于模糊小波的图像对比度增强算法[J].电子学报,2005,33(4):643—646.

[2]A.C.Popescu and H.Farid.Exposing Digital Forgeries by Detecting Duplicated Image Regions[M].Technical Report,TR2004—515,Dartmouth College,Computer Science,2004.

第7篇

[关键词]边缘检测 微地形

[中图分类号] P21 [文献码] B [文章编号] 1000-405X(2013)-7-367-2

1几种经典边缘检测算子的理论分析

1.1 Roberts算子

Roberts算子是2×2算子模板,对具有灰度变化陡峭的低噪声图像响应最好,并且对边缘的定位准确,但由于2×2大小模板没有清楚地中心点所以很难使用。

1.2Sobel算子

Sobel算子认为邻域的像素对当前像素产生的影响不是等价的,所以距离不同的像素具有不同的权值,对算子结果产生的影响也不同。一般来说,距离越大,产生的影响越小。此算子对灰度渐变噪声较多的图像处理得较好。

1.3高斯拉普拉斯算子(Laplacian of Gaussian,LoG)

LOG算法中的高斯平滑运算会导致图像中边缘和其他尖锐不连续部分的模糊。大 值的滤波器产生鲁棒边缘,小 值的滤波器产生精确定位的边缘。只有当两者结合的很好时才能较好地检测出图像的最佳边缘。

1.4Prewitt边缘检测算子

Prewitt算子是一种边缘样板算子。这些算子样板由理想的边缘子图像构成。依次用边缘样板去检测图像,与被检测区域最为相似的样板给出最大值。用这个最大值作为算子的输出值 (i,j),这样可将边缘像素检测出来。

2微地形边界提取方法

2.1微地形

微地形是一个相对概念,就是起伏比较小的地形。一般应用于园林景观设计中,指在庭院景观设计过程中采用人工模拟大地形的形态及其起伏错落的韵律而设计出面积较小的地形,其地面高低起伏但起伏幅度不太大。微地形具有地面起伏小,高程精度要求高,地形单元复杂等特点。

2.2经典算子在微地形边缘检测方面存在不足

2.2.1经典算子效果比较与分析

Roberts 算子提取边缘的结果边缘较粗, Sobel算子和Prewitt 算子对边缘的定位就准确了一些,而采用拉普拉高斯算子进行边缘提取的结果要明显优于前三种算子,特别是边缘比较完整,位置比较准确。

2.2.2经典算子的不足之处

(1)针对性比较强,精度都不算特别高,而且在边缘提取中存在着抗噪性和检测精度的矛盾。若要提高检测精度,则会检测到噪声产生伪边缘,从而导致不合理的轮廓。若要提高抗噪性,则会产生轮廓漏检和位置偏差。

(2)对噪声极度敏感,执行边缘检测的结果常常是把噪声当作边缘点检测出来,而真正的边缘也由于受到噪声干扰而没有检测出来。

(3)这几种边缘检测算子在做微地形边缘检测时都不能很好地提取出其真正的边缘。易出现很多伪边缘,效果均不理想。

3微地形对象识别方法

由以上的分析和实例验证可以看出,LOG算子虽然存在一些缺点,但是还是以上几种方法中提取边缘比较完整的一个,Sobel算子提取出的边缘比较清晰,虚假边缘比较少,提供了较为精确的边缘方向信息;且由于Sobel算子对噪声具有平滑作用,因此噪声对它的影响不太明显。所以可以考虑把这两种算子结合起来,互相弥补其不足,保留其优点。

一种简单的结合方法,就是采取阈值分割保留的方法。首先对图像f(i,j)进行Sobel算子的边缘提取,查看得到的图像s(i,j)的直方图,如图所示,再对原图f进行LOG算子处理,处理后的图像为l(i,j)。

由图3.1可以看出:经Sobel算子处理后的图像s(i,j)的大部分的灰度级集中在150以下,据此,可以选取一个阈值T,当Ts(i,j)时,仍处理为s(i,j)。此处Sobel算子所起的作用就是为了确定边缘位置,减少虚假边缘的出现,同时也抑制了噪声对边缘提取的影响。

当然,阈值的选择要根据图像s(i,j)和图像l(i,j)的直方图来确定。由图3.1可以看出,图像s(i,j)的灰度值大部分集中在150以下,为了保证可以提取出完整的轮廓,阈值选在50和150之间。阈值选得越大,提取出的边缘信息越少,图像越接近于s(i,j);反之,阈值选得越小,提取出的边缘细节信息越多,图像越接近于l(i,j),同时噪声的影响也越大,虚假边缘也越多。阈值的选择由操作者自己根据Sobel算子处理后的图形s(i,j)的直方图来确定.

在实际工作中,为了提高算法本身的自动性,常常希望可以自动确定阈值,而不是靠肉眼的观察和一些经验来反复判断。因此,需要找到一种确定阈值的算法,可以最终得到与经验判断相符合的结果。提取方法如下:

图像经过Sobel算子处理以后,图像的轮廓细节与背景之间的差别已经被加强,也就是说图像细节与背景之间的差异也被扩大了。而在此选择阈值的目的就是把边缘细节与背景分割开来,提取出边缘区域,让LOG算子对边缘区域进行处理。而从统计意义上讲,方差是表征数据分布不均衡性的统计量,要通过阈值对两类问题进行分割,显然,适当的阈值使得两类数据间的方差越大越好,表明该阈值的确将两类不同的问题区分开了,同时希望属于同一类问题的数据之间的方差越小越好,表明同一类问题具有一定的相似性。因此可以采用类间、类内方差比来作为选择阈值的评价参数。该方法的具体实现步骤如下:

1)求出图像中所有像素的分布概率P0,P1,…,P255;

2)给定一个初始阈值Th=Th0,将图像分为C1和C2两类;

3)计算两类的方差σ12和σ22;,灰度均值u1和u2,以及图像的总体灰度均值u;

4)计算两类问题的发生概率P1和P2: , P2=1一Pl

5)计算类间方差σb2,类内方差σin2:

6)选择最佳阈值Th=Th’,使得图像按照该阈值分为C1和C2两类后,满足:

3 实验结果

图中水田、田埂、树木等都属于微地形地物,这是一幅农田的近景影像图,灰度色调较暗,而且后面的天空有云彩等的影响,传统的算法很容易提取出伪边缘。

实验结果表明,这种方法处理微地形的效果优于其它算子。能够较好的提取出地物的边缘,并且抗噪声的能力也较强。在实际的图像边缘提取工作中,LOG算子是常用的一种算子,相比其它经典算子而言,具有平滑噪声点、边缘定位准确的优点。但其固有的缺点也限制了它的使用。本文把Sobel算子和LOG算子结合起来,在一定程度上用Sobel算子的优点弥补了LOG算子的缺点,改进了LOG算子,既抑制了图像中的大部分噪声,又保证了较高的边缘定位精度,对于微地形地物的提取有较好的效果。

参考文献

[1] 唐良瑞,马全明,景晓军等.图像处理实用技术[M].北京:化学工业出版社,2001.

[2] 管宏蕊,丁辉.图像边缘检测经典算法研究综述[J].首都师范大学学报自然科学版.2009,30(4):66-68.

第8篇

关键词:数字仪表;液晶;图象处理;数字识别;特征提取

中图分类号:TP391

随着生产智能化的发展,自动化设备广泛应用于工业控制、交通、生产领域。由于技术的进步以及成本的降低,液晶显示屏逐渐取代数码管,成为自动化仪表的关键显示设备,显示包括温度、湿度、指标、参数等重要数据。为了实现生产和监控的自动化,往往需要对仪表液晶显示屏的值进行识别。由于各类仪表液晶显示屏显示差别较大,数值识别方法各异,导致识别的成功率较低。

近年来计算机视觉技术和数字图像处理技术的不断发展,提高了数值识别效率和精度。利用摄像机完成表盘及背景图像的采集,并将其转换成数字信号,然后利用数字图像处理技术实现关键操作,实现自动化仪表的数值自动识别,提高了数值识别效率和精度,大大降低了生产成本。

1 课题背景与技术简介

1.1 液晶显示识别概念。液晶显示识别是对自动化仪表中的液晶显示数值进行计算机识别,通过减背景、色泽分析方法进行字符的提取,用投影方法进行单个字符的分割,利用认知模型,分析采集的图像的数值信息。

1.2 液晶显示识别技术现状。自动化仪表液晶显示的广泛应用,使得液晶数值显示识别方法也逐步发展和进步。本文将对常用的液晶数值显示识别方法进行分析,常用的液晶显示识别技术有统计模式识别技术、结构模式识别技术与模糊模式识别技术。(1)液晶显示统计模式识别技术。该方法利用液晶数值显示属于同一类别的各个模式之间的差异来实现识别,主要的识别误差由环境噪声和传感器的性质所引起的,部分是模式本身所具有的随机性质。该方法利用液晶数值识别来表示液晶显示形状上稍有差异的字符时,不仅是由分布选中液晶数值识别对应的特征空间的值点,而是分布在特征空间的某个区域。该区域能够表示液晶显示点随机向量实现的集合。从直观上看在液晶数值识别中规定某种距离度量,两点之间的距离越小,它们所对应的模式就越相似。(2)液晶显示结构模式识别技术。该方法利用液晶数值显示的基本组成元素(基元)及其相互间的结构关系对液晶数值进行描述和识别的方法。该方法有效地图像特征信息表示液晶显示的结构信息,因此也常称为液晶显示结构模式识别。(3)液晶显示模糊模式识别技术。该方法主要对利用人工智能的理念,用思维现象对抽象事物进行识别主。当对液晶显示数值进行识别时,利用人脑思维认识模型,分析其在人脑中感官液晶显示的数值,并使机器能够学习这种认知方法。

2 仪表液晶显示识别原理设计

本文针对目前仪表液晶显示识别存在识别效率低、实现难度大的缺点,在上述识别方法的基础上,提出一种高识别率的仪表液晶显示值自动实时识别方法。该方法主要包括:定位特征区域、字符提取方法、数字识别算法。

2.1 定位数字区域。本文提出的方法首先对液晶屏的数字区域进行定位,定位过程包括粗定位与细定位。

(1)粗定位。首先把从液晶显示屏中采集的原始图像转换为灰度图,再求取其灰度能量图,依据直方图中的峰值能量,前后放宽5个能量级。

图1 采集的原始图与灰度图

图2 灰度能量图

再对比生成的灰度图与能量映射图。若特定灰度图中图点的能量值在液晶屏灰度级的范围内,则看作是显示数值区域,由此类推把映射图中相应的图点赋黑色值;否则看作字段区域,赋予白色值。根据能量映射图与灰度图对比效果,采用图像投影法,对液晶显示屏字段区域进行粗定位。

(2)细定位。在完成液晶显示数字区域粗定位后,对识别的数字区域进行从上到下的数字的按行统计。当能量映射图的水平投影有效图点的总数超过数字区域的1/2 宽度时,将记录此操作数字为起始行。通常为减少误判字段的开始位置的几率,再尝试向下操作若干行,假设选定的特定行也有足够的图点总数,则可认为记录的行为数字区域的有效起始行,否则清除之前的操作,并选择向下查找起始行。确定起始行后,对于第二行、第三行直至边界区的行也可使用相同的方法。假定每行的图点足够判定时,即可保障判定的判定记录的鲁棒性。完成横向方向的查找后,即可使用类似方法对数字区域进行局部垂直投影,从数字区域的垂直中线开始查找左右边界。

2.2 字符提取。本文采用的字符提取方法是基于减背景方法的字符提取。该方法首先提取数字区域中的前背景信息,把数字区域中的每个图点与背景模板中的图点作差运算,若灰度能量对比相对较少时,则判定选定的图点为背景区域,把该图点赋予白色值,灰度能量对比相对较大的图点保留原来的灰度。将数字区域中每个图点都与背景模板中对应的图点进行差值运算操作,得出的数字区域能够保留重要的判别信息。

2.3 数字识别。本文采用的数字识别技术是基于神经网络的数字识别技术,该技术对预先设定的每种输入参数组合都设定一个预期值。根据输入的参数组合,向构造的神经网络输入实际的识别模型,并由Input层经消息处理层向Output层传播。实际Output与预期输出之差即为误差。参照平方误差最小的认知规则,由Output层往消息处理层逐层修正连接加权。在送入神经训练网络前,对单个数值作归一化处理,并把数值存贮在一个16*16 的数组中,作为网络的Input层。

3 仿真及结果分析

本文在实验中采用分辨率为640×480的摄像头采集图像,其中分别采取了大量不同亮度,不同对比度的图像。

本文使用3层神经网络模型,对液晶显示的数字0-9进行识别。网络的Input为56维;隐含层为8个神经元;允许的Output误差在0.01-0.1之间。利用神经网络进行液晶显示数字的识别分2步完成。首先通过对液晶显示屏数字采集大量带有噪声的数字区域图,同时,构造神经网络,采集数字区域图所需时间较长。通过神经网络,将认知过程中得到的信息存储在矩阵中。进行数字识别时,直接调用这些连接权值,以此缩短识别周期。该方法具有很强的容错性。

自动化仪表液晶数字自动识别系统测试结果如下:考察样本集字符数为100;训练样本集字符数为600;识别率为94.58%;拒识率为5.42%。可以看出,系统实现了很高的识别率和较强的稳定性,证明了该算法对自动化仪表液晶数字符识别的可行性。

参考文献:

[1]李衍忠,蔡英杰,姒强.DDS谱质分析及其杂散抑制研究综述[J].现代雷达,2000,22(4):33-38.

[2]申小阳,唐轶峻,姜柏军.仪表的数字字符识别系统[J].仪表技术与传感器,2005,6:55-57.

[3]严义,包健.一种实用视觉识别的仪表自动检定系统[J].计算机应用,2002,1:28-30.

[4]章毓晋.图像分割[M].北京:科学出版社,2001:67-70.

第9篇

关键词:隆昌石牌坊;文化遗产;数字化;保护

中图分类号:J05 文献标志码:A 文章编号:1007-0125(2014)10-0168-02

二战以后,世界各地许多有远见卓识的人士意识到战争、自然灾害、环境灾难、工业发展等威胁着分布在世界各地的许多珍贵的文化与自然遗产。一方面,因年久腐变所致;另一方面,变化中的社会和经济条件,如战争、自然灾害、环境灾难、工业发展等的影响,造成了更加难以弥补的损害或破坏现象。“文化遗产”是祖先留下来的文化财产与人类文化发展相关的事物皆可被认为是文化遗产,文化遗产具有艺术价值和应用价值,是人类证明自身智慧和身份,并涵养自身精神、智慧与心灵的最好标志与养料。

一、民族文化遗产的数字化保护方案探索

新世纪以来,世界各种对民族文化遗产的保护更加关注和重视,伴随着数字化技术甚至是数字媒体产业的崛起,不仅在各种工业领域得以广泛应用,在保护文化遗产方面也显露了引人瞩目的效果,给文化遗产保护事业开辟了新的途径。

(一)数字图像处理

计算机图像技术是文化遗产数字化的重要手段之一 。文化遗产数字化需要处理大量的实物图像和制作虚拟图像,需要应用最新的图形图像成果。涉及图像处理、图像过滤、图像理解、图像检索等,甚至还包括与图像处理密切相关的技术,包括:图像形状分析、图像的对象分割、图像库相关反馈技术、图像自动分类、图像学习与理解。

(二)数字动画制作

计算机动画不但是文化遗产数字化的核心技术,是一种高度假定性的电影艺术,也是虚拟显示技术的核心基础。技术研究角度工作流程可分为计算机辅助二维动画和计算机辅助三维动画;在动画合成方面,又有动画特技合成、动画实景合成、动画模型合成,甚至还包括动画显微摄影合成等不同分法。

(三)多媒体数据库

数字化信息组织的标准和规范制定了很多,目前网上数字资源比较常用的元数据格式有MARC(中国味CNMARC,WH/T0503-96)、Dublin Core(DC)、VRA核心类目、REACH著录元素集等。其中,DC因其通俗易懂,包括有15各基本著录项:题名、主题、说明、语种、来源、关联、覆盖范围、创建者等,方便使用,得到了国际社会的普遍认可,有望成为国际标准。

二、隆昌石牌坊群可数字化资源的调研分析

突出数字化保护与开发的双重目标。一方面,古老的石牌坊群需要延续和保护,另一方面,相关的知识和信息也需要传播与共享。在传统方式下,遗产的保护和利用存在着矛盾,始终处于两难的境地,但数字化之后这一矛盾得到了破解。

(一)隆昌石牌坊综述

牌坊是一种纪念性建筑,主要有柱、依柱石、梁、枋、楼等几部分组成。牌坊建在里坊、路口、街旁,甚至是建陵墓、祠堂、衙署、园林等处,既可作为一种标志,也可用于褒扬功德、旌表节烈。从牌坊的作用或者建造意图来说,可以将之分为三大类:标志坊、功德坊和节烈坊。标志坊是在某些具有纪念意义的地方所建的牌坊,作为一种标志,并起着昭示后人的作用。功德坊是彰显有功名者的功名、整机的功名坊和表彰某人的性的道德坊的合称。节烈坊则是用来表彰忠臣、孝子和贞洁烈女的,尤其是表彰妇女贞洁的最多。据《隆昌县志》及1954年四川省第4文物调查组调查资料记载:隆昌境内沿6条古驿道而建有石牌坊69座,另有多达171座庙的镇山门坊。经数百年自然侵蚀,特别是“”10年人为破坏,隆昌石牌坊现存17座。有功德坊(5座)、节孝坊(4座)、功德坊(2座)、贞洁坊、孝子坊、百寿坊、嵌磁观赏坊(各1座)、山门坊(2座)。

(二)隆昌石牌坊群所所蕴含的的相关信息

牌坊的字牌、牌坊的立柱、牌坊的枋字牌是牌坊上用来题写或雕刻文字的板面。牌坊具有标志意义、纪念意义或者是其他意义,都从牌坊上的字牌内容显示出来。因为牌坊上的坊名、牌坊是为谁而立、得以立坊者的官职、姓名等内容,都书刻在字牌上。

牌坊的立柱:牌坊主要就是由竖向的柱子和横向的枋构成,因而立柱自然是牌坊中不可缺少的构建之一,它主要作用起着支承的作用,支撑着上面的坊或坊与屋顶。牌坊的立柱有圆柱和立柱两种形式,还有一些较为高大的牌坊,其立柱网网是在大柱边附设小柱,以增加承重功能,并显示气势。

牌坊的枋:牌坊中的横向大构件都是枋,它的主要是连接直立的柱子,并与柱子共同承托牌坊上的雕饰以及有楼的牌坊顶。就牌坊雕刻来说,也是大部分雕饰在枋面上或下枋之间。牌坊的等级和造坊这的经济实力等情况,也能从枋的多少、仿的制作难易、枋上的雕刻显示出来。

三、四川隆昌石牌坊群数字化应用实施方案

数字技术能够鼓励和提高学者的进一步协作,能够引领跨领域的合作,有一些项目正利用多媒体和地球空间信息技术,利用高动态图像技术,促进建筑遗迹的档案整理工作。以数字化方式重建历史建筑、城市以及历史事件。全部浓缩到构建一个“民族文化遗产数字中化保护与展示中心”是我们的目标,围绕其进行挖掘、抢救、保护、开发、展示、传播、利用民族文化遗产资源是整个完整的过程。

(一)网站建设

大多数网站可以有两种不同的定位,一种是图像收集,另一种是对单个的文物进行深入的研究,比较不同的,给用户提供一些更多和相关那个时期的历史、经济方面的信息等等。比如你可以把图片放大观察其中的细节。

(二)数字复原技术

很多文化遗产由于时间的流逝,被外界的自然环境所侵蚀,同时也遭受着人为的破坏,变得破旧不堪。图形复原技术以及刚刚提出的利用level set 进行三维模型的复原技术,为文化遗产的数字化保护带来了新的生机。在二维图像复原技术方面,目前已经提出了消除数字图像中裂痕的算法,在三维模型复原方面,可以用level set 的方法进行复原。三维模型的复原技术对于将来恢复一些破损或不完整的雕塑文物有举足轻重的作用。

(三)开发相关游戏平台

游戏作为大众文化的一种形式,在塑造社会文化方面起着重要的作用,在信息技术及数字化技术发达的今天,网络游戏、视频游戏、计算机游戏、手机游戏、街机游戏等名目繁多的数字化游戏的发展虚度更是惊人,在人们生活中占据了重要的地位,已经成为二十一世纪的主流文化形式之一。

具体的实施方案如下:

1、针对隆昌石牌坊群所独有的民间传说故事,当地民风民俗以及雕刻图案所透露出的人物性格特点,设定成具体的游戏故事情节和人物角色,开发一些可交互性的各种游戏,使人们能够以一种轻松、愉悦的方式领略四川的民族文化及原始艺术的魅力。

2、与一些游戏公司展开合作,针对游戏情节设计,将隆昌石牌坊群的经典的故事和传说设计为很多游戏的任务关卡,依据人物造型设计游戏的角色,虚拟牌坊、庙宇设计游戏的场景等,这些都主要是突出隆昌石牌坊群的艺术特点和当地的人文历史文化。

四、结论

文化遗产的数字化传承是在科学和艺术的交叉领域中产生的新课题。文化遗产的理论研究还有待更深入的验证和探讨。本文只是将信息理论应用到了民族文化遗产的理论研究中去,应用信息可视化进行数字化文化遗产的研究具有一定的必然性、可行性,当然也面临一定的问题。毕竟技术不能完全解决思维的问题。更多更有效的方法可能我们还没能挖掘和思考到。

参考文献:

[1] 郑论.隆昌石牌坊[M].重庆出版社,2006.

[2] 贾磊磊.数字化时代文化遗产的保护和展现[M].文化艺术出版社,2010.

[3] 王耀希.民族文化遗产数字化[M].四川美术出版社,2009.

[4] 张强.隆昌石牌坊[M].重庆出版社,2006.

第10篇

关键词:人脸修饰;频域滤波;几何表示;演化模型

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015)22-0119-03

Abstract: With the popularity of digital cameras, mobile phones and other camera equipment, automatic face modification technology has become a research hotspot in the field of computer vision, digital image processing. In this paper, the framework and the new progress of automatic face modification technology are summarized. The algorithm based on frequency domain filtering, the algorithm based on geometric representation, and the algorithm based on age evolution model are summarized. The main algorithms are introduced and the advantages and disadvantages of various algorithms are also analyzed. Through the research on the practical problems in the domestic and international application, the challenge and the shortage of the automatic face modification technology are presented.

Key words: face modification; frequency domain filtering; geometric representation; evolution model

随着图像信息处理技术的不断进步,以及拍照设备的普及,人们对照片的处理需求不断提高,尤其是针对面部图像的修饰技术已成为电脑软件和手机软件的一个开发热点,比如:美图秀秀、人人-美颜美图、光影魔术手等。这些软件不要求用户具有专业的图像处理技术,可以方便地实现美化照片的效果。

人脸自动修饰与渲染是计算摄影领域中新的研究热点。其主要关注人脸照片品质的提高,更关注对人脸的某些属性的处理,如:对人脸皱纹的去除、肤色的改善、光洁度的提高等。人们希望经自动修饰与渲染的照片,能够符合视觉感知习惯、更具吸引力,改变传统的摄影、图像处理工作需繁复的人工操作的现状。因此,在摄影、广告设计、电影制作、数字娱乐、专业研究领域都有着广泛的应用前景。

本文对自动人脸修饰技术的研究背景、研究现状进行了综述,列举了近几年自动人脸修饰技术的主要算法,以及算法的改进、对比,最后对自动人脸修饰技术发展趋势、存在的问题、下一步的研究方向进行了阐述。

1 人脸修饰技术研究进展

1.1 基于频域滤波的方法

该算法可以实现图像中高频率瑕疵(如:皱纹、斑点)的去除,进而完成人脸的修饰,使处理后图片看上去更白、更美观,但该算法当遇到大范围皱纹、斑点等瑕疵时的处理效果不理想。

1.2 基于几何表示的方法

此外还有一些修改人脸外形的算法,通过对面部轮廓和器官作适当变形,使其更加贴近最优脸型,达到优化人脸的目的。但该类算法容易造成修改后的人脸对标准人脸的依赖,调整过大时,容易造成人脸原来特征的丢失。

1.3 基于年龄演化模型的方法

基于年龄演化模型的算法通常基于FG-NET数据库、MORPH数据库开展实验。FG-NET数据库包含了82个人,年龄从0~69岁,共有1002张照片,为包含大的年龄跨度里面收集的照片直接采自被拍摄者的老照片,因此拍摄角度、环境、光照条件都不能一致,有的照片还有帽子、眼镜等遮挡,年代很早的照片都是黑白照片,而且早期的照片,受拍照摄备所限,画面不够清晰。但FG-NET仍然是现有的人脸年龄数据库中,唯一包含了0~18岁照片的数据库,而且照片反映的年龄跨度大、且密集。

MORPH数据库是最大的、已公开的纵向人脸数据库。该数据库包含超过13000人的55000幅图像,年龄跨度在16岁到77岁之间,并且该数据库还在不断扩种中。MORPH数据库除了包含人脸照片,还包含被拍照者的年龄、性别、种族、体重、身高等信息,可供面部分析、年龄分析、面部识别的研究使用。

现阶段年龄相关的人脸数据库还很不完善,人脸图像的采集需要经历相当长时间的跟踪拍摄,这需要相当长时间的积累,并且考虑包含不同种族、性别、地域的人脸照片。

在计算机视觉领域,年龄演化问题是一个研究热点。基于年龄演化模型的自动人脸修饰技术的关键是通过各年龄段的人脸照片构建合适的年龄演化模型。

早期的基于年龄演化模型的自动人脸算法中,结合了小波变换的内容,如:参考文献[3]中,Tidderman提出了通过小波变换建立特征向量,并针对不同年龄构建合成人脸。实验结果表明,当使用小区域边缘强度加权来保留边缘特征后,根据年龄进行人脸修饰的效果更明显。对这一算法进一步改进,通过MRF模型在小波变换后进行年龄演化过程中的人脸特征学习,可以实现人脸的年轻化修饰、以及性别修改。实验结果表明,MRF模型比单纯使用小波变换对人脸的修饰效果要好。

此外,还有根据生物学、遗传学等领域的研究来建立年龄演化模型的方法。如:参考文献[4]中,Ramanathan根据生物学中颅面骨的生长规律,对0-18岁期间的人脸建立基于年龄影响的模型,融入人体测量学的方法,即:人脸不同部位在不同年龄段会有不同的生长进度,来提取不同年龄段人脸的特征。图3显示了侧面人脸随年龄增长的模型,及对应不同年龄跨度,产生的特征参数k。通过最优化计算人脸成长参数k,来实现不同年龄人脸比例的转换,图4显示了参考文献[4] 的实验结果。

针对成年人的年龄演化模型,如:参考文献[5]中,Ramanathan考虑到人的衰老,主要体现在面部肌肉的弹性变差、皱纹的增加,提出了与年龄相关的形状、纹理变化的模型,可以用来修饰人脸产生老化特征,如:额头皱纹、眼角纹、嘴角纹等。实验通过将数据库人脸按年龄分组,年龄跨度在10岁,如:21-30岁一组,31-40岁一组等,搜集的实验数据可以很好的反映随年龄、性别、种族等变化而产生的形状、纹理特征。

综上,基于年龄演化模型的自动人脸修饰技术先要对人脸数据库按年龄分组,对不同分组提取特征,得到经年龄演化修饰后的图像。实验效果很大程度上依赖于人脸数据库,为了得到好的演化效果,需要使用年龄跨度大的人脸照片。

2 总结

本文总结了国内外关于自动人脸修饰技术的算法框架,主要针对基于频域滤波的算法、基于几何表示的算法、基于年龄演化模型地算法进行了归纳,这些算法仍存在很大的改善空间,下一步研究可以考虑如下问题:

1)自动人脸修饰技术最重要的是保留人脸的个性化特征,不能在修饰后面目全非,因此如何在特征提取过程中尽量保留原照片的个性化特征,仍然需要继续探讨。

2)现阶段的自动修饰技术,会使修饰的结果和方向趋于一致,如何使美化修饰过程具有一定的个性化是一个有待进一步研究的问题。

最后,为了使自动人脸修饰技术的应用更具有利用价值,在算法的改进中不能只局限于现有的数据模型、年龄演化模型,可以跨学科地尝试、引入新的模型方法,以期在更具有实用价值的指导下设计新的算法或改进。

参考文献:

[1] 韩静亮,赵曦,赵群飞,等.基于迭代多级中值滤波的人脸美化算法[J].计算机应用与软件,2010,27(5): 227-229.

[2] Leyvand T, Cohen-Or D, Dror G, et al., Data-driven enhancement of facial attractiveness, in ACM Transactions on Graphics(TOG), 2008: 38.

[3] Tidderman B, Stirrat B, Perrett D I, Towards realism in facial image transformations: Results from a wavelet mrf method, Computer Graphics Forum,2005, vol. 24: 449-456.

第11篇

数字媒体专业设置在理工科院校、艺术类院校或传媒类院校等不同院校时往往还会有自身鲜明的特色,在课程体系的设置会有不同的偏重。本文的讨论将结合山东大学数字媒体技术专业的专业特点予以展开。

1课程体系设计原则

面向新时期的人才需求,明确数字媒体专业的定位,借鉴学习国内外知名院校相似、相近专业的课程体系培养方案,并加以整理总结与分析,在此基础上,从科学、系统地制定教学计划出发,组织本专业课程内容,构建合理的专业知识结构。

在课程体系的建设中必须体现知识结构的综合性,使得学生通过该专业的学习,可以充分理解数字媒体相关领域的基础理论知识;熟悉特定应用领域的软硬件环境与工具;并适应快速发展的数字媒体技术。

2课程体系设计方法

在课程体系的设置上,首先做到“强化基础,突出特色”,实施2+2模式。针对一二年级的学生设置的课程重在打实基础,包括数字媒体相关的基础理论知识、基本的技术技能与艺术修养;在三四年级所开设的课程强化个人的专业方向特色,避免不恰当地期望学生面面俱到,否则学生在将来就业时可能无所适从。应当在课程安排上尽可能给予学生足够的选择,能够使学生在具备计算机技术与艺术两方面的基础的同时,塑造自身的专长。

实现课程设置的模块化是应对上述需求的有效手段。山东大学数字媒体技术专业采取课程群的方式,对课程体系进行组织优化。相关相近课程在条件成熟的基础上,可以组成课程群,建立大梯队,按课程群进行课程建设,就本课程群课程的设置、知识点、学分安排、相互之间的内容衔接等问题开展研究探讨,并形成课程设置的调研报告,进而加强课程间的衔接与协调,获得整体优化。

课程群的设置以群内课程内容相关性较强、群间课程内容相对独立为原则,同时考虑不同专业方向的课程模块设置的要求进行划分。原则上每个课程群内的课程数目在5~10门。课程群设置相对固定。如果某课程群课程数目过多或过少,或根据设置新的专业课程模块的要求,可以进行必要的课程群课程调整。

3课程体系设计案例

按照初步的规划,主要课程群可以包括:公共(数学)基础、计算机软硬件基础、人文艺术基础、数字媒体专业基础、游戏开发、动漫技术以及数字内容管理等。

主干课程可以包括:高级程序设计语言、数据结构、面向对象开发技术、离散数学、操作系统、软件工程、数据库系统、计算机网络、计算机组成、素描基础、彩画基础、速写基础、色彩构成、平面/立体设计、脚本策划、多媒体技术、计算机图形学、人机交互、数字图像处理技术、高级渲染理论与技术、动画造型、动画渲染、角色与场景动画、计算机游戏引擎技术、PC/视频游戏编程、游戏项目管理、Web搜索技术、Web设计技术、内容管理与版权保护等。

课程群与具体课程的对应关系请参考图1。课程群的设置规划还需要结合各自院校的特点以及本专业的规范化建设经过一个不断调整优化的过程。

另外,在课程体系的设计上,一定要强调知识点的优化与授课方式相结合,需要理论联系实际,并在课程讲授过程中,突出数字媒体技术专业的自身特点,包括传统的计算机专业课程及艺术类课程在内。例如,操作系统课程在讲授一般性的基础理论之外,还要讲操作系统与数字媒体技术的关系、当前主流操作系统的进步如何适应数字媒体技术的发展等等结合数字媒体技术特点的内容。数字媒体技术专业课程中许多课程涉及很多的数学理论,如计算机图形学与图像处理,但在知识点的选择与课程讲授中,这一类的课程也要深入浅出,不强调过多的理论问题,而是结合数字媒体技术中的应用来讲。在此基础上,针对部分学生将来可能进入数字媒体技术专业的硕士或者博士阶段进行深造的要求,再增设部分高级研讨课程,进一步深入讲述背后的理论知识。

我们还规划将部分知名公司或培训结构的认证课程适当纳入课程体系,学生通过相应的认证课程后,给予一定的学分,同时限制每名学生的总的认证学分。

实践能力的培养也是数字媒体技术专业的重要内容,我们在课程设置上力求建立完善的实践教学体系(具体介绍详见本刊同期另文)。相应地,在课程设置方面,计划增设部分跨课程、跨年度的综合实验课程,允许学生按年级、兴趣与特长分别参与相应的项目中不同模块的研发工作。

针对数字媒体专业的特点,还需要不断丰富课程学习评价手段,将作业、课程设计、文献综述报告、考试等各种评价手段综合考虑,加强课程设计与文献综述报告等形式的开放式考核手段的运用,加大分数比重,允许学生有选择余地,全面衡量学生的学习质量。既不能只重视理论知识的学习,又要避免完全以练代学的职业化教学模式。

在教材的选用上,由于目前数字媒体技术专业的发展刚刚起步,很多课程一时很难找到合适的教材,有时也难免以教材定知识点与授课内容,影响了教学目标的实现。因此在课程体系建设过程中,我们一方面强调尽可能选用最新教材,并向国内外知名高校看齐,在条件许可的前提下选取相同教材或相近教材;另一方面,在课程讲授过程中,不拘泥于教材,给学生传授完整、最新的知识,并加强与兄弟院校的合作,积极开展课程资源的收集、整理与建设工作,建立共享的课程资料库。

第12篇

Wang Na

(Shaanxi Vocational & Technical College,Xi'an 710100,China)

摘要:图像分割是图像处理和分析领域的经典难题,医学图像分割是图像分割中一个重要方面和应用领域,同时也是病变区域提取、临床实验、特定组织测量以及实现三维重建的基础。在临床应用和医学研究中具有重要的研究意义。本文主要对几类图像分割方法进行了分析、研究和实验,总结出各个方法的优缺点,从而可以达到更好的分割医学图像的目的。

Abstract: Image segmentation is the classic problems in image processing and analysis field. The medical image segmentation is an important aspect and applied field of image segmentation, and also is the foundation of the extraction of lesions, clinical trials, measurement of specific organizations and three-dimensional reconstruction, which has important research significance in clinical and medical research. This article focuses on the analysis, research and experiment of several types of image segmentation methods, sums up the advantages and disadvantages of each method, so that can achieve better medical image segmentation.

关键词:医学图像 图像分割 分割方法

Key words: medical image;image segmentation;segmentation method

中图分类号:TP39文献标识码:A文章编号:1006-4311(2011)19-0156-01

0引言

医学图像的组织结构复杂位置重叠,一般情况下,将一幅医学图像分为目标区域和背景区域,其中目标区域就是指病变区域或者含重要诊断信息的区域,是临床治疗的重要对象;背景区域是指医学上面认为正常的区域 [1]。医学图像分割的目的是把图像中具有特殊涵义的区域与背景区域分割开来。目前的图像分割方法有多种,为了达到更好的分割,对不同的分割任务,可采用了不同的分割方法。

1分割方法及研究

1.1 区域生长法区域生长法就是使较小的区域按照某种原则逐渐增长为大区域的过程。在区域增长法中,先是从一组“种子”点开始,将与种子点性质相似(颜色相似)的相邻像素附加到生长区域的种子的过程。区域生长法种类比较多,例如区域生长算法和分裂合并算法。区域生长方法的特点是将图像中像素间的空间相邻关系充分利用,以达到智能分割的目的。在ITK[2]中给出了几种基于区域分割的图像分割方法,基于连接的区域生长法、相邻区域连接法、独点连接法等,是几种各具特点的分割方法[2]。虽然区域分割方法是一种比较简单的分割方法,它计算简单,加之,目前新的发展,使之可以完成较简单的医学图像分割。

1.2 基于阈值的分割方法基于阈值的方法的主要思想是通过设置某一阀值,将图像中的像素点分为不同的类,从而完成图像分割,根据使用的是图像的整体信息还是局部信息,还可以将分割方法分为局部阈值和全局阈值。基于阈值的方法中最重要的一步就是如何选取合适的阈值,简单的阈值选取方法是以图像的灰度直方图为对象,以得到的各个灰度级的概率分布密度为基础,依据某一准则选取合适的阈值,最终确定像素点的归属。选择不同的准则,将得到不同的阈值化算法。常见的阈值分割方法有最小误差法、otsu方法、迭代法、模糊阈值、最大熵法等。

1.3 基于边缘检测的分割方法在医学图像中边缘往往是图像局部特性突变的结果。突变是一个区域的结束,另一个区域的开始。边缘检测方法是依照提取出来的边缘,分割出目标区域。目前已有多种基于边缘检测的图像分割方法,最基本的是通过边缘检测算子来检测边缘,常用的边缘检测算子有梯度算子、高斯―拉普拉斯算子、Canny算子。其中梯度算子是一阶导数的算子,梯度算子有以下几种:Roberts算子、Sobel算子、Prewitt算子等。高斯―拉普拉斯算子是另一种常用的算子,该算子是二阶的,是一种对噪声敏感的算子,在应用中一般都是先平滑滤波再进行二阶微分;Canny算子是在噪声情况下的一种较好的边缘检测算子。

图1为采用几种边缘检测算子对一幅大脑医学图像分割的结果。图1(a)是一幅医学图像,图1中(b)、(c)、(d)分别是应用Roberts算子、Sobel算子、Prewitt算子对图1(a)边缘检测的结果。

水平集方法和Snake模型也是常用的边缘检测方法[3]。水平集方法的思想是将移动的界面作为零水平集嵌入高一维的水平集函数中,这样由闭超曲面的演化方程可得到水平集函数的演化方程,而嵌入的闭超曲面总是其零水平集,最终只要确定零水平集即可确定移动界面的演化结果。Snake模型的基本思想是使得预先定义的初始曲线在一系列外部力和内部力的相互作用下进行演化,直到它满足一定的收敛条件,曲线就会在图像的边缘处停止。水平集分割方法能够综合利用区域和边界的信息,所以可以较好的分割图像,应用水平集方法分割医学图像是一种比较有效的方法。但是水平集方法也存在一些不足,例如速度函数的定义较为困难,边界控制参数的选取困难。由于物体各个部分属性的不同,造成了各个部分边界强度的不同,因此在参数选择不适当时容易造成轮廓线可能穿越较弱边界处或在与实际边界尚有一段距离的地方停止。虽然Snake模型得到的图像边缘比较准确,但是该方法需要预先定义初始轮廓,并且对初始轮廓的选取有严格的要求,初始轮廓在选择时必须比较接近图像的真实边缘,否则分割的结果不一定能达到图像的真实边缘。

1.4 结合特定理论的分割方法当前的图像分割方法种类有多种,原因是很多新方法,新思维被成功引入到了分割领域,从而产生了不同的分割方法。典型的有模糊数学方法、形态数学方法、蚁群算法等,将这些方法和前面介绍的区域法,阈值法等方法结合又可产生不同的分割方法。①基于数学形态学的分割。形态学以几何学为基础对图像进行分析,其思想是用一个结构元素作为基本工具来探测和提取图像特征。形态学方法的主要应用有边界提取、骨架提取、连通分量标记以及图像重构等。②基于模糊集合理论的分割。模糊数学的发展为图像分割提供了新的思路,基于模糊理论的方法在处理具有模糊特性的图像时可以得到更好的分割效果。目前分割效果比较好的模糊分割方法主要有糊聚类方法、模糊连接度方法等。

2小结

总之,每种分割方法都有自己的优缺点,可以根据不同的分割任务,应用不同的分割方法,也可以将不同方法结合来达到准确、高效的目的。

参考文献:

[1]章毓晋.图象分割[M].北京:科学出版社,2001.

[2]/.