HI,欢迎来到学术之家,期刊咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0
首页 精品范文 计算机视觉的基本技术

计算机视觉的基本技术

时间:2023-09-18 17:32:23

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇计算机视觉的基本技术,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

计算机视觉的基本技术

第1篇

关键词:双目视觉;匹配算法;计算机视觉;立体匹配;相位一致性

1.计算机视觉系统分析研究

1.1计算机视觉技术及双目立体视觉

计算机视觉是通过计算机技术实现对视觉信息处理的整个过程,是一门新的学科。视觉是人们认知事物的重要途径,视觉是人们对视觉信息获取、处理和存储的过程。随着计算机技术的发展,信号处理技术的应用,人们通过照相机来把实际的事物拍摄下来转变为数字信息,并通过计算机信号处理技术队获取的视觉信号进行处理。计算机视觉技术对图像的处理分为获取图像、特征抽象选取、事物识别及分类和对三维信息的理解。获取图像主要是通过摄像机和红外线等技术对周围视觉事物进行获取,并通过计算得到和真实事物相应的二维图像,二维图像主要是数字图像。计算机视觉系统的最基本的功能是数字图像的获取。可以看出计算机视觉研究最基本内容是三维场景距离信息的获取。在计算机被动测量距离方法中,有一种重要的距离感知技术叫作双目立体视觉。双目立体视觉技术是其他计算机视觉技术无法取代的一种技术,对双目立体视觉技术的研究在计算机视觉技术和工程应用方面都是非常重要的。

1.2计算机视觉理论框架

第一个视觉系统理论框架的提出是以信息处理为基础,综合了图像处理和神经生理学等研究内容而建立的。这个视觉系统理论框架是计算机视觉系统的基本框架,与计算机视觉技术有着密切的关系。视觉系统的研究是以信息处理为基础的,从理论层次、算法层次和硬件层次3个层次进行研究。计算机理论层次主要是表达系统各个部分计算的目的和方法,对视觉系统的输入和输出进行规定,输入作为二维图像,输出是以二维图像为基础建立起来的三维物体,视觉系统的目的就是对三维物体进行分析和识别,通过计算对二维物置和形状进行重新建立。算法层次对计算机规定的目标进行计算,算法和计算机表达有关,不同的表达可以通过不同的算法进行实现,在计算机理论的层次上,算法和表达比计算机理论的层次要低。硬件层次是通过硬件来实现算法的一种表达方法。计算机理论层次在计算机信息处理中时最高的层次,取决于计算机的本质是解决计算机的自身问题,不是取决于计算问题的计算机硬件。要更好地对计算机系统和框架进行理解最好的方法就是要区分3个不同的层次,计算机理论的含义和主要解决的问题是计算机的目的,表达算法含义和主要解决的问题是实现计算理论的方法和输入输出的表达,硬件的实现的含义和主要解决的问题是如何在物理上对表达和算法进行实现。计算机视觉处理的可以分为3个阶段,对视觉信息的处理过程从最初的二维图像的原始数据,到三维环境的表达。第一阶段基元图的构成,基元图是用来表示二维图像中的重要信息,主要是图像中亮度变化位置及其几何分布和组织结构,图像中每点的亮度值包括零交叉、斑点、端点和不连续点、边缘等。第二阶段2.5维图描述,在以观测者为中心的坐标中,表示可见表面的方向、深度值和不连续的轮廓,基元是局部表面朝向离观测者的距离深度上的不连续点表面朝向的不连续点。第三阶段三维模型表示,在以物体为中心的坐标系中,有由体积单元和面积单元构成的模块化多层次表示,描述形状及其空间组织形式,分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积单元或面积形状基元都附着在轴线上。视觉理论框架图如图1所示。

2.基于计算机的视觉立体匹配算法研究

视觉立体匹配算法是基于人类视觉系统的一种计算机算法。立体匹配算法作为计算机立体视觉问题研究的重点,快速地实现图像对应点的匹配来获得视差图是当今研究的热点问题。立体视觉匹配算法根据基元匹配的不同可以分为相位匹配、区域匹配和特征匹配3种,其中区域匹配算法可以减少计算负担,区域匹配算法实时性高,应用前景广阔。计算机立体视觉通过对人的双眼进行模仿,在双眼的立体感知中获得信息,从摄像机拍摄的图像中获取物体的三维深度信息,这就是深度图的获取,把深度图经过处理得到三维空间信息数据,二维图像到三维空间实现转换。深度的获取在双目立体成像视觉系统中分为两步,首先在双目立体图像与图像之间建立点对点的对象关系,双目立体视觉算法研究的重点问题是解决对应点之间的匹配问题。其次以对应点之间的视差为依据对深度值进行计算。双目成像是获取同一场景中两幅不同的图像,两个单目成像模型构成一个双目成像模型。双目成像示意图如图2所示。系统的基线B是两个镜头中心的连接线,空间点w(z,y,z)作为世界坐标的值由(x1,y1)与(x2,y2)进行确定,如果摄像机的坐标位置和空间点w世界坐标的位置重合,图像平面和世界坐标轴xY的平面就是平行的。如果两个摄像机在坐标系统中的原点不同但是它们的光轴平行,那么双目成像计算人们可以看图3所示,图3表示的是两个摄像头连线在平台xY的示意。

立体视觉的成像过程是成像的逆过程,具有一定的不确定性。大量的数据信息在从三维影像向二维图像进行投影的过程会出现丢失的现象,所以视觉系统要通过自然的约束条件才能保证获取正确的解。这些约束条件在减少匹配的计算量方面可以提供有利的帮助。针对基于区域匹配快速算法,还可以应用基于视差梯度的匹配算法,这种匹配算法应用较大的搜索范围在边缘的特征点上进行搜索,采用视差梯度在非边缘区减少搜索范围。应用计算机视觉立体匹配算法可以减少成像匹配时间,大大提高了工作效率。计算机立体匹配算法征点的提取是算法的关键问题,今后的研究方向重点是对有效特征点提取方法的研究。

第2篇

关键词:计算机;视觉技术;交通工程

中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01

一、引言

随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。

二、设计计算机视觉系统构成

计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。

(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。

(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,最后再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。

三、研究与应用计算机视觉处理技术

从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。

四、分析处理三维物体技术

物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。

(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为全面的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。

(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。

五、结束语

通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。

参考文献:

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2012(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2011(04).

第3篇

计算机视觉是一门研究如何使机器“看”的科学,更进一步地说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉包括集成的视觉系统与真实世界视觉的应用建设。创建三维模型的过程是相当困难的,需要机械测量摄像机的位置或手动对准一个场景的局部三维视图。通过使用相应的算法,它可以通过集合中一个场景的立体图像,然后自动生成一个逼真、几何精确的三维数字化模型。

全书分为三大部分,共14章:1.引言:立体图像和深度知觉、三维视觉系统、三维视觉应用的介绍;2.视觉的研究简史;3.二维和三维视觉的形成;4.图像匹配中低层次图像处理:包括卷积滤波、离散平均、离散分化、边缘检测、结构张量、角点检测等内容;5.尺度空间的视觉:包括图像尺度、高斯尺度空间、微分尺度空间、多分辨率金字塔等内容;6.图像匹配算法:包括各种匹配措施、计算方面的匹配、立体匹配方法的多样性、基于区域、弹性、梯度的匹配等内容;空间重构及多视图集成:一般的三维重建和多视图集成方面的内容;8.具体案例:临床和兽医应用、电影重构等具体实例的分析;9.射影几何基础;10.图像处理的张量微积分基础:包括线性算子和变坐标系统的基本概念、度量张量、简单的张量代数等内容;11.图像中的失真和噪声:包括噪声模型、产生噪声的测试图片、正态分布生成随机数;12.图像变换程序:包括结构的变形系统、坐标变换模块、像素值的插值、经典实力等内容;13.编程技术,图像处理和计算机视觉:包括其设计与实现、统一的建模语言、设计模式、处理平台等内容;14.图像处理库。

作者Bogusaw Cyganek于1993年获得电子计算机科学学位,于1996年获得了赫尔辛堡科技大学博士学位。近年来,他还与许多科学中心合作,在计算机视觉系统的发展方面做出了贡献。作为一个软件开发经理和高级软件工程师,他有着多年的实际工作经验。他目前在波兰克拉科夫AGH科技大学(AGH University of Scien and Technology)电子部任研究员和讲师,研究兴趣包括计算机视觉、模式识别、以及对可编程器件和嵌入式系统的开发。他还是电子电气工程师协会(IEEE,Institute of Electrical and Electronics Engineers)、国际模式识别学会(IAPR,International Association for Pattern Recognition)、工业和应用数学学会(SIAM,Society for Industrial and Applied Mathematics)成员。

本书提供了对三维计算机视觉方法,理论和算法的全面的介绍。几乎每一个理论问题都使用C++和Matlab的伪代码或完整代码进行实现,并且提供下载的软件网站、案例研究和练习。本书是相关学者、程序员的有益参考,也适合对计算机科学、临床摄影、机器人领域、图形和数学感兴趣的学生或研究人员阅读。

李亚宁,硕士研究生

第4篇

关键词:计算机视觉;研讨式教学;小组探讨;课前回顾

作者简介:陈芳林(1983-),男,湖南株洲人,国防科学技术大学机电工程与自动化学院,讲师;周宗潭(1969-),男,河南洛阳人,国防科学技术大学机电工程与自动化学院,教授。(湖南 长沙 410073)

中图分类号:G643.2 文献标识码:A 文章编号:1007-0079(2013)26-0065-02

进入21世纪,创新型人才的培养成为各国政府和高等教育界关注的一个焦点。世界各国研究型大学的共同特点是在研究生教育阶段致力于培养富有创新意识和创新能力的高级人才。[1]研讨式教学是培养研究生创新精神、科研能力的有效途径,教师讲解与学生探讨两部分相结合是研讨式教学采用的主要模式。[2]将课程分成两部分之后,教师讲解的时间就必须压缩,教师一方面需要思考如何在较短的时间内完成课程的讲解,同时还需要考虑课程讲解要与学生探讨部分紧密结合。因此,如何上好研讨式教学教师讲解这部分课,越来越受高等院校的重视。本文针对笔者教授工科研究生课程“计算机视觉”的实践与经验,阐述了笔者对于如何上好研讨式教学教师讲解这部分课的个人体会。总结为两点:第一,首先要充分做好课程准备;第二,上课环节采取回顾—案例—小结的讲解方式。下面从课程准备、课前回顾、课程讲解、课后小结四个方面分别阐述(如图1所示)。

一、“计算机视觉”课程准备

要上好一门研讨式教学的课程,一定要结合该门课程的特点,量身定制课程内容,进行精心准备。本节先介绍“计算机视觉”课程的特点,然后结合该门课程的特点,介绍笔者对于“计算机视觉”的课程准备。

1.“计算机视觉”课程特点

“计算机视觉”是“数字图像处理”和“模式识别”等课程的后续课程。该课程重点在于图像或者图像序列的分析理解。课程知识在机器人导航、侦查、测绘、测量、精密加工和目标跟踪等多个领域都有广泛的应用。[3]近年来基于视觉信息的控制反馈也开始受到广泛关注。国内高校一般都为研究生开设了此门课程。

计算机视觉技术应用广泛、算法原理涉及面广:涉及到概率与数理统计、信号与系统、图像等基础知识。“计算机视觉”是一门重要的控制类、电子类及计算机类专业研究生的选修课程,它内容广泛、综合性强,研讨能力的培养显得非常关键。

2.课程准备

首先,结合“计算机视觉”课程内容广泛、技术日益更新和丰富的特点,将课程36学时分为12次课,每次课为3小时,每堂课教师讲解一个专题。这种设计,一方面可以更广地涉及计算机视觉的各个领域;另一方面以专题的形式来讲解,可以将学生带入到该专题,介绍基本背景、理论、知识和方法,让学生有一个初步的了解,方便课后学生对感兴趣的专题进一步深入挖掘与研究。

其次,在课程开始之前,教师仔细统筹,安排好每次课的专题,这样既方便学生一开始对整个课程有一个整体的了解,也方便学生选择课堂研讨的题目与内容。根据12个专题,将各个专题讲解的内容与课件在开课之前准备好,这样有利于把握各个专题之间的前后承接关系。例如,“区域”与“分割”是既有区分又有联系的两个专题,在课程开始之前,将课件准备好,就有利于宏观把握,在“区域”专题提到的分割算法,就不需要在“分割”专题再次重复,而在“分割”专题可以结合前面“区域”专题进行互相补充,以帮助学生融会贯通。

最后,在每个专题上课之前,再对课件进行精雕细琢,主要是对内容分好层次,对方法进行分类,力图在较短的时间内,让学生对该专题有较全面的认识。例如,在讲解图像分割时,由于图像分割方法非常多,可以将分割方法分为若干个大类,每个大类只讲1~2个方法。这样既可以尽可能涉及更广的领域,又可以提高讲解的效率。

二、“计算机视觉”课前回顾

课前回顾是指每堂课的前面一小段时间用来回顾上一堂课的内容。虽然课前回顾时间非常短,一般为3~8分钟,但是课前回顾是课堂教学中的一个重要环节。课前回顾可以帮助学生加强将要学习的内容与已学过内容之间的联系。通过课前回顾,学生可以回忆前续课程所讲解的概念、理论、算法的步骤等内容,有助于解决新问题或者理解新知识。

课前回顾最重要的是既要复习前续课程的内容,又要注意将前续内容与当前内容联系起来。由于讲解时间有限,要使研讨式教学的教师讲解部分效率高,教师帮助学生回忆上堂课的概念、模型、算法等内容,就变得非常重要。如果不做课前回顾,那么当讲到某处新知识时,往往需要停下来,将前续课程再讲一遍,否则学生无法理解新的知识,这样就降低了教学的效率。

课前回顾的时间,一般以3~8分钟为宜。课前回顾的形式可以多样化,如讲解课后作业、回顾概念、提问等。笔者认为应根据当天课程与前续课程的关系,采取合适的方式。各种方式结合使用,提高课前回顾的效率。

三、“计算机视觉”课程讲解——案例教学

案例教学已经成功地应用于数学、计算机科学等领域的教学。通过案例,学生可以很快地掌握相应的概念、算法的步骤等,从而提高教师讲解部分的效率。[4]例如,在讲解马尔科夫随机场时,笔者通过案例式教学,将马尔科夫随机场用一个生活中的例子来向学生解释。首先,将马尔科夫随机场分解成两个重要的概念,分别是随机场与马尔科夫性,然后将它们对应到例子中,帮助学生理解。

随机场包含两个要素:位置(site)和相空间(phase space)。当给每一个“位置”中按照某种分布随机赋予“相空间”的一个值之后,其全体就叫做随机场(如图2(a))。[5]这个概念非常抽象,难以理解。笔者应用案例式教学,拿庄稼地来打比方。“位置”好比是一亩亩农田,“相空间”好比是种的各种庄稼。给不同的地种上不同的庄稼,就好比给随机场的每个“位置”,赋予“相空间”里不同的值。所以,可以形象地理解随机场就是在哪块地里种什么庄稼的布局(如图2(b))。

马尔科夫性指的是一个随机变量序列按时间先后顺序依次排开时,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。为了更直观地理解马尔科夫性,笔者仍然拿庄稼地打比方,如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关,与其他地方的庄稼的种类无关,这种性质就是马尔科夫性。

符合上述两个特征,那么这些地里种的庄稼的集合,就是一个马尔科夫随机场。通过案例式教学,笔者发现可以加深加快学生对课程内容的理解,提高教师讲解环节的效率。

四、课后小结

课后小结指的是一堂课将要结束时,教师对本堂课进行一个简短的总结。许多成功的教师都会在其教学中坚持课后小结这个环节,给学生一个总体的印象,以帮助学生消化本次课程的内容。

研讨式教学教师讲解部分的课后小结与普通教学方式应有所区别。笔者认为这主要是因为通过课后小结可以将本次课程所讲内容与学生的研讨环节结合起来,而不仅仅是对内容进行简单的总结。

为了达到课后小结使本次课程内容与学生探讨环节建立联系的目的,笔者在教学中常采用如下方式:首先,像普通教学方式一样,总结本次课程内容;然后,在此基础上,抛出若干问题,这些问题,不需要学生马上解答,而是留给学生课后思考,提供他们选择研讨主题的素材;最后,介绍其他在本次课程中没有涉及到的前沿知识、方法与理论,拓宽学生的视野,从而增加学生选择探讨主题的覆盖面。

通过应用这种方式,笔者发现学生的思维更开阔,在探讨环节,学生往往可以选择一些比较新颖的主题(例如视频中不动点的检测等),而不仅仅局限于教师所讲内容,从而提高了研讨式教学的效果。

五、结论

在“计算机视觉”课程中引入研讨式教学,通过总体设计规划好整门课程内容,课堂讲解注意采用回顾—案例—小结的方式,笔者对如何上好研讨式教学教师讲解这部分课进行了个人经验的总结。通过本次教学改革,笔者体会到如果要提高教学效果,一定要注意教师讲解与学生探讨两个环节的紧密结合。

参考文献:

[1]侯婉莹.我国研究型大学本科生科研研究[D].济南:山东大学,

2009.

[2]张晴,李腾,韦艳,等.研讨式教学模式的理论研究[J].中国科技纵横,2011,(10).

[3]D.H .巴拉德.计算机视觉[M].北京:科学出版社,1987.

第5篇

关键词:自动控制技术农业自动化

中图分类号: DF413.1文献标识码: A

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距, 已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术, 如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展, 从而形成了一系列适合我国农业特点的自动化控制技术。

一、已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上, 成功研制出6CRK-55型可编程控制加压茶叶揉捻机, 它利用计算机控制电功加压机构, 能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制, 是机电一体化技术在茶叶机械上的首次成功应用。

1.应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

2.应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

3.应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时, 自动掐断燃料供给的装置。

二、微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年, 全国共有节水灌溉工程面积0.133亿m2, 其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段, 高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况, 对灌溉用水进行动态监测预报, 实现灌溉用水管理的自动化和动态管理。在微灌技术领域, 我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备, 总结出了一套基本适合我国国情的微灌设计参数和计算方法, 建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统, 可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

三、自动控制技术在精准农业中的应用

精准农业是在传统农业与农业机装备技术上, 运用高新技术进行农业生产管理。精准农业较传统农业其先进之处主要是应用全球定位系统(GPS)、地理信息技术、计算机控制技术、专家与决策知识系统, 实现农业生产的定位、定量、定时, 做到精耕细作和由于农业水土管理区管理点较为分散, 用传统方法进行数据采集和信息传输精度差、速度慢。把电子技术、微电子技术和通信技术紧密结合起来, 采用现代方法进行自动化监控和管理非常必要, 如在渠系、灌水、泵站等方面实现自动化监控与管理。农业自动化向智能化方向发展, 进一步发展精准农业重点发展节水、节肥精准农业技术体系的自动化控制, 实施精准灌溉、精准施肥, 提高水资源和化肥资源的利用率。精细设施农业主要发展以温室为主的自动控制系统智能化研究, 从而现降低成本、提高作物产量、提高农产品品质。这有助于我国农业资源的高效利用和农业环境保护, 是发展持续农业的重要途径。将计算机视觉技术应用于农业自动化领域计算机视觉技术是一个相当新且发展十分迅速的研究领域, 日本、美国等发达国家已在农业计算机视觉方面进行了广泛而深入的研究, 如农业种质资源管理、获取作物生长状态信息、农产品自动收获、农产品品质鉴定等。英国开发研制的采摘蘑菇机器人, 在定位蘑菇采摘点和测量时, 已经利用了计算机视觉和图像处理技术。计算机视觉技术在我国农业生产和农业现代化方面已开始应用, 但在设施农业、虚拟农业中的应用尚处于起步阶段, 应进一步加强、加快该领域的研究与应用。

我国农业自动化已在设施农业中的温室自动化控制、排灌机械自动化、部分农业机械装置自动化等方面得到一定的发展, 尤其精准农业的发展越来越得到重视。电子技术和计算机技术的迅速发展推动了农业机器向自动化方向发展。随着智能化技术的发展, 人工智能将是世纪农业工程发展的重点。各种农业机器人或智能化系统将在农业自动化控制中不断涌现, 继续推动和实现农业自动化是农业机械化工程技术工作者所面临的长远课题和挑战, 并进一步促进农业自动化控制技术向智能化技术发展。

四、自动控制技术在精准农业中的应用

精准农业是在传统农业与农业机装备技术上, 运用高新技术进行农业生产管理。精准农业较传统农业其先进之处主要是应用全球定位系统(GPS)、地理信息技术、计算机控制技术、专家与决策知识系统, 实现农业生产的定位、定量、定时, 做到精耕细作和由于农业水土管理区管理点较为分散, 用传统方法进行数据采集和信息传输精度差、速度慢。把电子技术、微电子技术和通信技术紧密结合起来, 采用现代方法进行自动化监控和管理非常必要, 如在渠系、灌水、泵站等方面实现自动化监控与管理。农业自动化向智能化方向发展, 进一步发展精准农业重点发展节水、节肥精准农业技术体系的自动化控制, 实施精准灌溉、精准施肥, 提高水资源和化肥资源的利用率。精细设施农业主要发展以温室为主的自动控制系统智能化研究, 从而现降低成本、提高作物产量、提高农产品品质。这有助于我国农业资源的高效利用和农业环境保护, 是发展持续农业的重要途径。将计算机视觉技术应用于农业自动化领域计算机视觉技术是一个相当新且发展十分迅速的研究领域, 日本、美国等发达国家已在农业计算机视觉方面进行了广泛而深入的研究, 如农业种质资源管理、获取作物生长状态信息、农产品自动收获、农产品品质鉴定等。英国开发研制的采摘蘑菇机器人, 在定位蘑菇采摘点和测量时, 已经利用了计算机视觉和图像处理技术。计算机视觉技术在我国农业生产和农业现代化方面已开始应用, 但在设施农业、虚拟农业中的应用尚处于起步阶段, 应进一步加强、加快该领域的研究与应用。

我国农业自动化已在设施农业中的温室自动化控制、排灌机械自动化、部分农业机械装置自动化等方面得到一定的发展, 尤其精准农业的发展越来越得到重视。电子技术和计算机技术的迅速发展推动了农业机器向自动化方向发展。随着智能化技术的发展, 人工智能将是世纪农业工程发展的重点。各种农业机器人或智能化系统将在农业自动化控制中不断涌现, 继续推动和实现农业自动化是农业机械化工程技术工作者所面临的长远课题和挑战, 并进一步促进农业自动化控制技术向智能化技术发展。

【参考文献】

[1]马玉敏等.工业以太网的最新发展.自动化系统工程,2006(2):2.

第6篇

关键词:数据融合传感器无损检测精确林业应用

多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域[1,2]。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。

1数据融合

1.1概念的提出

1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。

1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。

Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等[3]。

1.2基本内容

信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。

数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:

(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。

(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。

(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测[4]。

根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:

(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。

(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。

(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等[5,6]。

1.3处理模型

美国数据融合工作小组提出的数据融合处理模型[7],当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:

数据源。包括传感器及其相关数据(数据库和人的先验知识等)。

源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。

态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。

处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。

2多传感器在林业中的应用

2.1在森林防火中的应用

在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度[8]。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。

2.2森林蓄积特征的估计

HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计[9]。

KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。

2.3用非垂直航空摄像数据融合GIS信息更新调查数据

森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。

TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正[10]。

试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。

3数据融合在林业中的应用展望

3.1在木材检测中的应用

3.1.1木材缺陷及其影响

木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。

3.1.2单一传感器在木材检测中的应用

对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法[11,12]。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等[13]。

随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。

新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。

美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。

在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析[14]。

X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。

3.1.3数据融合在木材检测中的应用展望

单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷[15,16]。

基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。

3.2在精确林业中的应用

美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。

目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。

南京林业大学提出了“精确林业工程系统”[17]。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。

[参考文献]

[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.

[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.

[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.

[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.

[5]王耀南,李树涛.多传感器信息融合及其应用综述[J].控制与决策,2001,16(5):518-52.

[6]许军,罗飞路,张耀辉.多传感器信息融合技术在无损检测中的应用研究[J].无损检测,2000,22(8):342-344.

[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.

[8]余启刚.数据融合技术在“3S”森林防火中的应用[J].森林工程,2003,19(4):5-6.

[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.

[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.

[11]杨春梅,胡万义,白帆,等.木材缺陷检测理论及方法的发展[J].林业机械与木工设备,2004,32(3):8-10.

[12]胡英成,顾继友,王逢瑚.木材及人造板物理力学性能无损检测技术研究的发展与展望[J].世界林业研究,2002,15(4):39-46.

[13]肖忠平,卢晓宁,陆继圣.木质材料X射线与超声检测技术研究的发展与展望[J].木材加工机械,2004,15(1):25-27.

[14]王金满,周秀荣.刨花板施胶效果计算机视觉分析方法[J].东北林业大学学报,1994,22(3):25-26.

[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.

第7篇

关键词:农业机械自动化;技术要点;优化措施

0引言

所谓农业机械自动化技术,指的是将控制论、计算机技术、液气压技术等应用到农业机械的设计当中,使农业机械可以独立完成田间耕作。随着科学技术的不断发展以及为了响应政府高效农业的号召,我国农业正逐步朝着机械自动化的方向发展。农业机械的自动化,不仅能够使劳动的生产效率得到提高,还能减轻农民的劳动强度,并且提高劳动舒适度,在一定程度上缓解农村劳动力短缺的问题。在科技高速发展的今天,世界各国都加大了对农业机械自动化技术的研究。很多科研成果已经从实验室走向了实用阶段。

1农业机械自动化对农村建设的意义

对社会主义新农村进行建设,是我国构建社会主义和谐社会的基本要求。社会主义的和谐与广大农村地区的和谐是不可分割的。虽然从整体上看,社会主义新农村处于较为稳定和谐的状态,但不可否认的是,社会主义新农村的建设也存在着一定的问题。其中,最主要的问题是农民收入过低。因此,我国要大力推行农业机械自动化建设,为减轻农民的劳动强度、提高农民的经济收入提供保障。

2农业机械的分类

通常来说,农业机械是由动力设备和与之配套的农机器具组成的。这两者之间主要是以牵引悬挂或者是半悬挂的方式进行连接。也有的农业机械将这两者制造成一个统一的整体。动力设备和与之配套的农机器具这两者在耕作的过程中,互相配合,缺一不可。

3农业机械自动化发展中存在的问题

我国农业机械技术在发展的过程中,并不是一帆风顺的,而是遇到了很多问题。首先,我国大型农业自动化机械在推广的过程中难度较大。很多农民没有意识到机械化生产的重要性,导致了他们不愿意在农业生产的机械方面进行投入,最终造成了我国大型农业自动化机械供大于求的尴尬。第二,我国的农业机械制造水平较低。与西方国家相比,我国农业机械制造的起步较晚,在很多方面,科技水平还不够成熟。第三,我国对农业机械自动化技术的研究缺乏足够的动力。我国大型农业机械的制造企业,以及科院院所存在着资金不足、科研环境较差的问题。对农业机械进行设计,不仅需要耗费大量的时间和精力,还需要一定的技术条件作为依托。我国大部分科研院所和农业机械制造企业,由于资金不足,并没有完成对实验室的配套建设,使得科研人员在进行工作时困难重重,这一现状也严重影响了科研人员的工作积极性。第四,自动化技术在农业机械的应用中还处于起步阶段。对自动化技术的应用,需要很高的科技水平作为依托,但是我国科技基础薄弱的现实,使自动化技术的应用变得困难。

4农业机械自动化技术要点及优化应用措施

4.1实现计算机技术应用于农业生产

计算机视觉技术,作为新时期重点研究和应用性广泛的新科技,很多西方国家先后展开了对计算机视觉技术的研究。计算机视觉技术在农产品质量的鉴定方面,以及在记录农产品生长的信息等方面有着十分重要的作用。英国对计算机视觉技术的应用进行了首次尝试,利用该技术研制了专业性的采蘑菇机器人。采蘑菇机器人在采蘑菇的过程中,不仅能够对蘑菇的位置进行精准的定位,而且能够对所采的蘑菇进行合理化的分类。受到英国的影响和启发,我国国内也开始尝试在农业机械自动化技术中,加入计算机控制技术的内容。但是由于我国的经济技术发展还不够成熟,要实现对计算机视觉技术的应用,还需要科学家们进行努力。

4.2实现农业施肥和灌溉技术的自动化

我国水资源总量虽然比较大,但是人均资源占有量却很小,而且我国水资源分配的不够合理,使得我国水资源长期处于短缺的状态。要促进农业的发展,充足的水资源是必要的条件。在保证农业生产用水的同时,保证对水资源的节约,是我国农业发展过程中必须要面对的问题。农业自动化灌溉技术的应用可以很好地解决这一问题。所谓农业自动化灌溉技术,是把传感器与电子计算机进行有机结合,把农作物生长过程中对环境的需求及对用水量的需求,通过软件的形式加以呈现,从而避免水资源的浪费。对农业施肥技术来说也是如此,实现农业施肥和灌溉技术的自动化,是节约水资源、降低农业生产成本、避免浪费以及保护环境的必然选择。

4.3实现农业的精准化

农业精准化是指将我国的传统农业与农业机械自动化技术相结合,实现农业生产管理的科技化。精准农业是未来农业发展的主要方向之一。农业生产自动化,是一项以计算机网络和控制器等为基础的技术。我国对精准农业的研究,已经取得了一定的科技成果。世界上第一台观测农业气象的自动化仪器,已经在我国郑州气象站开始投入使用。农业气象观测仪,可以对农业生产的小环境进行合理化监测,并且通过网络把监测到的信息及时反映给当地农业部门。总之,在经济全球化进程不断加快和城市化进程高速发展的今天,给各个行业带来机遇的同时,也带来了挑战。为了在经济发展的大潮中处于不败的地位,加强科技创新是一项必不可少的选择,同时也是长远发展的根本要求。对于农业产业而言,为了使我国农业能够更好更快的发展,政府要提高对农业机械自动化技术研究的投入,并将新的科技成果不断应用到农业生产中。作为科技工作者要努力钻研农业机械自动化技术,并且要对农业机械自动化技术的应用措施进行优化,从而实现农业的智能化时代,创造出我国农科发展的新道路。

参考文献:

[1]刘洋.我国农业机械自动化应用现状和推进模式探讨[J].化工中间体,2015(11):11-19.

[2]罗小锋,刘清民.我国农业机械化与农业现代化协调发展研究[J].中州学刊,2010(02):17-22.

第8篇

关键词:无损检测;农产品;分级

引言:自1993年开始,我国果品总产量超过印度、巴西和美国,跃居世界首位。因此,水果的品质分析就显得更加重要。水果品质检测主要包括硬度、糖度、酸度等多种指标检测,传统的检测方法主要采用的是化学方法,测量过程复杂,等待时间长,也就降低了其实际的使用意义。无损检测技术(Nondestructive Determination Techonol ogies,简称NDT)主要指的是在不破坏或损坏被检测对象的基础上,利用农产品内部结构异常或缺陷存在所引起的对热、声、光、电、磁等反应的变化,来探测各种农产品等内部和表面缺陷,并对缺陷的类型、性质、数量、形状、位置、尺寸、分布及其变化做出判断和评价。

一、农产品无损检测技术介绍

(一)核磁共振技术

核磁共振技术(NMR)是一种探测浓缩氢质子的技术,它对农产品中的水、脂的混合团料状态下的响应变化比较敏感。自1946年美国科学家F.Bloch和E.M.Purcell发现了核磁共振现象以来,核磁共振技术在研究物质的结构方面得到了广泛应用。核磁共振能生成果实内部组织的高清晰图像,不仅可用于检测果品的压伤、虫害、成熟度,在测定苹果、香蕉的糖度等方面也具有潜在价值。对于采收成熟度直接影响品质的品种,利用核磁共振技术可大大提高收获、运输的可靠性。目前,该项技术真正用于果品的内部检测和质量评价还有很多问题有待研究,但由于其卓越的优点,将会是一种很好的果品无损检测方法。

(二)声学特征的应用

声学特性反映的是声波和农产品相互作用的基本规律,利用声学特性主要是指根据农产品在声波作用下反射特性、散射特性、吸收特性、衰减系数和声波传播速度及本身声阻抗、固有频率等的变化与农产品内部组织变化如结构、成分、物理状态等物化特性信息间的关系进行。用于检测的超声波一般为低能超声波,在被检测物中传播时不会引起其物理或化学特性的变化。低能超声测量中最常用的3个参数为:声速、声衰减系数、声阻抗。声学无损检测技术与光学、电学及其他无损检测技术相比,有适应性强、投资较低、操作简便快捷等优点,适用于在线检测,在农产品检测领域的应用前景良好。

利用农产品声学特性对其内部品质进行无损检测和分级是生物学、声学、农业物料学、电子学、计算机等学科在农产品生产和加工中的综合应用,该技术适应性强,检测灵敏度高,对人体无害,成本低廉,易实现自动化,是果品无损检测技术发展的重点领域。虽然国外学者对此技术已做了较多基础研究,但这些研究基本上是研究农产品声学特性共振频率、反射折射透射特性、吸收特性、衰减特性、传播速度、声阻抗等中的某一特性与农产品某一品质指标的关系,而对多种声学特性对农产品某一内部品质指标或多种内部品质指标的综合影响的研究报道很少,阻碍了声学检测精度的提高。

(三)近红外分析法的应用

近红外光谱分析技术(Near Infrared Spectroscopy Analysis,简称NIR)是利用样品中有代表性的有机成分在近红外光谱区域的最强吸收波长不同,以及吸收的强度与有机成分呈线性关系的原理进行定量分析。通过对已知有机成分含量的样品与其近红外光谱特征的回归分析,建立定标方程,即可对含有同一种有机成分的样品进行定量估测。

近红外线波长为800~2500 nm,近红外线照射在果实上,果实中构成糖和酸的官能基(-OH,-CH2,-NH)吸收与相应分子固有振动相一致的特定光线,近红外分光法就是利用上述特性,从被吸收的光量非破坏检测糖、酸、水分和叶绿素等成分的一种技术。该方法仅在建立标定线时破坏果实测定其化学成分,标定线做成后,只需测定样品的近红外线分光频谱,就可得到成分的预测值,还能在瞬间同时测定多个成分。

(四)X射线检测技术的应用

X射线检测技术是指利用X射线的穿透能力对果蔬品质进行检测的一种方法。X射线具有很好的穿透能力,而物质的密度大小又影响了其穿透量的多少,通过对透过穿透量多少的分析从而可以对物质的内部品质进行分析。检测时所需的X射线强度弱,所以通常称为软X射线检测技术。X射线检测技术本来是为检测一些不易拆卸分解的大型构件或机械零件的内部缺陷而开发应用的,近来已被成功地移植到农产品加工领域。

(五)机器视觉技术的应用

20世纪70年代开始,计算机视觉技术开始被应用到工业和农业之中,主要进行的是植物种类的鉴别、农产品品质检测和分级。由于图像处理技术专业的出现以及计算机成本的降低,机器视觉技术在农产品品质检测与分级领域的应用中越来越具有吸引力。

计算机视觉是以计算机和图像获取部分为工具,以图像处理技术、图像分析技术、模式识别技术、人工智能技术为依托,处理所获取的图像信号,并从图像中获取某些特定信息。计算机视觉技术无需接触特定对象便可从获取的图像中得到大量的信息,通过对这些信息的分析得到物体尺寸、表面缺陷、外观形状、表面色度等具体信息,进而实现外观质量的综合评价。

现在,用于农产品品质检测与分级的可见光快速检测主要是基于计算机视觉的检测技术,利用光学传感器或扫描摄像机摄像,综合测出果品的表面颜色、对特定光的透光率、形状和大小,并与事先贮存在计算机中的数据模型进行对比,推算出成熟度和糖分。

(六)电子鼻技术的应用

电子鼻技术是近年来兴起的一种农产品无损检测的方法,电子鼻一般由气敏传感器阵列、信号处理子系统和模式识别子系统等3大部分组成。它以特定的传感器和模式识别系统快速提供被测样品的整体信息,从而指示样品的隐含特征。与普通的化学分析仪器,如色谱仪、光谱仪等不同,电子鼻得到的不是被测样品中某种或某几种成分的定性与定量结果,而是给予样品中挥发性成分的整体信息,也称“指纹”数据。

由于在同一个仪器装置里采用了多类不同的矩阵技术,使检测更能模拟人类嗅觉神经细胞,根据气味标识和利用化学计量统计学软件对不同气味进行快速鉴别。在建立数据库的基础上,对每一样品进行数据计算和识别,可得到样品的“气味指纹图”和“气味标记”。

二、无损检测技术的应用前景

无损检测技术作为一种新兴的检测技术,在不破坏果蔬品质的基础上,对果蔬的品质进行检测和分级利用光学、电学以及电脑信息技术等的先进技术对果蔬的品质进行准确、快速的检测。随着我国人民生活水平的提高,我们对新鲜果蔬的品质要求也越来越高,无损检测技术适合加工高效率、大规模的要求,因此,这种检测方法必将在未来的农产品检测和分级中得到广泛的应用。

参考文献:

第9篇

关键词:图像识别;SURF算法;特征点;鲁棒性

中图分类号:TP391 文献标志码:A

图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像的局部不变特征有着在多种图像变换(如光照变换,几何变换等)下的不变性、独特性、低冗余性以及无需预先对图像分割等特点,已经被广泛应用于图像匹配领域。基于特征不变的方法具有精度高、执行速度快、压缩信息量和鲁棒性好等优点。尺度不变特征转换(Scale-invariant feature transform,SIFT)算法便是其中的代表,该算法由David Lowe于1999年在ICCV上提出,并于2004年完善总结。SIFT算法匹配能力较强,能提取稳定的特征,可以处理两幅图像之间发生平移、旋转、仿射变换、视角变换和光照变换等情况下的匹配问题,但该算法数据量大,复杂度高,耗时长,同时也存在着特征提取及匹配速度慢,在灰度变化相似的区域容易产生误匹配的缺陷,限制了该算法的应用。SURF算法是针对SIFT算法的不足而改进的一种有效算法。

1SURF算法描述

快速鲁棒特征[1](Speeded-up Robust Features,SURF)是一种高鲁棒性的局部特征点检测器,由Herbert Bay等人于2006年在ECCV上提出的。该算法比SIFT更快更加具有鲁棒性,对图像分辨率、旋转、尺度缩放、平移和亮度变化等保持不变,而且对仿射变换、噪声以及视角变化等也能保持一定程度的稳定性。

SURF算法的基本流程主要包括:特征点检测、特征点描述和特征点匹配三部分。该算法中有三个关键技术,分别为:使用积分图像完成图像卷积操作,减少了时间计算的复杂度,提高计算速度;采用基于Hessian矩阵的检测器检测特征值,其在可重复性和稳定性方面都优于基于HarTis的检测器;采用Haar小波作为特征描述子,Harr特征速度快,能够减少计算时间并增加鲁棒性。

1.1积分图像

积分图像是一种对原始图像的特征表示方法。对于一幅灰度的图像,积分图像中的任意一点(x,y)的值是指从图像的左上角到这个点所构成的矩形区域内所有的点的灰度值之和[2]。图1所示填充区域即为点(x,y)的积分值。

1.2尺度空间的建立

图像的尺度空间是在视觉信息(图像信息)处理模型中引入一个被视为尺度的参数,通过连续变化尺度参数获得不同尺度下的视觉处理信息,然后综合这些信息以深入地挖掘图像的本质特征。一幅图像的尺度空间可定义为原始图像与高斯核的卷积运算,图像的尺度大小可以用高斯标准差来表示[3]。在计算机视觉领域, 尺度空间被表示为一个图像金字塔。在SIFT算法中,输入图像函数反复与高斯函数的核卷积并反复对其进行二次抽样,但因为每层图像依赖于前一层图像, 并且需要重设图像尺寸,所以使得运算量较大。SURF算法与SIFT算法在使用金字塔原理上的不同之处在于SURF算法申请增加图像核的尺寸,允许尺度空间的多层同时被处理,并且不需要对图像进行二次抽样, 从而提高了算法性能。同时SURF算法采用了尺度插值和3*3*3的非极值抑制方法以提取尺度不变的特征点。图2中A图是运用传统方式建立的一个图像金字塔结构,运算会反复使用高斯函数对子层进行平滑处理, 且图像的尺寸是变化的。B图的SURF算法保持原始图像不变而只是改变滤波器的大小。

1.3Hessian特征检测

2算法实现

根据SURF算法的基本原理,设计算法的实现过程。首先通过视频采集设备获取模板图像,并对其建立积分图像和构建尺度空间结构,再通过视频采集设备捕捉当前视频帧,然后检测出模板图像及当前视频帧的特征点, 并保存每个特征点各项特性的描述信息,最后比较模板图像与当前帧图像特征点的描述子信息进行图像匹配。

3OpenCV技术

OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。OpenCV轻量级而且高效,由一系列C函数和少量C++类构成, 实现了计算机视觉,图像处理和模式识别等方面的很多通用算法。

OpenCV为Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,这意味着如果有为Intel处理器优化的IPP库,OpenCV将在运行时自动加载这些库。OpenCV致力于真实世界的实时应用,通过优化的C代码的编写对其执行速度带来了可观的提升,编写程序过程中调用OpenCV的基础函数库, 即可完成十分复杂的开发任务, 极大的提高开发效率。

3.1OpenCV的特点

1) 跨平台,Windows,Linux,Mac OS;

2) 免费,开源;

3) 代码经过优化,可用于实时处理图像;

4) 统一的结构和功能定义;

5) 强大的矩阵运算和图像处理能力;

6) 具有底层和高层的应用开发包;

7) 用户接口方便灵活。

3.2OpenCV的功能

1) 对图像数据的操作,包括分配、释放、复制和转换数据。

2) 具有对矩阵和向量的操作以及线性代数的算法程序,包括矩阵、解方程,特征值以及奇异值。

3) 具有基本的数字图像处理能力,如可进行滤波、边缘检测、角点检测、采样与差值、色彩转换、形态操作、直方图和图像金字塔等操作。

4) 对运动的分析,如对光流、运动分割和跟踪的分析。

5) 对目标的识别,可采用特征法和隐马尔科夫模型(HMM)法。

6) 具有基本的GUI功能,包括图像与视频显示、键盘和鼠标事件处理及滚动条等。

3.3OpenCV模块

1) CV核心函数库,实现图像处理,结构分析,运动分析,对象识别,摄像机标定和3D重构等功能。

2) CVAUX辅助函数库,实现通过立体视觉来实现的动作识别,基于轮廓线的形状匹配,模式识别,纹理描述等功能。

3) CXCORE数据结构与线性代数库,实现数据变换,矩阵运算等功能。

4) HIGHGUI图像界面函数库,实现图像获取,用户界面设计等功能。

5) ML机器学习函数库,包括模式分类和回归分析等。

4Android上的系统实现

Android是基于Linux开放性内核的操作系统,是Google公司在2007年l1月5日公布的手机操作系统。Android采用软件堆层的架构,主要分三部分:底层以Linux核心为基础,提供基本功能;中间层包括函数库和虚拟机;最上层是各种应用软件。Android应用程序用Java语言编写。每个应用程序都拥有一个独立的Dalvik虚拟机实例,这个实例驻留在一个由Linux内核管理的进程中[6]。

在Android系统上使用OpenCV来实现该系统,需利用JNI编写相应的本地代码组件并通过Android NDK工具集将其嵌入到Android应用程序中。首先,利用Android应用程序框架编写相应的Java代码;然后通过JNI与OpenCV提供的函数编写本地C/C++代码,并使用Android NDK将本地代码文件编译生成可由Java代码调用的共享库(动态链接库),最后通过SDK生成完整的Android应用程序[7]。

4.1JNI

JNI(Java Native Interface),即JAVA本地调用。它允许Java代码和其他语言编写的代码进行交互。

5结论

本文提出了一种基于SURF算法的图像识别方法,并运用此方法实现了一套基于Android平台的图像识别系统。由于系统需要进行大量的图像处理运算, 因此通过使用Android NDK调用OpenCV图像处理函数库以提高编程效率,。系统通过手机摄像头提取视频帧, 并使用SURF算法对其进行快速鲁棒特征检测。实验结果表明, 该方法复杂度低、实时性好并且具有良好的鲁棒性,将系统用于移动设备图像识别加密,以及视频监控等方面,会使其拥有更好的识别效率和可靠性。

参考文献:

[1]彭欣,刘富强,宋华军.基于SURF目标跟踪算法研究[J].长春理工大学学报, 2011,34(2):138-141.

[2]徐秀云.基于特征点的景象匹配技术研究[D].南京:南京理工大学,2009:1-68.

[3]高健, 黄心汉, 彭刚,等. 一种简化的SIFT图像特征点提取算法[J].计算机应用研究,2008,25(7):2 213-2 215.

[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.

[5]黎松,平西定,丁益洪.开放源代码的计算机视觉类库OpenCV的应用[J].计算机应用与技术,2005,22(8):134-136.

[6]韩超,梁泉.Android系统原理及开发要点详解[M]北京:电子工业出版社,2010:70-93.

[7]韩露.一种Java与OpenCV结合实现的目标检测模块[J].计算机应用,2008(3):773-775.

[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.

[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.

[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.

[11]纪华,吴元昊,孙宏海,等.结合全局信息的SIFT特征匹配算法[J].光学精密工程,2009,17(2):439-444.

[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.

[13]公磊,周聪.基于Android的移动终端应用程序开发与研究[J].计算机与现代化,2008(8):85-89.

第10篇

(讯)上周,大盘震荡下行,中小板及创业板均有不同程度的调整,全周收跌。计算机行业震荡上行强于大盘,各概念板块均有不同程度的上涨。

我们认为,市场短期仍缺乏热点,个股上涨持续性不强,板块热点轮动过快。大盘目前点位已接近今年二月以来的高点,资金较为谨慎,存量资金博弈明显,场外资金观望氛围较强。

从行情层面看,计算机板块由于前期上涨较多,短期呈现震荡整理走势。此外,随着通信网络基础设施的逐步完善,以及云计算技术不断成熟,云计算服务业渐入佳境。其中,云计算基础设施的IDC已经初步显现优势,有望持续得到市场关注。国产软件行业在本周呈现强势,随着中报行情推进,业绩较好的软件公司可以重点关注。

而从估值层面看,计算机板块的估值已落入近三年估值中枢的下方,长期投资价值开始显现。短期个股分化明显,前期上涨较多个股有回调压力。在后期操作建议层面,我们仍维持此前的判断,即认为短期内难有明显的利好政策或事件刺激,行情大概率仍将维持震荡,因此建议投资者应谨慎应对,多做左侧布局而避免追涨杀跌。

对于下半年,我们对行业谨慎偏乐观。配置方面,我们建议短线投资者逢低布局跌幅较深短期有补涨需求的板块及个股以博反弹收益,另外重点关注中报业绩预期翻转的公司;建议中长线投资者仍从基本面出发进行选股,建议投资者重点关注业绩成长质量高(内生增速高)且持续性强的个股。我们坚持看好人工智能和计算机视觉板块的持续性主题投资机会,计算机视觉是人工智能领域中发展最为迅速的一个重要分支,其应用融合度高,互联网巨头的布局必将引起国内资本层面的关注,投资者可积极关注。

综上,我们继续维持行业“看好”的投资评级,股票池推荐多伦科技、恒华科技、东方网力、华宇软件、四维图新。(来源:渤海证券 文/王洪磊 编选:中国电子商务研究中心)

第11篇

关键词:牛肉分级;边缘检测;二值化处理;自动分级

中图分类号:TS251.52 文献标志码:A 文章编号:1001-8123(2013)04-0010-05

2003年10月我国农业行业标准《牛肉质量分级标准》开始实施,鉴于牛肉眼肌横切面包含了大理石纹、肉色、脂肪色、背膘厚度和眼肌面积等评定指标,所以在牛肉质量的分级标准和体系中,进行牛肉等级评定时,通常都将眼肌面积横切面作为主要的评定对象。但目前为止,国内外的牛肉分级体系采用的分级方法还是以主观的视觉评定为主,评定过程受到人为因素的干扰,不仅效率低,而且还会产生较大的误差。因此,计算机视觉、人工神经网络和图像处理技术,被认为是实现牛肉自动分级的最有效的方法。在国外,1989年Chen Shengwei等[1]首次针对美国牛肉大理石花纹标准图版,应用图像处理技术对美国牛肉的肌肉脂肪面积进行计算,用于牛肉质量分级,并将其作为判定牛肉质量等级的定量指标,在随后的相关研究中,研究学者运用图像处理方法等技术分别有效的预测大理石纹、颜色等级、脂肪面积比、脂肪颗粒分布均匀度等特征参数,探讨了基于图像处理的牛肉等级评定技术[2-5]。在国内,计算机技术在牛肉等级评定中的应用还处于初步研究阶段,主要是通过眼肌切面图像的纹理分割,通过计算脂肪面积比[6-7]的方式来计算牛肉等级[8-10],对脂肪在肌肉中分布所形成的特征分析不够深入,对牛肉等级评定的准确性和实际应用等方面都有不足之处。本研究拟运用计算机视觉系统对牛肉眼肌的形状特征值、脂肪含量和分布进行量化,在VC++6.0的环境下自行开发适用于牛肉眼肌自动分级软件,提高分级的准确性和工作效率,为我国牛肉智能化分级技术的研究奠定理论依据[10]。

1 材料与方法

1.1 材料、软件及基本原理

采用Visual Basic6.0作为实验分析软件,利用图形处理中的二值化算法、边缘检测算法等对采集到的数字图像进行处理和分析,提取出用于牛肉眼肌自动分级的眼肌面积、圆度、大理石纹密度等重要参数,再利用模糊数学理论利用计算出的参数数据,实现对牛肉眼肌的智能自动分级。

1.2 方法

1.2.1 边缘检测法

物体图像的边缘信息特征因为颜色、纹理结构和灰度值的变化是以不连续性的形式出现,是图像最基本的特征之一。边缘检测法提取图像特征是图像识别中的一个重要属性和重要环节[11]。图像边缘检测中的经典算法SUSAN算法[12]选用放在不同5个位置上圆形模板,如图1所示。

比较模板内像素的灰度与核心的灰度,其差值在阈值内时,认为灰度相同。与核的灰度相同的像素数目之和称为模板的面积(USAN)。SUSAN算法根据USAN区的大小和矩阵特性来检测图像边缘及角点等特征的位置及方向信息[13]。由图1所示,平坦区域USAN区最大(d,e),边缘处USAN区大小降为一半(a),角点附近USAN区变得更小(c)。

1.2.2 二值化处理

图像二值化是指对仅含黑白二值的图像进行参数提取数据预处理的重要技术。采用直方图均衡化,同态滤波对图像进行预处理抑制外界因素提高图像质量,或者将图像划分为若干区域,分别设定阈值Tn,则:

(1)

由于所提取的大理石纹图像中,仅有肉色和脂肪色,即只有红色和白色两类颜色信息,因此在二值化处理过程中,采用第1种方法进行二值化处理。

图像分割是基于边缘检测或基于区域的分割,将同一属性但区域互不相交,均满足特定区域一致性条件的不同区域分割开来[14]。本研究采用区域生长法实现对图像的分割。

1.2.4 模糊综合评判

对模糊事物实现较合理的评价可采用模糊数学中的模糊综合评判法 [15]。设定因素集,集合中的某一元素Ui表示决定事物的第i个因素,评价集Vi表示对事物评价结果。

2 结果与分析

2.1 利用二值化算法提取大理石花纹

2.1.1 二值化算法

对大理石纹图像的特征参数提取时,均需要先对图像进行二值化处理,将彩色图像处理成只包括黑色像素点和白色像素点的图像。由于所提取的大理石纹图像中,仅有肉色和脂肪色,即只有红色和白色两类颜色信息,因此在二值化处理过程中,采用第1种方法进行二值化处理。

假定彩色图像的大小为M×N,fn其表示像素点的颜色值,f(I,j)表示像素点(I,j)的二值化结果,当f(I,j)=1时,像素点(I,j)被标记为黑色像素点,当f(I,j)=0时,像素点(I,j)被标记为白色像素点。对于某一像素点(I,j),如果该像素点的颜色值fn大于阈值T,则令f(I,j)=1,否则f(I,j)=0,实现对彩色图像的二值化处理。二值化方法如式(2)所示在二值化算法中,阈值的选取是二值化处理的关键,如何选取合适的阈值t,准确提取出不同图像中的大理石纹,是本算法的一个关键技术。本研究的所有实验,都是基于VC++6.0编程完成。在所有图像的二值化处理中,程序设计使用inputbox函数的数据输入方式,由用户根据个人经验输入某一个阈值T。

(2)

经过二值化处理后的图像,白色点表示脂肪像素点,黑色点代表肌肉像素点。本算法进行大理石纹的面积计算、圆度测量、密度分析等算法都是在图像二值化的基础上进行的,因此,图像二值化的结果将直接影响到后面参数的提取准确度问题。

2.1.2 二值化实验结果分析

图2是对原图像1采用不同阈值t的检测结果,图3是对原图像2采用不同阈值t的检测结果。从图2、3结果可以看出,对于不同亮度的图像,采用相同的阈值,如t=90时,对原图像1,可以很好的提取出二值化图像;而对原图像2,无法正常提取出所需要的区域信息。同样,对于t=160时,从图2D可以看出,对于原图像1,由于阈值太大,造成一些有用的大理石纹信息丢失,而对于原图像2,能更好的提取出需要的大理石纹信息,为后继准确的提取大理石纹信息提供保证。

本算法中,阈值的选取采用人机对话的方式选择阈值,希望后期工作中能研究出一种能自动根据图像颜色亮度特征智能选取阈值的算法。

2.2 利用区域生长算法提取有效眼肌面积

由于眼肌面积图像中仅含有白色和红色两种颜色区域,有效眼肌面积区域是一块连通区域,因此,采用种子点生长算法,可以很好的提取出和所选种子点相连通的所有连通区像素点。

有效眼肌面积的提取步骤如下:以原图像1(图3A)中眼肌面积的提取为例,先采用二值化算法,选用阈值t=90,使得眼肌内的区域为大片黑色联通区,再利用种子点生长算法,利用鼠标选取眼肌中黑色联通区中的一点作为种子点,生成的眼肌面积内的联通区,如图3所示。由于生成的联通区内存在大理石纹,所以眼肌面积是图像总面积减去灰色联通区的面积。

首先采用二值化算法,对原图像进行二值化处理,然后对处理好的二值化图像,用鼠标选取属于要计算面积区域中的某一黑色像素点,采用种子点生长算法[16],将所选取的像素点作为种子点,进行生长,识别出面积轮廓。由于图4中的面积区域,还存在白色大理石纹,不能直接计算出面积大小,因此,再对图4进行二值化处理,选取背景色中的任意1点作为种子点进行生长,然后进行背景图像区域的识别,再用总面积减去背景区域的面积,即可算出眼肌面积。对原图像1,利用本实验算法计算出的有效眼肌面积共14742个像素点。

2.3 肌肉和脂肪色度值

将图像中所有肌肉像素点采用种子点生长的算法提取出来所有的红色像素点区域,对提取出的肌肉连通区图像,遍历整个图像,计算出连通区中所有像素点的Red、Green、Blue三个颜色分量的平均值,再使用颜色公式w(x,y)=Red+Green×256+Blue×65536,计算出所有肌肉像素点的颜色平均值。同样的算法,可以提取出白色脂肪的色度值。对原图像1(图2A)进行肌肉色度和脂肪色度的计算,计算出了脂肪色度为11437206,肌肉色度为7428162,对原图像2(图3A)所示的图像,计算出的脂肪色度为11718453,肌肉色度为127466071。该颜色值越大,说明图像颜色亮度越大,色值越高。

2.4 眼肌圆度

有效眼肌面积的圆度可以采用计算其长轴的长度和短轴的长度,通过长短轴的比值来衡量眼肌面积的圆度。在一幅灰度图像中,已知中两个像素点的坐标(x1,y1)、(x2,y2),利用两点间距离的计算公式:

(3)

可以计算出某一直径,直径的大小即为长轴的长度。因此,查找到有效眼肌面积的长轴的两个像素端点是计算长轴的关键。

本算法采用种子点生长算法提取出有效眼肌面积的连通区,然后由用户利用鼠标,选取出长轴的起点,如图5B所示,设置出长轴的起点坐标(x1,y1)。然后在如图5C所示的连通区中找到离该点最远的像素点坐标值(x2,y2),利用两点间距离公式,计算长轴的长度。短轴是在长轴垂直平分线上的离长轴中点((x1+x2)/2、(y1+y2)/2)最远的点和中点间的距离。测量结果显示,长轴215.94,短轴55.08,长短轴比率:55.08/215.94≈0.51,比值越接近于1,说明眼肌面积越趋向圆。

2.5 大理石纹密度

对大理石纹密度统计分析分为5个步骤进行:第1步,采用区域生长法或者边缘检测算法对原图像进行图像分割,将图像分割成不同的很多连通区;第2步,对所有连通区进行着手标记,同一连通区着相同的颜色,不同的连通区采用不同的颜色;第3步,统计所有连通区各自的面积大小区域;第4步,统计图像中连通区总数目;第5步,统计标记的连通区面积在0~5、5~10、10~15、15~20等范围内的连通区个数。

2.5.1 不同连通区着色

采用眼肌面积算法中的种子点生长算法,对整个图像进行遍历,识别出所有的连通区,并用不同的颜色值标记出不同的连通区。

对照高标准的密度检测结果图7和低标准的密度检测结果图8检测结果发现,相同像素点下连通区总数越多,说明大理石纹越丰富。像素点总数小于5的连通区的个数表明大理石纹的分散程度,值越大,说明越分散,密度越大。

2.6 基于模糊数学理论的牛肉大理石花纹自动分级系统

针对牛肉自动分级中大理石纹参数特征值的模糊性、相关性、多变量等特点,结合模糊数学理论,将所提取出来的所有眼肌面积、大理石纹密度,眼肌面积的圆度、色度等多个参数,采用模糊数学理论中的综合评判技术建立了基于模糊综合评判的牛肉大理石纹自动分级模型。例如:使用模糊综合评判算法记U={眼肌面积,圆度,肌肉色度,脂肪色度,大理石纹密度},表示因素集,表示决定牛肉分级品质的所有因素。记?={a1,a2,a3,…,an}。取评价集V={低品质牛肉,中等品质牛肉,优质牛肉,特优级牛肉},表示牛肉的评价结果。

对牛肉品质等级的判定,需要综合考虑各种因素,如牛肉的大理石纹分布的密度,有效眼肌面积的圆度、色度、面积大小等。结合本系统中采用数字图像处理技术自动提取出的相关的参数信息,然后考虑所有因素对评价集V中各等级的隶属度,可得综合评判矩阵如。

3 结 论

利用了图像处理中的边缘检测技术、二值化处理和图像分割技术,先对原牛眼肌图像进行二值化处理,然后对处理好的二值化图像,采用种子点生长算法,识别出眼肌面积轮廓,进行背景图像区域识别,计算眼肌面积,并采集连通区中所有像素点的Red、Green、Blue 3个颜色分量,计算出所有肌肉和脂肪像素点的颜色平均值,并对有效眼肌区域的圆度和大理石纹分布密度进行参数提取和检测。结果证明,本实验设计的算法能够近似的估算出牛眼肌面积、脂肪比例、色度值、眼肌圆度和大理石花纹密度,是一种有效的估算方法,并通过大量实验数据和人工测量数据进行比对,证明使用图像处理技术自动估算上述5个特征参数是可行的,为基于计算机视觉的牛肉品质自动分级检测奠定基础。后期工作中希望能并结合大理石花纹的特点和特征描述以及具体牛肉图像的特点,通过大量的数据,使用模糊聚类,模糊识别、模糊综合评判等技术,给出接近现实的、准确的牛肉等级判定结果,为进一步研究基于计算机视觉的牛肉自动分级系统打下基础。

参考文献:

[1] CHEN Shengwei, SUN Xin, QIN Chunfang, et al. Color grading of beef fat by using computer vision and support vector machine[J]. Computers and Electronics in Agriculture, 2010, 70(1): 27-32.

[2] YOSHIKAWA F, TORAICHI K, WADA K, et al. On a grading system for beef marbling[J]. Pattern Recognition Letters, 2000, 21(12): 1037-1050.

[3] SHIRANITA K, HAYASHI K, OTUSBO A. Determination of meat quality using texture features[J]. The Institute of Electronics, Information and Communication Engineers Transactions on Information and Systems, 2000, 83(4): 1790-1796.

[4] AASS L, FRISTEDT C G, GRESHAM J D. Ultrasound prediction of intramuscular fat content in lean cattle[J]. Livestock Science, 2009, 125(2/3): 177-186.

[5] KAZUHIKO S, KENICHIRO H I, AKIFUMI O, et al. Grading meat quality by image processing[J]. Pattern Recognition, 2000, 33(1): 97-104.

[6] CHEN Kunjie, QIN Chunfang. Segmentation of beef marbling based on vision threshold[J]. Computers and Electronics in Agriculture, 2008, 62(2): 223- 230.

[7] 陈坤杰, 姬长英. 牛肉自动分级技术研究进展分析[J]. 农业机械学报, 2006(3): 159-162.

[8] 陈坤杰, 孙鑫, 陆秋琰. 基于计算机视觉和神经网络的牛肉颜色自动分级[J]. 农业机械学报, 2009(4): 179-184.

[9] 陈坤杰, 秦春芳, 姬长英. 牛胴体眼肌切面图像的分割方法[J]. 农业机械学报, 2006(6): 161-164.

[10] 任发政, 郑丽敏, 王桂芹, 等. 应用MATLAB图像处理技术评判牛肉大理石花纹[J]. 肉类研究, 2002(4): 14-15.

[11] 贾渊, 李振江, 彭增起. 结合LLE流形学习和支持向量机的猪肉颜色分级[J]. 农业工程学报, 2012(9): 154-159.

[12] 魏光杏, 吴锡生. 新型边缘检测法[J]. 计算机工程与设计, 2007(4): 144-145.

[13] GE X W, FU K T. Edge detection in image method research[J]. Digital Community & Smart Home, 2007, 3(16): 1144-1145.

[14] 王文渊, 王芳梅. 改进的最大熵算法在图像分割中的应用[J]. 计算机仿真, 2011(8): 297-300.

第12篇

关键词: 大跨度运动; 肢体摆动; 视觉图像; 轮廓特征检测

中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)07?0067?04

Visual judgment of body swing amplitude in long span movement

GAO Li

(Henan University of Animal Husbandry and Economy, Zhengzhou 450046, China)

Abstract: Since it is difficult to model the visual feature of the body swing amplitude in the long span movement, an edge area contour feature detection based visual judgment method of the body swing amplitude in the long span movement is proposed. In the visual judgment method, the body swing visual image of the long span movement is used, and then the high frequency component of the image is denoised to improve its SNR. The edge area contour feature detection method is used to extract the feature of the body swing amplitude to implement vision detection and image recognition. The performance of the method was verified with simulation. The simulation results show that the method can judge the body swing amplitude in the long span movement accurately, has strong ability for movement image analysis, and can improve the output SNR of the image and probability of accurate detection.

Keywords: long span movement; body swing; visual image; contour feature detection

0 引 言

随着计算机数字图像处理技术的成熟,采用图像视觉分析方法进行运动图像的特征检测,在体育运动训练方面展示了较高的应用价值。大跨度运动主要包括跳高、三级跳远、跨栏以及各种球类运动。大跨度运动中肢体摆动幅度较大,采用传统的视频分析方法难以实现对运动动作的特征分析和视觉重构,不能有效指导体育运动训练效果,需要采用计算机视觉图像分析方法进行大跨度运动图像的检测和分析,视觉重构肢体摆动幅度,从而改进肢体运动中的不规范动作,提高运动训练的效果[1]。

对大跨度运动中肢体摆动幅度的视觉判断建立在人体三维模型建立和视觉特征重构的基础上。采用图像信息处理技术对大跨度运动中的人体肢体摆动运动动作进行特征视觉重构[2],典型的人体运动中肢体摆动幅度的视觉特征重构方法主要有局部线性插值方法、二值图像拟合方法和边缘轮廓特征提取方法等[3?5]。

本文提出边缘区域轮廓特征检测的大跨度运动中肢体摆动幅度视觉判断方法。首先通过CCD图像扫描技术或者视频特征采集技术视觉采集运动图像;然后对运动图像进行边缘信息融合和特征重建,提高图像的肢体摆动幅度的特征分析和参量估计能力;最后通过仿真实验证明该方法取得了良好的视觉判断效果。

1 运动图像的初始化过程

1.1 图像采集

为了实现对大跨度运动中肢体摆动幅度的视觉判断,首先要采集大跨度运动中肢体摆动视觉图像,设图像视觉特征为[vm=(Rm,Gm,Bm)]和[auxm(Im,Im,fm,λm,dfm,][dlm),][Ψ11,][Ψ12,][Ψ13,][Ψ14]和[Ψ15]表示模板匹配系数,像素集合为[N1×N2]的运动图像边缘轮廓特征矩阵,运动幅度输出测试样本为:

[identity(y)=argminiW12final(y-Diαi)22] (1)

式中:[Wfinal]是动态变化过程的权值矩阵;[Di]是第[i]类训练样本三维结构模型。

初始特征状态下肢体摆动特征的形体坐标为[X=(xi0,xi1,…,xi(n-1),yi0,yi1,…,yi(n-1))T。]在肢体摆动动作三维重构和视觉分析中,建造一个级联分类器进行摆动动作的特征分类[6?7]。得到大跨度运动中肢体摆动修正像素值[I(i,j)]为:

[I(i,j)=k=1PI(k)(i,j)×2k-1] (2)

对视觉特征进行统计形状模型分块,进行图像样本属性的自适应分割,跟踪量化子块互不相交的部分,那么图像特征采集结果为:

[Gm,n=g(m,n)(1,1)g(m,n)(1,2)g(m,n)(2,1)g(m,n)(2,2), m=1,2,…,M;n=1,2,…,N] (3)

[g(m,n)(u,v)=I(k)g[2(m-1)+u,2(n-1)+v], u∈{1,2};v∈{1,2}] (4)

式中:[u]为图像[pi,j]在标定点的像素值;[i,j]为匹配点沿梯度方向相应像素的坐标值。

1.2 图像预处理

为了提高图像的输出信噪比,进行图像降噪预处理。采用图像高频分量降噪方法提高运动图像的输出信噪比[8]。在图像的成像区域中,分区处理肢体摆动空间信息特征,采用关联信息特征重建方法构建肢体摆动的特征分布无向图[G=(V,E),]其中[E]是[E]的非空子集,采用RGB三维映射分析方法对图像的噪点[P1=k=1hp(k)g(i,j)×2k-1]和[P2=k=1hp*(k)g(i,j)×2k-1]进行噪点盲分离,其系统函数为:

[H(z)=k=1hp(k)g(i,j)×2k-1k=1hp*(k)g(i,j)×2k-1] (5)

选择时间间隔较长的[PE1]作为关键帧,通过最大灰度值提取轮廓特征空间信息,得到大跨度运动中肢体摆动RGB图像[Edx,y]的三维坐标特征分布方程满足:

[Fd-ddxFdx-ddyFdy=0] (6)

设RGB影像中像素的坐标为[υ=(r,c),]对于最大灰度特征分频,通过图像降噪满足[C∈S,]其轮廓边缘特征的特征匹配系数为[MST(C,E),]图像的噪点为[C={Ci:i∈I}。]假设运用图像干扰检测方法进行图像噪声分离,得到大跨度运动中肢体摆动二值图像的轮廓点标记信息:

[g(x,y)=f(x,y)+ε(x,y)] (7)

式中:[f(x,y),][g(x,y),][ε(x,y)]分别代表每个三维模型中图像噪声方差为[σ2n]的边缘轮廓特征函数[9?10]。

在图像降噪过程中,可将两个分布场集合描述为:

[dft+1i,j,k=ρdfti,j,k+1-ρdft-1i,j,k] (8)

式中[ρ]控制两个图像噪声分布场特征归并的时间间隔。

通过上述处理,从体元模型中获取RGB影像的轮廓标记点[r,]确定为大跨度运动中肢体摆动幅度搜索的目标。记录[D(x)=0]处的体元,根据肢体摆动幅值分布兴趣点进行边缘像素集的跟踪量化,量化值[VMmi]的计算式为:

[VMmi=j=1TCis_visibleMmi,CjTC-1] (9)

通过特征提取与特征归并实现图像降噪和肢体摆动幅度的视觉判断。

2 肢体摆动幅度的视觉判断优化实现

2.1 基本思想

基于边缘区域轮廓特征检测的大跨度运动中,肢体摆动幅度视觉判断方法的基本思想为:采用边缘区域轮廓特征检测方法进行肢体摆动幅度特征提取,实现视觉检测和图像识别,在原始RGB图像数据中构建运动图像边缘区域轮廓特征检测的网格图,在网格顶点图中进行图像深度转换,采用顶点图与法向向量图融合方法进行光纤投影,实现对大跨度运动中肢体摆动视觉图像的体元计算和数据融合,完成采集相机的位置追踪和边缘区域轮廓特征检测。工作原理如图1所示。

2.2 计算运动图像边缘区域轮廓特征距离

肢体摆动视觉图像的体元检测结果为:

[xI(W(x;p))-A0(W(x;0))-?A0?W?pΔp2] (10)

基于角点检测结构,进行体元数据融合,则有:

[Bel(xt)=p(ztxt)p(xtut-1,…,z0)p(ztut-1,d0,…,t-1)=ηp(ztxt)Γp(xtxt-1,ut-1)Bel(xt-1)dxt-1] (11)

视觉图像采样的特征压缩函数为:

[p(ztxt-1,d0,…,t-1)=Γp(xtxt-1,ut-1)Bel(xt-1)dxt-1] (12)

[p(ztxt)=p(xtxt-1,ut-1)] (13)

用TPS顶点图与法向向量图变换来确定大跨度运动中肢体摆动网格区间的图像深度[η]:

[η=1p(ztut-1,d0,…,t-1)] (14)

为了实现运动图像边缘区域轮廓特征检测,从顶点图中进行特征点自适应检索,得到大跨度运动中肢体摆动的角点位置信息相关函数:

[RT1R1={X1,X2,…,Xm}{X1,X2,…,Xm}T] (15)

考虑特征向量分布空间的肢体摆动视觉像素特征点,进行运动图像边缘区域轮廓特征分解:

[RT1R1=V1Σ1VT1] (16)

得到大跨度运动中肢体摆动的标准化特征满足条件[?=sup?(θ)],肢体摆动目标点与特定点之间的距离为:

[h(ωi,k)=(xi-x)2+(yi-y)2] (17)

通过SIFT角点检测算法实现对大跨度运动中肢体摆动视觉图像的体元计算和数据融合,达到运动图像边缘区域廓特征检测的效果。

2.3 肢体摆动幅度规律性特征角度的识别

假设大跨度运动中肢体摆动幅度向量集[K{ri}]为体源模型区域中的模型拼接信息,在特征检测节点[(x,y)]处提取肢体摆动幅度的规律性特征信息:

[Kwpg(x,y,ωi)=1,d(ωi,k)≤r-ruu-α1θβ1θ2β2+α2,r-ru

式中:[ru(0

[θi=ru-r+d(ωi,k)] (19)

采用计算机视觉信息判断方法进行肢体摆动幅度的视点分割,得到视点分割的特征映射:

[Kwpg(Wpg)=1-ωi∈Wpg(1-Kwpg(x,y,ωi))] (20)

计算出计算机视觉下大跨度运动肢体摆动的边界网格中[ki(ki-1)2]个边,这[ki]个肢体摆动的像素信息点实际形成的边[Ei]与[ki(ki-1)2]的比值构成肢体摆动的三维重构信息,信息函数为[Ci,]即:

[Ci=Eiki(ki-1)2] (21)

肢体摆动动作的三维空间重构输出为:

[C=1Ni=1NCi] (22)

结合人体动力学模型,得到[N=228]。结合边缘区域轮廓特征检测方法提取肢体摆动幅度SIFT特征,实现视觉检测和图像识别。本文方法的实现过程如图2所示。

3 实验与结果分析

实验平台硬件环境为:CPU 3.30 GHz,内存4 GB DDR3的个人PC机,输入图像的像素值为1 024×1 689,实验次数为100次,图像的信噪比为-12 dB。以三级跳远作为大跨度运动的测试向量集,以跳远运动中的正面和侧面采集的两幅肢体摆动图像作为测试对象,首先对大跨度运动中肢体摆动视觉图像进行特征采集,得到原始运动图像视觉信息采集的结果如图3所示。

图3给出的运动图像采集结构受到相机抖动和环境因素的干扰,准确判断运动幅值的性能受限。采用图像高频分量降噪方法提高运动图像的输出信噪比,得到的图像降噪结果如图4所示。

把图4中的大跨度运动中肢体摆动幅度视觉判断及动作数据保存为.txt文本数据,加载到图像数据处理软件中,进行计算机视觉分析。然后采用边缘区域轮廓特征检测方法进行肢体摆动幅度特征提取,得到的结果如图5所示。

从图5可见,采用本文方法进行大跨度运动中肢体摆动幅度检测,能较好地去除背景信息的干扰,提高肢体摆动幅度检测的准确度和指向性。图6为大跨度运动中肢体摆动幅度的视觉检测均方根误差对比结果。

分析图6可知:

(1) 采用本文方法进行大跨度运动中肢体摆动幅度检测,提高了输出图像的峰值信噪比,改善了图像成像质量。

(2) 本文方法进行大跨度运动中肢体摆动幅度视觉判断,实现幅度参量检测估计的均方根误差较低,说明准确性能较好。

4 结 语

为了提高大跨度运动训练的指导水平,进行大跨度运动中肢体摆动幅度视觉特征建模分析,提出基于边缘区域轮廓特征检测的大跨度运动中肢体摆动幅度视觉判断方法。研究结果表明,本文能够实现大跨度运动肢体摆动幅度的视觉判断,提高图像的输出信噪比和准确检测概率,误差小,具有广泛的应用前景。

参考文献

[1] 柳超,李秀友,黄勇.优化的多模型粒子滤波机动微弱目标检测前跟踪方法[J].信号处理,2015(9):1131?1137.

[2] 赵石磊,郭红,刘宇鹏.基于轨迹跟踪的线性时滞系统容错控制[J].信息与控制,2015,44(4):469?473.

[3] 尚朝轩,王品,韩壮志,等.基于类决策树分类的特征层融合识别算法[J].控制与决策,2016,31(6):1009?1014.

[4] 郭三党,刘思峰,方志耕.基于核和灰度的区间灰数多属性决策方法[J].控制与决策,2016,31(6):1042?1046.

[5] MAREY M, DOBRE O A, LIAO B. Classification of STBC system over frequency?selective channels [J]. IEEE transactions on vehicular technology, 2015, 64(5): 2159?2164.

[6] 李旭超,宋博,甘良志.改进的迭代算法在图像恢复正则化模型中的应用[J].电子学报,2015,43(6):1152?1159.

[7] 涂超平,肖进胜,杜康华,等.基于各向异性热扩散方程的多聚焦图像融合算法[J].电子学报,2015,43(6):1192?1199.

[8] 王宝进,吴淑跃,薛娟.SDD?1改进算法在Hive中用[J].湘潭大学自然科学学报,2014,36(4):77?82.