时间:2023-08-09 17:33:24
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇医学技术分类,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
随着信息技术及计算机硬件技术的迅速发展,引发了数据的大量累积。数据规模爆炸性增长,而人们却无法直接获取隐藏在这些数据背后的信息。这就形成了“数据丰富但信息贫乏”的困境。人们迫切需要使用一种有效工具来摆脱这种困境,于是数据挖掘技术走进了人们的视线。数据挖掘源于人工智能的机器学习,由多种技术交叉融合而成。数据挖掘技术最早是应用在关系数据库上,这是因为结构化数据能够非常方便的用于数据挖掘的研究。而随着图像等多媒体数据的大量累积,引起了学者们对多媒体数据挖掘研究的关注。多媒体数据挖掘年会的召开,促进了多媒体数据挖掘技术研究的发展,数据挖掘的研究也因此向非结构化数据方向发展。由于图像对象结构的复杂性,该领域的挖掘技术发展相对比较缓慢。2002 年的 MDM/KDD 年会表明对医学图像的数据挖掘研究已经成为数据挖掘一个新的研究领域。图像挖掘的研究工作可以分为面向特定领域的研究和通用方法的研究。面向特殊领域的图像挖掘的研究主要集中在如何从图像中提取最相关的特征,并组织成适合数据挖掘的形式。通用的图像挖掘的研究主要集中在如何生图像模式,帮助人们理解图像表达的含义。医学图像数据挖掘属于面向特定领域的研究。医学图像挖掘就是从医学图像数据中挖掘出有助于对病情诊断的信息,辅助医生准确、快速的做出医疗诊断。随着医学影像设备的使用,非结构化的医学图像信息已经加入到医学信息数据库中。医学信息数据库的扩展,为医学图像数据挖掘提供了丰富的数据源。鉴于挖掘对象的复杂性,对传统的数据挖掘技术的简单应用已不再适合医学图像数据,需要将数据挖掘技术和医学领域知识结合起来进行研究。
1.2 研究背景和意义
近年来,各医院不断引进先进的数字医疗设备,产生了大量复杂并蕴含丰富信息的医学图像。医学图像除了具有图像特征信息难以表达的特点外,还具有高分辨特性,异构性和噪声等显着特性。医学图像不同于其它类的图像,它是患者的组织器官信息在图像上的反映,通过医学图像的挖掘对患者的准确诊断及治疗都具有十分重要的意义。目前,医生在进行临床诊断时,多数依靠个人的临床经验和通过肉眼观察图像中的病变区域进行临床诊断。这样显然带来以下不足:(1)人眼对图像的识别能力有限,这样客观存在而肉眼无法识别的医学图像信息就会丢失,降低了医学图像信息的利用率;(2)对于临床经验不够丰富的医生,凭借临床经验进行诊断,诊断准确率不高;(3)不同医生对同一图像的诊断结果不同,这样就会有误诊或漏诊的可能;(4)对于多个图像,医生对其诊断势必会耗时很多。作为人体的高级神经中枢所在地,脑组织的机能是否正常直接关系到一个人能否正常生活,因此发生在脑组织的疾病历来都深受医学界的高度重视。脑部疾病(尤其是脑瘤)严重影响人的生活甚至危及生命,而利用无损伤的医学图像及早发现病变已经成为全球性防癌抗癌的发展趋势。因此及早的发现病变信息和提高诊断能力就变得愈加迫切和重要
第 2 章 数据挖掘相关知识
数据挖掘能从海量的数据中挖掘出有用的信息或知识即将数据转换为有用的信息或知识,自产生以来一直受到广大研究者的关注。人们在不断的研究中,发展了数据挖掘技术并将这些技术应用到各个领域。下面将给出数据挖掘的相关概述并对数据挖掘中的分类进行详细描述。
2.1 数据挖掘概述
随着信息技术不断发展,各行各业产生了大量的数据并且先进的科技为这些数据的存储提供了支持。虽然这些数据中蕴含着许多有用的信息,但是却没有可用的工具从海量的数据中获取信息,一时间人们陷入了知识获取困难的境地,迫切需要跨过数据与知识之间的鸿沟,数据挖掘就是在这种需求下产生的。简言之,数据挖掘就是利用有效的挖掘工具,从海量数据中提取出对研究有意的知识。数据挖掘的全过程定义描述如图 2.1 所示。
2.2 分类的概述
每天我们都会做出一些决定,例如出行前是否需要带伞,当天的天气是否适合晾晒被子等。为了给出较为准确的决定,我们就要当前的具体情况信息并结合自己的经验知识对收集的信息进行分析和评定,最终给出决策信息。在决策的过程中,我们必须掌握足够的信息才能保证决策的可靠性。这种可靠性可能是造成最少的损失,给出最优解等。如何从大量的信息中给出可靠的决策,这就是数据挖掘领域研究的分类问题。分类是数据分析的形式之一,可以用于对海量数据的模型提取或发展趋势的预测。它首先找出对象之间的共性,然后按照分类模型对它们进行分类。例如,可以通过建立分类模型,对是否会购买电脑的人群进行分类;也可以通过建立分类模型,给出病例的诊断分析等。分类已成为数据挖掘方法中一种重要的分析手段。分类是一种有监督的学习,它通过对带有类别标号的训练集的分析和归纳生成分类模型,并通过分类模型给出测试数据的类标号。数据分类通常分为两步:第一步
第 1 章 绪 论.................1
1.1 引言.....................1
1.2 研究背景和意义..............2
1.3 国内外研究现状.................3
1.4 问题的提出...................4
1.5 研究内容....................5
1.6 论文的组织结构..............5
第 2 章 数据挖掘相关知识.............7
2.1 数据挖掘概述....................7
2.2 分类的概述..................9
2.3 决策树分类......................10
2.4 集成分类.....................14
2.5 本章小结....................17
【关键词】中医学;数据挖掘;知识发现
1 数据挖掘
数据挖掘(DM :Data Mining)作为仍在不断完善和发展的技术,到目前为止数据挖掘技术到现在还没有形成统一的普遍的定义,目前比较公认的定义为:数据挖掘是从海量数据中提取或“挖掘”出有用的知识[1-2]使用数据挖掘技术可以对这些复杂的定性描述和隐性知识进行挖掘,揭示其规律并使隐性知识显性化[3]。数据挖掘[4](DM :Data Mining)是一个集合数据库、数理统计、机器学习、可视化和信息科学技术为一体的新兴的交叉学科。不仅计算机学科由于它的出现得到了快速的发展,并且也能为过程控制、商务管理、科学研究、优化查询、医药研发等领域提供新的方法和注入新的活力,从而推进各个学科的不断发展。
2 数据挖掘中的基本概念
2.1 数据集
数据集是从某个环境或过程中取得的一系列测量结果。对于一些基本的情况,我们有一系列的测量对象,每一个测量对象都有统一的t个测量数据,此时可以把这p个对象的一系列测量结果看作是一个p×t的数据矩阵。矩阵中的t列表示对每个对象所作的t种测量,称为变量、特征、属性或者字段。这个数据矩阵中的n行表示被测量的p个对象,亦可称为个体、实例、实体或记录。
1.2 模式
模式是一个用语言A来表示的表达式B,它可用来描述数据集C中数据的特性,B所描述的数据是集合C的一个子集CB。T作为一个模式要求它列举出数据子集CB中所有元素的描述方法简单。举例说明,例如,“如果考试成绩在91―100之间,则成绩优秀”可称为一个模式,而“如果成绩为91、92、93、94、95、96、97、98、99或100,则成绩优秀”就不能称之为一个模式。模式有很多种,按功能可分为预测型模式和描述型模式等。从数据集中发现模式是数据挖掘的主要任务。
3 数据挖掘过程
数据挖掘[4](DM :Data Mining)是一个集合数据库、数理统计、机器学习、可视化和信息科学技术为一体的新兴的交叉学科。不仅计算机学科由于它的出现得到了快速的发展,并且也能为过程控制、商务管理、科学研究、优化查询、医药研发等领域提供新的方法和注入新的活力,从而推进各个学科的不断发展。
图1 数据库知识发展(KDD)过程
4 数据挖掘主要方法
数据挖掘从不同的视角看有几种分类方法,主要是:根据发现知识的种类分类、根据采掘的数据库的种类分类、根据应用和根据采用的技术分类分类等[5]。
根据发现知识的种类分类:这种分类方法有:关联规则挖掘、偏差分析、分类规则挖掘、聚类规则挖掘、序列模式挖掘、趋势分析等。根据采用的技术分类:最近邻技术、决策树、遗传算法、人工神经网络、可视化技术)等。根据挖掘的数据库分类:关系型、事务型、多媒体、主动型空间型、时间型、面向对象型、文本型、异质数据库和遗留系统等。
5 在中医学研究中应用数据挖掘技术的必要性
祖国医学是中华民族的一颗璀璨明珠,在几千年的发展之中积累了中华民族与疾病斗争的宝贵经验,几千年以来,我国的传统医学积累浩瀚的方剂和丰富的经验,是世界上任何国家都无法比拟的。历代医家遗留了大量的经典方剂,这些方剂之中内中蕴涵着丰富的内容,要继承和发扬这些名医名家的学术经验,就迫切需要我们运用现代先进的科学技术手段对其进行研究。而今人类社会正在处在大规模、高速度的信息化时代,信息已经成为人类社会发展、进步和赖以生存的重要资源和基本资源。但是目前,先进的科学技术尚未能充分利用于中医药学领域,大量宝贵的经典方剂流失,这严重影响了祖国医学的发展。
在这样的背景下,中医医学现代化的利用、转化和传播的速度及能力是我国传统医学现代化发展的关键性因素。如果仅单靠“师传徒学”或个人研读古代经方揣摩名医名家经验信息效率是十分低下的,并且中医学的很多征候还具备很强的辩证性,描述疾病的主观不确切和证候信息所体现出的客观不完整,形成了中医证候信息的复杂性。这就阻碍了祖国医学的快速发展,要实现中医现代化,就要将我国丰富的中医信息资源和现代计算机方法相结合,整理归纳浩如烟海的古代经典中医文献资料,实现中医药信息资源处理、转化及传播的现代化。现有的中医数据库中的大量数据为建立中医学数据挖掘系统提供了充分的基础,通过先进的计算机信息处理技术,建立新的知识体系构建形成新的知识,为我国传统中医学发扬光大提供新的思路。
【参考文献】
[1]乔延江.中药(复方)KDD研究开发的意义[J].北京中医药大学学报.1998,21(3):15-17.
[2]Jiawei Han Micheline Kamber.范明,孟小峰等译.数据挖掘概念与技术[J].北京:电子工业出版社.2001,3-5.
[3]Fayyad U Piatet sky-Shapiro,Smyth,Uthurussmy[Z].Advances in Knowledge Discovery and Data Mining MIT Press. 1996.
[关键词]检验医学,转换角色;;伍床医学
检验医学是指对临床标本进行正确地收集和测定,提供准确和及时的报告,并能为l临床提供咨询服务,帮助临床将这些数
据正确地应用于诊断治疗和预防工作中去的一门学科。它的基
本任务是通过生物、微生物、血清、抗原抗体、细胞或其它体液的检验,与其它检查技术相配合以确定患者的临床诊断。
1检验医学的涵盖内容和扩展更加广泛
现在,医院检验早已经告别了手工操作时代,目前各种类型的自动化化学分析仪已经取代了以前的手工操作,而医院实验室从原来手工作坊式的工作模式,逐步发展成为具有良好组织和工作条件的现代化实验室。其技术含量得到大幅度的提升。
例如:在临床生物化学的检测技术方面,原先所用的化学检测方法逐步为灵敏度更高的酶偶联比色法所替代,同时引人酶
偶联连续监测的免疫学方法。在试剂的应用上,也由原来的冻干试剂发展到液体双试剂,从而使临床标本的检测结果更具精确
性和准确性。在临床免疫学方面,随着单克隆抗体的间世,标记免疫学的发展以及各种光化学免疫分析方法的应用,也使得抗
原抗体检测的灵敏度大大地提高。在临床微生物学检验方面,各
种试剂的标准化、商品化,使得各种培养基的质量得到保证。尤其在应用了核素14C标记技术和特殊的C02感受器以及利用荧光洋灭的原理来判断血培养的结果,并采用微生物数字分类鉴定和计算机专家分析系统进行结果分析,不仅使整修检测时间大大缩短,结果更加详细准确,而且整修流程更显得标准化。在血液和体液的检测方面,由于全自动多分类血球计数仪和凝血仪进入实验室,淘汰了凝血时间的手工测试,同时扩展了白细胞表面分子标记物的检测,从而使得DIC诊断及临床抗凝疗法的监测更为可靠。白血病的分类从原来单纯性的形态学分类发展到目前及将来的染色体、遗传学、免疫学和分子生物学的综合分类,大大提高了白血病诊疗的准确性。
在这种情势之下,传统医学检验本身巳经不能完全涵盖因
82I大众健康2012第5期
此而给检验带来的巨大变化。而这正是检验医学产生并得以迅速发展的缘由。
2检验医学己发展成一门学科
随着医学检验的不断发展,其不仅与传统医学检验的差别越来越巨大,它区别于其他医学专业的特点也开始表露出来:
2.1它比其他医学专业更加强调整体协作。现在的检验医学,早
已突破了过去以血、尿、便三大常规为主的检验。面对琳琅满目的诸多检验项目和越来越准确的检验要求,非常需要整体协同运作。仅就检测结果准确性要求而言,不仅涉及到标本采集时间、部位、方法的确定,还包括对检验方法的选择,以尽量减少不
同方法检测同一目标时的干扰、尽量减少不同试剂检测同一目
标时的差异、尽量减少不同仪器检测同一目标时的差异、尽量减少个体操作间的差异、尽量减少不同实验室间的差异,如果这其中有一个环节出现失误,就会导致最终检测结果的不客观。
2.2检验医学对新技术的应用比其他专业更为敏锐,其学科的发
展与新技术的关系也更为密切。以分子生物学技术为例,对于检验医学来讲,分子生物学使检验医学的工作起围得到了极大的
拓展,不仅使检验可以从事后性判断向前瞻性转变,而且其应用范围也可以扩展到诊断、治疗效果的评价、预后的评估、预测个体发生疾病的趋向、流行病学、健康状态的评价、药敏靶点的选择。
2.3自动化的融入使检验更迅速。这一点对于治疗至关重要。在
不久的将来,临床医学实验室将面临着一个质的变化:首先是临床生物化学、免疫学、微生物学和血液学之间将不再存在一个明显的学科分界线,检测手段将更加自动化、一体化和智能化。大
量的生物技术如:基因克隆技术、生物芯片技术、核酸杂交技术和生物传感技术以及各种PCR等技术的应用和引进,将使得|临
床实验室的科技水平更高、学术氛围更浓、人员素质更好。
3较色转换检验医学在现代医学中的作用愈发的明显,它不仅与病人、
医生息息相关,还跟整个医院的医疗水平密切相关。准确的检验指标不仅可以评价治疗效果,而且可以指导医生临床用药,这就为提高医药的整体医疗水平提供了相当的可能。例如:当败血症血培养阳性时,既可明确疾病的病原诊断,进一步的药敏试验又为患者的治疗提出明确的办法。这就避免了医生根据自己的用药习惯,对患同一种疾病的不同患者,使用同样的医疗方法和药品问题。
另外,它在疾病的预防中的作用也非常显著,这是因为疾病早期往往缺乏明显症状和体征,患者一般不加以注意,往往是通过实验室检查得到确诊,并接受及时的治疗。今天检验医学在现代医学中的角色已经悄然发生了变化,已经从医疗辅助角色转变为现代医疗中的重要组成部分。
4检验医学与临床医学紧密结合的重要性和必要性检验医学与临床医学的关系密不可分,临床实验室工作的
核心是检验质量问题,为此检验科负责人应主动与临床科室交
流、沟通、对话、协作。
4.11S015189文件的核心是医学实验室全面质量管理体系,强调医学检验的分析前、中、后全过程的管理。在分析后质控中,要求检验人员对所?结果进行合理解释,并收集临床科室(或病人)的反馈意见、接受合理建议、要求、改进检验科工作,或开展新业务,满足临床需求。在交流、对话中,检验科人员还可以宣传、讲解、新技术新项目的临床意义,合理及如何有效地利用它帮助临
床医生对疾病进行诊断。如厌氧菌培养,虽然不是新项目,但很多医院,甚至较大医院临床科对其使用并不够多,其中有对该项
养,回报结果未生长细菌时,医生则认为检验科技术欠住。实际上很可能是厌氧菌感染而医生未申请做厌氧培养所致。
4.2在医院的全面质量管理方案中检验科负责人参加临床会诊,
病例讨论等,有利于双方沟通和提高。而检验医师更应主动走出去,到临床科查看病人或病例,对检验过程中的可疑结果,进行
调查核实。
4.3检验科主动参与协作:由检验医学的地位与作用,说明检验医学的任务绝不仅是被动地提供数据或结果。过去很长时期,检验科被定位于"辅助科室"。即检验科只能向临床医生提供所需求的检验结果,一旦检验科提供了未受指定的检验结果,就被认为"越位",这种片面、消极的,落后于时代的偏见应予纠正。
检验医学是现代实验室科学技术与临床在高层次上的结合,是门多学科交叉,相互渗透的新兴学科。目前正朝着高理论、高科技、高水平方向发展。由于检验科开展项目的增多,新技术的应用及方法学上的革命性变革,使检验质量和水平显著提
高,使越来越多的临床医生依靠检验信息综合分析,进行诊断、治疗和预后判断,故实验室的工作在临床诊疗工作中发挥着重
要作用。总之,检验医学与临床医学必须紧密结合,互相渗透、沟通,
相互学习,才能使以病人为中心的共同目标真正落实,才能更完美的实现检验医学与临床医学的共同发展。
参考文献:
【关键词】数据挖掘;医学领域
一、引言
目前信息技术已渗透到包括医学在内的各个领域。随着医院信息系统(HIS)的应用和发展,数据库中的数据量迅速膨胀,数据库规模逐渐扩大,复杂程度日益增加。尽管积累了大量的业务数据,但真正能将这些数据的价值挖掘出来,并运用到医院的临床辅助诊断和日常管理决策中的却很少。提出建立基于HIS系统的医学信息数据仓库,在此基础上,对数据仓库中的医疗数据进行疾病监测、预测、医院管理辅助决策等方面的数据挖掘。为医务工作者、临床管理人员、科研人员提供辅助决策与综合分析的工具。在医疗方面具有重要的意义。
二、数据挖掘相关概述
(一)数据挖掘的概念及特点
数据挖掘是20世纪80年代后期出现的一个数据和信息系统应用的学科前沿,又被称为数据中的知识发现( KDD ),数据挖掘( Data Mining) ,是从海量数据中挖掘出隐含在其中的知识。数据挖掘一般有如下几个步骤 : 数据收集、整理、挖掘、挖掘结果评价、分析决策。这需要一个循环反复的过程才可能达到预期效果。详细来说,所在的应用领域不同,则其处理方法也不一样,例如在医学领域中步骤为:一、在该领域中认识到所要处理的问题具有的意义,并确定目标及标准;二、了解并清楚数据用途;三、根据研究的领域处理数据、建立数据仓库,这是一个动态的循环过程;四、数据挖掘,包括数据模型选择、训练和验证过程、建模和模型评价,对于同一过程可利用不同的算法,这仅仅是对数据的不同角度理解,每种算法均有合理的可能性,实际运用中要反复验证和比较;五、对结果进行评估,给予提取的新知识以合理解释,并需要具有一定的应用价值。
(二)数据挖掘的常用技术
数据挖掘是一门诞生时间不长却飞速发展的计算机分析技术, 在这些年来, 数据挖掘理论日趋成熟, 并在实践中大放异彩。在各个领域的应用中, 最常用的数据挖掘技术主要有决策树、神经网络、关联规则、聚类分析、统计学、模糊集和粗糙集等。
(1)决策树。决策树技术是用于数据挖掘中分类和预测的主要技术。决策树学习算法是对分类问题进行深入分析的一种方法。决策树能从一个或多个预测变量中, 针对类别因变量的选项, 预测出个例的趋势变化关系等, 也可以由结果来反推原因。就其方法论而言, 决策树分析与判别分析、聚类分析、非参数统计以及非线性估计所提供的功能是一样的。但是决策树的设置形式灵活, 使得其更具吸引力。常用决策树算法有: CLS算法, ID3算法, C4.5算法, CART算法, SLIQ 算法, SPR INT算法, PUBLIC算法等。
(2)神经网络。在数据挖掘中, 对神经网络的改进重点是为了解决两个问题: 知识表达和知识获取。知识表达是使神经网络中抽象的权值代表一定的知识。知识获取是给定一个已经训练好的神经网络,从中提取显式的知识。神经网络是一个不依赖于模型的自适应函数估计器, 其突出的优点是能够并行处理, 并具有学习能力、适应能力和很强的容错能力, 可以建构非线性的模型, 模型的准确度高, 具有良好的推广性, 对于未知的输入也可以得到正确的输出, 可以接受不同种类的变量作为输入, 可应用的领域相当广泛, 模型建构能力强, 具有模糊推论能力, 允许输出输入变量具有模糊性。
(3)关联规则。关联规则用来揭示数据与数据之间未知的相互依赖关系, 他的任务就是: 给定一个事务数据库, 在基于支持度/置信度框架中, 发现数据与项目之间大量有趣的相互联系, 生成所有的支持度和可信度分别高于用户给定的最小支持度和最小可信度的关联规则。优秀的关联规则算法主要有: Apriori算法, AprioriTid算法, FP-Tree算法。
(4)聚类分析。聚类分析是由样本分组, 寻找到多维数据点中的差异之处。它与判别分析不同在于: 聚类分析的分类方式并不需要预先设定一个指针变量, 它属于一种非参数分析方法, 所以并没有非常严谨的数理依据, 也无需假设总体为正态分布。聚类分析的一般过程是: 搜集数据, 转换成相似矩阵。聚类分析可以作为一个获得数据分布情况, 观察每个类的特征和对特定类进一步分析的独立工具。通过聚类, 能够识别密集和稀疏的区域, 发现全局的分布模式, 以及数据属性之间的相互关系等。主要的聚类分析方法有: 距离的方法, 基于层次的方法, 基于密度的方法, 基于网络的方法。
(5)统计学习。统计学习理论是一种专门研究小样本情况下机器学习规律的理论。机器学习的研究目标是以观测数据为基础, 通过对数据的研究得出目前尚不能通过原理分析得到的规律。然后利用这些规律去分析现实中的客观现象, 对未来的数据进行预测。现实应用中存在着大量人类尚无法准确认识但却可以进行观测的事物, 因此机器学习在从现在科学技术到社会、经济等各领域都有着十分重要的应用。
贝叶斯学习: 贝叶斯推理是在知道新的信息后修正数据集概论分布的基本工具, 用来处理数据挖掘中的分类问题。
回归分析: 回归分析方法是研究相关关系的一种有力的数学工具。它是建立在对客观事物大量试验和观察的基础上, 用来寻找隐藏在看上去不确定的现象中的统计规律的数理统计方法。
(6)模糊集和粗糙集: 模糊集用隶属函数来刻画对象对集合属于程度的连续的过渡性, 即元素从属于集合到不属于集合的渐变过程。模糊集是一种边界不分明的集合, 一个元素对于模糊集合来说, 它可以既属于该集合又不属于该集合, 边界是模糊的。粗糙集理论是一种刻画不完整性和不确定性的数学工具, 能有效地分析和处理不精确、不完整等各种不完备的信息, 并从中发现隐含的知识, 揭示潜在的规律。粗糙集和遗传算法相结合、和模糊集相结合, 以及和神经网络相结合来用于数据挖掘。
三、数据挖掘在医学中的应用
(一)疾病诊断:正确的诊断对于指导病人的用药及康复显然是重要的,在临床中有些疾病错综复杂,数据挖掘的有关分类分析可以应用于疾病的诊断。粗糙集理论、神经网络、模糊逻辑分析在疾病诊断方面是有效的。例如Roshawrma Scales等基于人工神经网络理论及模糊逻辑开发的对心血管疾病诊断的工具对疾病诊断的正确率达到92%。采用数据挖掘可以通过对患者资料数据库中大量历史数据的处理,挖掘出有价值的诊断规则,根据患者的年龄、性别、辅助检查结果、生理生化指标等给出诊断结论,并进一步排除人为因素干扰。
(二)疾病相关因素分析:在病案信息库中有大量的关于病人的病情和病人的个人信息,包括年龄、性别、居住地、职业、生活情况等,对数据库中的信息进行关联规则分析可以发现有意义的关系及模式,某种疾病的相关发病危险因素分析可以指导患者如何预防该疾病。
(三)疾病预测:确定某些疾病的发展模式,根据病人的病史预测病情的发展趋势,从而有针对性的预防疾病的发生。应用粗糙集理论根据以往病例归纳出诊断规则,用来预测新的疾病的发生,现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%。
(四)在医疗质量管理中的应用:医疗质量管理的核心是数据、标准、计划以及治疗的质量,这些质量可以用不同的指数来衡量。数据挖掘可以发现新的关于数据、标准、计划以及治疗的质量指数的假说并检验这些指数是否有效。利用数据挖掘技术构建数据模型、选用适当算法就可以实现预测医院利润、未来一些时间段内哪些药品使用频率最高,哪些疾病发病率最高等和人们的现实生活密切相关的一系列问题。
(五)在医学图像中的应用:医学领域中越来越多地应用图像作为疾病诊断的工具,如SPECT、CT、MRI、PET等,数据挖掘可以应用于医学图像的分析。Sacha等成功地运用基于贝叶斯分类的数据挖掘模式对心肌SPECT图像进行分类诊断。
(六)在药物开发中的应用:一些新药的开发研究,其重要关键的是对先导化合物的发掘。一般有2种途径:随机筛选、意外发现和定向发掘。采用数据挖掘技术建立的药物开发系统可以用来寻找和药效学相关的化学物质基础,确定药效基团,进一步指导新药的研究,缩短开发周期,降低开发费用。
(七)在遗传学方面的应用:用序列模式分析DNA序列,不同基因在疾病的不同阶段可能起着不同的作用。若能找到疾病发展的不同阶段遗传因素序列,就有可能开发针对疾病不同阶段的治疗药物,取得有效的治疗效果。
四、展望
目前数据挖掘技术在医学领域的应用还处于起步阶段,但随着该方法的日益普及,其必将在医学领域得到更加广泛的应用。医学数据挖掘是计算机技术、人工智能、统计学与现代医学相融合的产物,是面向整个医学信息库提取知识的过程,是医疗服务整体决策科学化的重要组成成分;而由于医学数据挖掘对象的广泛性、算法要求高效性、提取知识以及决策建议要求更高的准确性加之现有医学信息库相对于数据挖掘的要求还存在不完备性;这些都需要计算机、数学、统计学以及广大医疗工作者的多方协作,从而在信息的多方融合、算法的高效性、获取知识准确性等关键技术上得以更大的突破。
五、结语
医学领域的数据构成一个复杂的数据库,包括电子病历、医学影像、病理参数、化验结果等。随着数据挖掘技术的广泛应用和各种挖掘算法的不断改进完善,结合生物医学信息自身的特殊性和复杂性,处理好挖掘过程中的关键技术,使数据挖掘技术在处理生物医学资料中的功能日益强大。数据挖掘技术在生物医学研究、医疗卫生管理与决策中的应用范围也会越来越广,并带来可观的经济和社会效益。
参考文献:
[1]康晓东.基于数据仓库的数据挖掘技术[M].北京:机械工业出版社,2004.
[2]张世红,徐国桓,刘会霞,龚文涛.数据挖掘在医学上的应用[J]. 医学情报工作.2004-6
[3]沈小庆,盛炳义,方曙等. 数据挖掘技术及其在医院药学中的应用[ J ] . 中国医院管理,2005,25(12).
生物学和医学的区别是二者的含义不同。生物学是研究生物的结构、功能、发生和发展规律的科学,是自然科学的一个部分,目的在于阐明和控制生命活动,改造自然,为农业、工业和医学等实践服务。医学是通过科学或技术的手段处理生命的各种疾病或病变的一种学科,促进病患恢复健康的一种专业。它是生物学的应用学科,分基础医学、临床医学。
二者的学科分类不同。生物学的分类主要分为形态学、生理学、遗传学、胚胎学、生态学、生物物理学、生物数学以及分子生物学等。医学可分为现代医学和传统医学等多种医学体系,不同地区和民族都有相应的一些医学体系,宗旨和目的不相同。研究领域大方向包括基础医学、临床医学、法医学、检验医学、预防医学、保健医学、康复医学等。
(来源:文章屋网 )
关键词:医学图像;配准;非刚性
中图分类号:TP317.4文献标识码:A文章编号:1672-7800(2012)012-0175-02
0引言
医学图像配准是指在源图像和目标图像之间寻求某种变换,使得两幅图像上的特征点达到空间上的一致,是医学图像信息融合和知识发现的关键技术,在疾病诊断、临床治疗、手术、疗效评估等方面得到了广泛应用。对于人体四肢骨骼图像和头部这样不易变形部位的图像的配准,采用刚性配准技术。刚性配准中,图像内部任意两点间的距离变换前后保持不变,因而采取缩放、平移和旋转等线性变换方法即能进行配准。
但是对于胸部、腹部这样容易变形部位的图像的配准,对于不同个体之间图像的配准或者发生图像变形的情况,在图像变换前后,内部任意两点间的距离不再保持不变,需要采用非刚性配准技术。作为一个正在进行的研究领域,同刚性配准相比,非刚性配准技术还不成熟,大多数算法仍在扩展和评估阶段,计算效率和稳定性还有待提高。
1非刚性配准分类
可以根据配准的对象和配准的机理对医学图像非刚性配准进行分类。利用前一种分类法可以将医学图像非刚性配准分为:
(1)同一对象,同一模式,不同时间。待配准图像来源于同一个体、同一成像设备,但获取时间不同。主要目的是利用图像间的差异,对感兴趣区域或目标的生长、形变等过程进行观察,从而监视疾病的发展或对治疗效果进行评估。
(2)同一对象,不同模式。待配准图像来源于同一个体、不同成像设备。主要目的是利用不同图像之间的信息互补优势,比如将解剖信息和功能信息相结合,提供更加全面、可靠的综合信息。这类配准在疾病诊断和临床治疗中最为常见,是医学图像非刚性配准的重点研究方向。
(3)不同对象,同一模式。待配准图像来源于不同个体,但是来自于同一成像设备。其主要目的一是建立统计图谱和基于图谱进行自动医学图像分割;二是将受试者图像和正常人相同部位图像进行对比以确定前者是否正常,或者在已经异常的情况下与一些疾病的典型图像进行对比,以确定受试者是否患有某种疾病。
(4)不同对象,不同模式。待配准图像来源于不同个体,不同成像设备。此种情况下,即使是同一类型图像,例如CT或者MR,因为来自不同的成像设备,若对其进行配准,前述的同一模式下的配准方法也不再适用,需要研究新的配准方法。
根据图像配准的机理,可以将医学图像非刚性配准分为基于几何特征对应的配准和基于体素相似性配准两类。基于几何特征对应的配准,就是将待配准图像中的点、线、曲面、区域等几何图元相互对应。基于体素相似性的配准,就是利用图像全体像素信息,对不同影像的灰度统计特征进行全局最优化,从而实现图像配准。
2非刚性配准方法
对于非刚性配准,人们已经提出了基于空间变换和基于伪物理模型两大类方法。前者采用图像的空间变换拟合图像的变形,后者基于图像间的差异由物理变形引起的假设,从而构造能够拟合这种变形的物理模型。
2.1基于空间变换的方法
第一种方法是多项式函数法,该法能够模拟全局形状改变,不能调整局部形状改变,高多项式次数可导致赝像。
第二种方法是样条法,该法基于可以在源图像和目标图像当中能够确定一组对应点(控制点),在变换中将目标图像中的控制点映射到源图像中的对应点。薄板样条是目前使用较多的一种样条配准法,其优点是可以将诸如刚性约束、方向约束等附加的约束加入模型以提高配准精度,缺点是因为控制点对变换具有全局影响,导致难以模拟局部变形。B-样条函数能够模拟自由变形,可以用来控制局部变形。
第三种是基函数法,使用一组基函数的线性组合来描述变形场,常用傅立叶基函数或小波基函数的线性组合。
2.2基于伪物理模型的方法
第一种是弹性模型,原理是将源图像到目标图像的形变过程建模为一个类似于拉伸橡皮这样的弹性材料的物理过程。该过程由两种力——外力和内力来控制,外力是外界作用于弹性体的力,内力是抵消使弹性体从平衡形状变形的力,当内力和外力达到平衡时变形过程结束。在弹性模型中,因为压力导致变形能量随变形强度按比例增加,不能模拟高度的局部变形,但适用于组织变形较小的情形。
第二种是粘性流体模型,原理是将源图像建模为粘性流体,该流体在内力作用下拟合目标图像。内力在图像随时间变形的过程中得到释放,完全释放后流体停止流动。粘性流体模型能够模拟高度局部化的变形,也能够模拟大变形,原则上可以实现任何复杂的变形。
第三种是光流场模型。光流的概念最早出现在计算机视觉中,是为了补偿时序图像的两幅连续帧之间物体和视点的相对运动。目前最著名的是Demons算法,它把图像配准问题看作物理学中的扩散问题,把固定图像中对象的边界看作半可渗透的薄膜,把浮动图像看作可形变的网格。网格在位于薄膜中的受动器作用下进行扩散。算法判断出浮动图像上各个像素点的运动方法,通过对各个像素点的移动来实现医学图像非刚性配准。
3医学图像非刚性配准研究热点
3.1多模态非刚性配准
利用不同模态图像之间的信息互补优势,比如将解剖图像和功能图像进行配准后,进行图像信息融合,可以为诊断和治疗提供更加全面、可靠的信息。这是医学图像非刚性配准的重点研究方向,也是热点方向。目前,多模态配准已有所发展,但是仅限于两种模态的配准,如MR和CT图像的配准,将来有可能发展到三种以上模态图像的配准,还有许多问题有待解决。
3.2高效的全局优化算法
可以将医学图像配准的过程归结为一个多参数优化问题。传统的局部优化算法容易陷入局部极值,从而导致配准误差。解决此问题的方法一是将局部优化算法与多分辨率策略或者多尺度方法相结合;二是使用全局优化算法。使用全局优化算法如粒子群、遗传算法、模拟退火算法能够取得有效的医学图像配准,但是需要非常大的时间代价,这就需要研究高效的全局优化算法。
3.3并行、分布式环境下的算法模型
利用并行计算、分布式等计算技术可以提高全局优化算法的执行速度,但是需要研究这些计算环境下的算法模型。
4结语
同刚性配准相比,非刚性医学图像配准还不成熟。大多已提出的非刚性配准算法仍在扩充和评估阶段,其效率与稳定性有待提高。因此,医学图像非刚性配准是一个非常活跃的研究领域,值得进一步深入研究。
参考文献:
[1]李雄飞,张存利.医学图像配准技术进展[J].计算机科学,2010(7).
[2]王海南,郝重阳.非刚性医学图像配准研究综述[J].计算机工程与应用,2005(11).
[3]徐克虎,王小香.非刚性医学图像配准与融合[J].模式识别与人工智能,2003(4).
[4]隋美蓉,胡俊峰.医学图像配准方法及其应用[J].临床医学工程,2009(5).
[5]于颖,聂生东.医学图像配准技术及其研究进展[J].中国医学物理杂志,2009(6).
Research on Non-rigid Medical Image Registration
关键词:医学信息工程;课程体系;新兴产业
中图分类号:G642.3 文献标识码:A 文章编号:1002-4107(2017)07-0039-03
地方高校转型改革以国务院《关于加快发展现代职业教育的决定》(国发〔2014〕19号)文件为指针,把创新创业教育融入职业技术人才培养全过程各环节,实施协同育人行动计划,推动人才培养联盟建设。以适应技术进步和生产方式变革、产业升级发展的需要,深化“校企”合作、“产教”融合,培养高素质的技术技能人才。在这个背景前提下,作为七大新兴产业之一的信息产业,高校如何应对信息产业发展培养专业人才,开发信息产业,促进科技成果转化或产业化,达成产教实质性融合,我们认为制定以人才培养方案为核心的课程体系是基础,也是核心。其能从培养方案的多方面体现出“以人为本、质量领先,以生为本、追求卓越”的人才质量理念[1]。
一、医学信息工程专业发展现状
我国医学信息工程专业本科教育,起步较晚,只有10多年的历史发展记载。2003年,四川大学以重点学科为依托,在全国首次开办医学信息工程本科专业教育。2010年,教育部批准为第七批国家级特色专业建设点,隶属于新一代信息产业。2014年8月统计,全国现有24所院校开办本科专业教育。其中,一分类是大学牌头15所,学院9所;二分类是综合院校13所、中医药院校7所、其他类院校4所。从表述专业培养目标方面来看,许多院校认为是培养具有良好政治思想素质、人文社科素养,具备医学、电子技术、计算机与信息科学的基础知识,具有从事医学信息技术采集、传输、处理、分析、存储等能力,能在医院信息化、公共卫生工程、医药电子商务等领域从事研究、设计、开发、管理及维护的应用型高级专门人才。而自发稿前,笔者到中国知网搜索文献,关于专业课程研究论文报道仅有6篇,表明医学信息工程学科建设与教学研究还是处于初期,权威性报道少见。
二、新兴产业视野下医学信息工程专业人才
培养的重新定位
工程教育是当代中国技术经济发展的基石。而新兴代的信息产业则是振兴技术经济的重业结构调整的关键时期,党的“十八”明确提出要加快发展现代职业教育,推动高等教育内涵式发展,建设中国特色的现代职业教育体系,打通从中职、专科、本科到研究生上升通道,引导一批普通本科高校向应用技术型高校转型,为产业结构调整服务,化解大学生结构性就业难问题。明确专业规模体系,在当前高校转型发展中,质量与规模、质量与资源的矛盾在“校企合作”、“产教融合”的路径选择上与有效实施的矛盾仍然突出,要勃兴新一代信息产业,必须做好推动人才培养联盟建设工程、制定发展战略。
专业目标定位是专业建设标准及其学科发展的出发点与归宿,是制约教学内涵的核心因素,也是国家、社会、行业及高校内部评估的基本标准。作为新兴产业视野下的专业人才培养,应借鉴高校转型发展机遇,做好应用技术型本科专业人才“定位”,以适应国家、社会行业经济建设的需要,突出人才规格与行业岗位的对接,应用技术与教学服务相融,体现地方性、行业性、产业性需要及其特征。
从直观角度上看目标的解析,目标是被“活化”的思想、文化、身心等方面的素质要求与融合点。在知识结构方面涵盖专业学科的知识、技术、技能的规定性。教育者应学会在目标内涵中找发展机会与优势,在专业特色中找差异性,在共性标准中,找教育教学发展规律,这就是活化目标的主体路径,也是定好本科专业人才培养目标的基本点。
三、医学信息工程本科专业课程体系构建的思路
课程体系如何改革,涉及两方面。一是改革方向问题;二是如何定位,是规范、标准问题。也就是说,课程体系改革以定方向为先,以定位为本,明确课程理性,以人才培养战略为课程体系的主导定位,以专业目标定位为课程体系的主体定位。面对信息产业,体现专业人才培养目标与要求,笔者从四个维度进行描述性研究。
一维在国家教育宏观维度上,要求符合中华人民共和国教育部高教育司新增的本科教学目录中列出医学信息工程专业人才培养总体规范要求,奠定了本科专业的方向标。
二维在社会行业中观角度上,要求设计应有企业或行业专家参与,满足企业和社会所需的专业人才的培养目标等,借鉴国内高校医学信息工程专业课体系的建设经验,力求解决好知识、能力与素质,基础与专业,理论与实践主干学科以及相关学科的关系[2]。同时吸纳陈娜[3]、蔡晓鸿[4]、张颖[5]、肖晓霞等人[6]研究的课程结构的理论与实践成果。主干核心课程与信息工程软件开发与应用平台课程,突出应用技术型本科与应用技术产业型本科教育相结合。最终以突出传统应用型人才培养与现代职业技术技能型人才培养差异化特点,倾注于应用技术本科专业转型实质性改革。
医学影像成像原理是医学影像技术专业开设的一门专业基础课程,其教学目标是使学生理解医学影像成像的过程、基本原理及方法,了解医学影像设备的临床应用,为后续的专业课程学习奠定成像理论和图像质量评价的基础。在对传统的课程内容、教材及教学实施认真分析的基础上,发现其存在着不适应现代职业教育发展要求的一些问题,主要体现在下述4个方面。
1 课程目标与工作岗位要求脱节
医学影像成像原理的课程目标是使学生掌握医学影像设备的成像原理、基本概念及结构组成,而通过问卷调研及专家访谈,对比分析医学影像成像原理课程目标和医院放射科工作岗位职责及要求,发现传统课程的目标与放射技术人员的岗位要求不符,与全国卫生职业资格要求存在一定偏差;部分课程内容陈旧,与各级、各类医院的诊疗工作实际情况不符。医院对放射科工作人员的要求是能够正确按照成像流程完成患者的检查操作,并进行图像质量评价及处理。然而,在课程目标的教学效果评价方面,理论考核仅仅从知识的学习方面反映学生的培养情况,在评价内容和形式上与放射技师职业资格考试脱节。
2 课程内容与课程特点不符
医学影像成像原理课程内容除基本的医学图像概念以外,更多以设备成像流程、图像处理流程、图像质量评价流程等形式进行体现,在知识体系上过程性知识比重较大。课程的传统教学内容以陈述性知识为框架,按照成像设备的类型分类对基本概念、成像方法、分类特点、影响因素及评价指标进行理论知识的阐述,知识结构缺乏与实际工作的连贯性,凸显课程内容与课程特点不符。随着医学影像设备在科学技术和智能化方向的不断革新,仪器的功能和操作流程发生了明显的变化,因此课程的知识体系更应以过程性知识架构进行改革和完善。
3 教学模式与专业核心课程衔接不足
医学技术系的专业核心课程《医学影像技术》、《医学影像诊断》、《医学影像信息技术》和《医学影像设备》按照工作过程导向理念进行了课程改革,以岗位工作为任务模版,开发实训项目,开展理论实践一体的教学模式。然而,作为以上专业核心课程的基础课程,《医学影像成像原理》的教学模式以理论讲授为主,陈述性知识框架、实验观摩的能力培养模式与工作导向模式差别较大,所学课程与专业核心课程的应用不能很好地衔接,并不能较好地满足专业核心课程的基础需要。
4 实训平台与能力培养目标脱节
卫生职业学院医学影像实训室配置进口数字X线摄影系统2台、CT设备1台、多普勒超声诊断仪5台、国产数字胃肠机1台和PACS系统1套,先进的数字化实训条件为医学影像专业技能的培养奠定了基础。但是,医学影像成像原理在知识学习和能力培养方面,仅以观摩和讲解的方式开展教学,不能充分利用现有实训平台的优势,且能力培养效果欠佳。
关键字:数据挖掘;HIS;特点;任务
1 引言
近年来,随着电子信息技术的迅速发展,医院信息系统(HIS)、数字医疗设备和医药企事业单位信息系统的广泛应用,各医疗卫生单位计算机中的数据容量不断膨胀。数据库技术的发展在不断地解决海量数据的存储和数据检索的效率问题,但无法改变“数据爆炸但只是贫乏”的现象,如何充分应用这些宝贵的医学数据资源来为疾病的诊断和治疗提供科学的决策,促进医学研究,已成为人们关注的焦点。
数据挖掘(Data Mining,DM)是一个近些年才发展起来的信息处理技术,它是从大量数据中提取出可信的、新颖的、有效的并最终能被人理解的信息模式处理过程,它涉及数据库、人工智能、统计学、模式识别、可视化技术、并行计算等众多领域知识。医学数据挖掘是一门涉及面广.技术难度大的新兴交叉学科,它需要从事智能信息处理、计算机、应用数学的科研人员与医务工作者通力合作,将数据挖掘技术应用到医学数据库中,用以发现其中的医学诊断规则和模式,从而辅助医生进行疾病诊断,帮助管理者发现并创造新的管理方法和手段。
2 数据挖掘的定义
从商用角度来看,数据挖掘可定义为一种类深层次的数据分析方法,是按照企业既定业务目标,对大量企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,为企业决策提供真正有价值的信息,并进而获取利润的一种模型化的先进方法。
从技术角度来看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又有潜在有用的信息和知识的过程。
由定义可看出,数据挖掘与传统数据分析(如查询、报表、联机应用分析等)的本质区别在于数据挖掘是在没有明确假设的前提下挖掘信息、发现知识,换言之,数据挖掘所得到的信息应当具有预知未知、有效和可实用3个特征。
3 数据挖掘技术在医院信息系统中的应用
数据挖掘技术的产生时间不长,但其在商业、产业、电信等领域的应用已相当广泛,并取得了客观的经济和社会效益。由于医疗卫生系统本身具有的复杂和时变的特性,导致数据挖掘技术在医疗卫生领域的应用尚处于起步阶段。但医学技术作为一门验证性的科学,因此在该领域的数据挖掘具有较强的实用价值和广阔的应用前景。
3.1 医院信息系统的数据特点
医院信息系统中包含了医疗过程和医患活动的全部数据资源,既有临床医疗信息,又有医院管理的相关信息。这些信息反映了医学的独特性。
3.1.1 多态性
医院信息系统中的数据包括纯数据(如体征参数、检验结果等)、影像(如CT、B超等)、信号(如ECG、EEG等)、文字(如患者检查检验结果、病历记录等)等,因此其具有模式的多态性,这也是其区别于其他领域的显著特征。
3.1.2 不完整性
医院信息系统中的数据是在对患者进行诊疗的过程中收集的,是以对患者进行诊断并最终治愈为目的,并非以研究为目的,再加之人为因素也可导致数据记录的偏差和缺失,因此搜集的数据具有疾病信息的客观不完整性和描述疾病的主观不完整性。
3.1.3 冗余性
医院信息系统是一个特殊的系统,系统中的某些数据关乎患者的健康安全,如发药信息、检查检验结果数据等,为进行数据校验,保证数据的正确性,系统会保存大量重复的、甚至是相互矛盾的数据记录。
3.1.4 隐私性
医院信息系统中保存了患者的所有信息,包括身份信息、诊疗信息、费用信息等,也不可避免地会涉及到患者的隐私,一旦这些隐私信息被暴露,并对患者的日常生活造成侵扰,就会涉及到较多的伦理、法律等问题。
3.2 医院信息系统数据挖掘的步骤
数据挖掘可分为预处理和挖掘分析两个阶段如图l所示。由于医学数据具有前文所介绍诸多特性,需要对带挖掘数据进行筛选、清洗、匿名化、标识转换等操作,因此通常需要花费较多时间,通常约占总时间的60%。
3.3 医院信息系统数据挖掘的任务
3.3.1 分类
分类是指根据一个可预测属性将事例分为多个类别,是最常见的数据挖掘任务之一。医生根据望闻切诊以及辅助检查对患者进行疾病诊断,实际就是一个疾病分类的过程,即根据患者的疾病特征,将其划分为某个疾病或某类疾病。典型的分类算法有决策树、神经网络和贝叶斯算法。
3.3.2 聚类
聚类也称细分,是基于一组特定的属性对事例进行分组的数据挖掘方法。利用聚类分析工具分析患者的疾病诊断数据,进行探索性的数据分析,生成聚类结果,并考察其意义。例如,对糖尿病患者,可按照年龄、性别、体重和血压指数等产生聚类模式,得到糖尿病患者典型分型,在临床上具有重要意义。
3.3.3 关联
关联规则最典型的商用案例就是一家连锁店通过数据挖掘发现了尿片与啤酒之间有着惊人的联系。使用关联规则,可以发现临床数据间的关联性,通过病历系统中患者的诊断信息、用药情况等,可以挖掘出某种疾病的常规用药方案,并形成临床路径。
3.3.4 预测
预测是医学数据挖掘最重要的―项任务。预测技术使用的是时间序列数据集,即有时序关系的一组观察值,而患者的诊疗过程所记录的数据也是具备时序性的,应用预测技术对这些诊疗数据进行分析,可预测患者疾病的发展趋势甚至预后情况,并根据预测结果对诊疗方案进行修正,以获得最佳的疗效和预后。
关键词:数据挖掘;知识;医学;智能
中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)30-7365-02
随着信息技术的飞速发展,计算机信息管理系统在各类医疗、研究机构得到了广泛的应用。大量关于病人治疗的临床信息,医院管理信息等信息的不断累积使得医学数据库迅速膨胀。传统数据库查询检索策略及统计学分析方法只能从大量的数据中获取一些表层信息,而无法发现数据之间内在关联及隐藏知识。利用数据挖掘技术从海量的医学信息中提取有价值的知识和规则,以智能的方法来处理和分析科学实验或临床研究数据,从而更好地为医院的决策管理、医疗和科研服务已成为一个非常重要的研究课题[1]。
1 数据挖掘的基本概念
目前有关数据挖掘的定义有很多,比较公认的一种是:数据挖掘(Data Mining)是从大量的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们未知的、潜在的有用信息和知识。这些信息可表示为概念、规则、规律和模式等。广义的数据挖掘对象包括数据库、数据仓库、文件系统、Web信息及各种形式的数据集。数据挖掘所要处理的问题,就是在庞大的数据集中寻找出有价值的隐藏事件加以分析,并以一定的置信度对未来进行预测,将这些有意义的信息归纳成结构模式,用来对决策形成参考。
2 医学数据挖掘特点
1)处理数据的规模十分巨大。由于医疗工作自身的特点――如病情观察的不可间断、各种医疗检查结果的纷繁复杂,医学数据库是一个涉及面广、信息量大的海量信息库,医学数据挖掘经常会面对尺度为GB甚至TB数量级的数据库。
2)挖掘对象是复杂的、各种类型的数据。医学数据库中含有各种不同来源,不同性质的数据,包括纯数据记录(如患者生命体征的各项参数、化验结果)、文字(如患者的病历记录、诊断结果)、信号(如肌电、脑电信号)、图像(如B超、CT检测结果),以及音频和视频等形式的健康传媒类信息[2]。
3)挖掘结果是潜在的、未知的信息,这些信息有助于预测未来趋势及行为,为医疗活动做出前瞻性的科学决策。对医学数据进行挖掘的一个主要目的是预测疾病发作,将数据挖掘技术应用于医学领域可以对正常人的各项体征数据和生物数据进行各种分析对比,挖掘出相关关系,对某些疾病的前兆特征分析,以便能预防或及时救治,挽救患者生命。
3 医学数据挖掘方法
数据挖掘的任务有两个,即描述和预测。与之对应,数据挖掘方法分为描述型方法和预测型方法。前者是通过判别数据之间的关系或模式,探索被分析数据的隐藏属性;后者利用从历史数据中发现的已知结果,推断或预测未知的可能值。在实际应用中,需根据对象的性质及要解决的具体问题,采用不同的数据挖掘方法。
1)决策树法。决策树方法是一种通过逼近离散值目标函数的方法,利用信息增益原理,将数据库中具有最大信息量的属性字段作为决策树一个节点,节点的每一个后继分支对应于该属性的一个可能值,在每个分支子集中重复建立树的下层节点和分支。决策树方法主要应用于医学数据挖掘中的分类过程――通过现有医疗数据,对患者的病症信息进行分类,分析患有该类疾病病人的共同特征以及可能患有的疾病类型,找出真正原因,从而做出针对该类疾病的最佳治疗方案。利用决策树法可大大增加诊断的准确度,提高诊断效率。
2)神经网络(neural networks)。人工神经网络是一种模仿生物神经网络的,通过训练来学习的非线性预测模型,具有很强的容错性、自组织性和鲁棒性。神经网络以人工神经元为基本运算单元的,能够对大量复杂的数据进行分析,并完成及其复杂的模式抽取及趋势分析,在医学数据挖掘中具有非常广泛的应用。利用神经网络可动态监测病人的麻醉深度,从而控制物的使用剂量;采用贝叶斯(Bayesian)神经网络结构能够找出服用抗精神病药物与心肌炎和心肌病发作的关系;还可以运用组合神经网络可对危及生命的心率失常进行归类等。
3)关联规则。关联规则描述和分析了数据库中一组对象之间某种共生现象,反映了事物之间存在的关联性――如两者“同时发生”或“两者存在因果关系”等。在医学领域同样存在关联现象,若某种疾病同时表现出若干种症状,则这几种症状与该疾病之间存在着关联性,且症状之间也呈现某种关联[3]。关联规则分析可为疾病的鉴别诊断提供参考依据。有研究者利用关联规则分析法对糖尿病数据库进行多维数据分析,以期望发现长期血糖浓度过高与并发症之间的关联;还有研究者对37000例肾病患者的症状(包括临床检验和检测)进行了追踪观察,监测尿蛋白水平、肾小球过滤率以及患者贫血状况,结果发现以上三种生理指标中的任何一项异常都伴随着心脏病发病率的上升[4]。
4)聚类分析。聚类分析是根据所选样本间关联的标准将其划分为几个组,同组内的样本具有较高的相似度,不同组的则相异。聚类分析方法适用于对孤立点的检测及用于探讨样本间的内部关系,从而对样本结构做出合理的评价。有研究者[5]利用聚类方法分析流行病学因素对肺癌患者临床医学状况的影响。首先从SEER的数据库中选取21758例肺癌病例,每一例数据包含23个流行病学特征属性和22个临床临床医学状态特征属性,继而根据流行病学特征属性的相似程度将病例数据划分成20类,比较各类别之间的临床医学状态特征属性的差异,在此基础上还可更进一步分析各类流行病学因素对肺癌患者临床医学状况的不同影响。
3 结束语
医学数据挖掘是信息网络技术、人工智能、模式识别、统计学等学科与医疗科学相结合的产物,对提高医疗服务质量和医院科研、管理水平发挥着重要作用,具有极其广阔的应用前景。医学数据挖掘面向整个医学数据库或医学信息集合提供知识和决策,因此挖掘对象是涉及面广、数据量大、且包含着各种类型数据的海量信息库;在挖掘方法中,决策树法、人工神经网络、关联规则、聚类分析等方法显示出了独特的优势,已经在医学信息处理和疾病诊疗方面得到了应用。随着理论研究的深入和进一步的实践探索,数据挖掘技术将在临床、科研、教学以及医院决策管理等方面发挥巨大的作用。
参考文献:
[1] 王华,江启成,胡学钢.数据挖掘在医学上的应用[J].安徽医药,2008.12(8):746-748.
[2] 袁占花,李祥生.数据挖掘在医学信息系统中的应用[J].电脑开发与应用,2009,22(7):55-57.
[3] 龚著琳,陈瑛,苏懿,等.数据挖掘在生物医学数据分析中的应用[J].上海交通大学学报:医学版,2010,30(11).
现今,生物医学图像在医疗诊断中起着不可低估的重作用。核磁共振(MagneticResonance,简称MR)、计算机X射断层扫描(ComputedTomography,简称CT)、超声波(Ultrasound)以及其他的成像技术等,都是无侵害性的器官体外成像的力手段。这些技术丰富了正常的以及病状的解剖知识,同它也成为了诊断和治疗体系重要的组成部分。随着医学图像在数量和大小上的增加,越来越有必要用计算机处理并分析这些图像。有一种算法用于找出解剖构和其它感兴趣的区域,这种算法叫做图像分割算法(imagsegmentationalgorithms)。图像分割是由图像处理到图像分的关键步骤[1],它在大量的生物医学图像的应用起着至关重要的作用,比如:解剖结构的研究、诊断等。在承担自然科学基金项目的过程中,为研究分割算法在医学图像中的应用,我们对过去国内外二十多年里医学图像分割算法的发展和现今广泛使用的分割法进行了较详细的调研,感到国内在这方面的文献和研究还比较少。为进一步推动图像分割在生物医学工程中的应用,本文结合我们目前的研究结果,对医学分割算法、特别是其应用做了介绍。
2现今广泛使用的生物医学图像分割方法
利用“区域间不连续性”和“区域内相似性”两个准则,分割算法可分为的“基于边界的算法”和“基于区域的算法”。另外,根据分割过程中“判断和决定是否可独立地和同时地做出”的处理策略,分割算法又可分为“并行算法”和“串行算法”。所以分割算法可根据这两个分成四类[1]。那么对于生物医学图像,也有相应的四类分割法。图像、成像方式以及其它因素。比如:对脑组织分割的要求就不同于对肝脏的要求,MR图像有异于超声图像。更进一步的情况,成像中的人为和不可抗拒的天然因素(例如噪声和物体的运动等)也会在很大程度上影响后继的分割。所以,至今没有一种适用于任何医学图像的通用的分割技术。我们总结了现今国内外广泛使用的生物医学图像分割方法。重点放在对方法的介绍上,和使用时会面临的具体问题上。方法的详细数学推导超出了本文的范围,读者可以查阅参考文献。虽然这些方法是分开描述的,但在实际应用中,很多复合法也用于解决各种不同的实际分割问题。我们将这些方法分为四类6种:1)并行区域法:阈值法。2)串行区域法:区域生长法。3)结合特定理论工具的方法:①模式识别法(分类器法,聚类法);②人工神经网络法;③可变模型法。4)其他方法。
2.1阈值法
阈值分割法是将灰度图像变为二值图像以达到分割目的的方法[4],它是一种PR(并行区域)法。阈值法的过程是决定一个灰度值,用以区分不同的类,这个灰度值就叫做“阈值”。把灰度值大于阈值的所有像素归为一类,小于阈值的所有像素归为另一类。阈值法是一种简单但是非常有效的方法,特别是不同物体或结构之间的有很大的强度对比时,能够得到很好的效果。此分割法通常是交互式的。因为阈值法能够实现实时操作,所以它更能够建立在用户视觉估计的基础上。阈值法一般可以作为一系列图像处理过程的第一步。它的主要局限是,最简单形式的阈值法只能产生二值图像来区分两个不同的类。另外,它只考虑像素本身的值[1],一般都不考虑图像的空间特性,这样就对噪声很敏感。针对它的不足,有许多经典阈值法的更新算法被提了出来[5]。
2.2区域生长法
区域生长法是根据预先定义的标准,提取图像中相连接的区域的方法[4]。这个标准可以是灰度信息,也可以是图像的边界,或者是两者的联合。在此法的最简单形式中,先人工给出一个种子点,然后提取出和种子具有相同灰度值的所有像素。和阈值法一样,区域生长法一般不单独使用,而是放在一系列处理过程中,特别用它来描绘诸如肿瘤和伤口等小而且简单的结构。它主要的缺陷是,每一个需要提取的区域都必须人工给出一个种子点,这样有多个区域就必须给出相应的种子个数。此法对噪声也很敏感,会造成孔状甚至是根本不连续的区域。相反的,局部且大量的影响还会使本来分开的区域连接起来。为减轻这些缺点,产生了诸如模糊分类的区域增长法[6]和其他方法。
2.3模式识别法
2.3.1分类器法
分类器法是一种统计模式识别的方法[7],用以区分从已知标记的图像数据衍生而来的特征空间。灰度直方图,就是最常见最典型的一维特征空间的例子。因为分类器法需要用已知的人工分割结果作为训练样本、对分类器进行训练后才能自动分割新的数据,所以它是有监督的模式识别方法。它的训练方法有很多种,其中,最简单的一种是“非参数最近邻”分类器。它将像素或者体素划分在与其灰度值最接近的那一类中。而参数分类器中,使用得最多的是贝叶斯分类器(Bayesclassifier)[5]。标准的分类器要求被分割的结构具有明显的定量特征。因为如果训练样本数据能够被标记,分类器就能够将这些可以明显区分的标记转化为新的数据而不需要反复迭代。所以相对于阈值法,在区分多区域图像时它有较高的计算效率。它的缺点是是,需要人工交互方式获得训练数据。另一方面,对于大量的生物图像使用相同的训练样本,会因为没有考虑不同物体的解剖特性和物理特性而导致不准确的结果。
2.3.2聚类法
聚类法的基本原理和分类器法大体是相同的,不同点在于它不需要训练样本数据。所以它是无监督的模式识别方法。为了弥补没有训练数据这一点,聚类方法反复做两件工作:分割图像和刻画每个类的特征,从而使用已有的数据训练自身以达到分割的目的。最常用的聚类方法是模糊C-均值算法[1],它通过对目标函数的迭代优化实现集合划分,并且可以表示出各个像素属于不同类别的程度。虽然聚类算法不需要训练样本数据,但是它需要一个初始的分割。和分类器方法一样,聚类法同样不考虑空间建模,所以对噪声和非同质的灰度很敏感。然而,这一缺陷却加快了计算速度。
2.4人工神经网络法
人工神经网络法是使用大量的平行的神经网络达到对图像分割的目的[8]。这些网络由模拟生物学习机理的节点或者元素组成,网络中的每个节点能够执行最基本的运算。通过调整节点之间的权值可以达到网络对生物机理的学习。比如,用它实现图像的边缘检测[8]。文献[9]局部兴奋全局抑制振荡网络(LEGION,LocallyExcitatoryGloballyInhibitoryOscillatorNetwork)就是一种基于人类视觉特性的人工神经网络方法。LEGION是一个由张弛振子构成的网络,每个振子皆由一个兴奋单元x和一个抑制单元y组成(图2)。分割结果见图3。可以看出,与LEGION分割所得图像相比,单阈值法所得图像区域单一,细节较差,一些细小结构未能表现出来。将LEGION这种算法完善,自适应设置神经网络中的参数,并且将它应用在彩色图像上。使用神经网络法的时候,因为网络中有许多相互连接,所以空间信息就能很容易包涵在分类过程中。虽然神经网络法具有平行继承性,但是它的处理过程和标准的串行计算机很类似,这样就降低了它计算方面的潜在优势。
2.5可变模型法
可变模型法是基于模型的、使用闭合参数曲线或曲面描绘边界的分割方法[3]。它的最初思想来源于物理概念:为了描绘出物体的边界,首先设置一个离真实曲线或曲面不远的初始曲面或曲线,在外力和内力的作用下,推动这个曲面或曲线移动,最后在图像能量最低处停下来。因为曲线或曲面的移动类似于蛇,所以这个模型又叫做Snake模型,曲线或曲面叫做Snake。在图像轮廓处灰度变化率(即梯度)最大,定义此处能量最小,那么Snake停下的地方就是真实边界。由于1988年Kass首次提出的经典Snake的外力场捕获区很小[3],这就使得初始化和进入凹陷区很困难。为此,科学家们多次改进这一算法。其中,1998年Hopkins大学的ChenyangXu和JerryL.Prince[12]用梯度矢量流代替经典外力场,这就是有名的GVF理论(GradientVectorFlow)。它很好地解决了经典Snake中的初始化问题和凹陷区问题。[12]是采用GVFSnake对左心室核磁共振图像的腔体分割。
2.6其它方法
还有一些生物图像的分割方法,比如:微分算子的边缘检测[1],Hough变换[4],它们均属PB法(并行边界)的范畴;用样条进行曲线拟合,它是一种SB法(串行边界)。因为生物医学图像中软组织的物理和解剖特性,以上的方法一般不单独使用,而是融入其它的方法里。此外,基于信息论[9]和基于小波分析[1]的分割技术也逐渐被应用在生物图像中。
关键词 医学检验仪器;临床检验仪器学;自主学习能力
中图分类号:G642.4 文献标识码:B
文章编号:1671-489X(2014)06-0074-02
1 引言
虽然医学是一种古老的学术,但实际上即便是时至今日,同数理化等精确科学相比,临床医学还常被认为是一种实用技艺而非严密科学。随着电子技术和计算机技术的飞速发展,并不断向医学检验仪器深入渗透,医学检验仪器的性能得到巨大提高,医学检验仪器成为现代医学重要的临床诊断手段,对疾病诊断、病情监测、健康评价等方面起着重要作用。
在医学检验仪器性能不断提高,各类高灵敏度、多功能、智能化的检验仪器不断出现和广泛应用的同时,对相关工作人员的检验仪器知识、技术、技能要求也越来越高,培养相关专业各层次学生熟练掌握和使用各类医学检验仪器,成为医学检验仪器课程的重要任务。
2 医学检验仪器课程特点
医学检验仪器课程教学目的 现代医学检验仪器功能越来越为复杂,智能化程度越来越高,灵敏度越来越强,并有大量新仪器新设备不断涌现并投入实践应用。与此同时,现代医学对医学检验仪器的依赖性也越来越强,这对相关专业工作者的要求也越来越高。医学检验仪器课程的设置,其目的是为了培养和提高相关专业学生熟练掌握、运用现代医学检验仪器的能力,以使其能更好地运用医学检验仪器,为疾病诊断和治疗提供支撑。需要让各相关专业学生及工作人员掌握医学检验仪器的性能、使用方法、工作原理、故障排除、计算技术,并提高其医学检验仪器的综合应用能力,提高临床医学检验仪器实践能力。
医学检验仪器特点分析 目前多数医学检验仪器都应用于组织、细胞的存在、组成、结构、特性方面的检验,需要高精度的定性或定量分析结果,任何一点儿误差都可能造成诊断偏差,带来错误的诊断和评价。医学检验仪器课程是一门以提高学生医学检验仪器应用实践能力为目的的课程。现代医学检验仪器通常集光、电、机于一体,其种类繁多、功能复杂,自动化、智能化不断增强,结构也越来越复杂,包括如分离分析检验、光谱分析检验、目视检验、细胞及分子生物学检验以及临床常规检验和非常规检验仪器。医学检验仪器通常涉及光学、电子、计算机、材料、传感器、生物化学、放射等多种技术领域,除了需要了解仪器设备的使用方法外,还需要不断掌握新材料、新器件、新的检验分析方法。
3 医学检验仪器课程教学策略
强化基础理论知识教学 基础理论知识是医学检验仪器课程教学的重要内容。医学检验仪器课程要求学生掌握常见检验仪器设备的原理、结构、性能评估、使用方法、保养维护、常见故障排除方法等,这些理论知识是正确使用医学检验仪器的重要基础,掌握基础理论知识对实践操作极为重要。包括:光谱分析仪的结构,分光光度计质量评价方法;荧光分析仪的基本结构,荧光分析的原理,荧光发生的机理;光学显微镜的基本光学参数、基本结构、各部分的作用,各种显微镜的工作原理;离心机的基本构造、工作原理,离心力的计算方法,主要技术参数和性能指标;尿液分析仪的基本结构、基本原理,尿液分析仪的分类、功能应用;自动生化分析仪的基本结构、评价方法、参数设定、仪器分类、性能指标;电化学分析原理,电解质及血气分析仪的基本结构、常见分类及功能应用;血液分析仪中血细胞分析仪、血液凝固分析仪、血液流变学分析仪的工作原理、基本结构、功能实现、性能指标、参数设置;微生物快速检测仪的自动鉴定,药敏系统工作原理、性能评价、功能实现;等等。
随着科学技术的迅速发展,越来越多的新技术、新方法、新设备不断应用于医学检验中,如果仅局限于教材内容,势必会造成基础知识的相对滞后,无法适应科学的发展。因此,在基础理论知识的教学中,不能仅局限于教材,还应当充分利用各种资料,如报纸、期刊、网络等媒体,对教学内容进行拓展,扩大学生的知识面,以促使其能更快更好地适应今后的临床医学检验工作。同时,只是枯燥的仪器知识教学会极为枯燥,在教学中还应当尽量应用实物和多媒体进行演示,让学生能直观、清晰地了解仪器设备的构造、性能、原理等知识。
重视实践,提高学生动手操作能力 医学检验仪器课程具有极强的实践性和技能性,提高学生的动手操作能力非常重要。医学检验仪器课程的实践内容,可以分为课程实验、课间见习、毕业实习、毕业设计、社会实践等五个方面,在教学中应当综合运用这五个途径,为学生提供充足的实践操作训练机会,让学生通过实践操作训练掌握各类医学检验仪器的使用方法、评价手段、计算策略、日常维护保养以及常见故障的排除,明晰各类医学检验仪器应用中需要注意的问题。这样一方面能巩固学生的基础理论知识,为学生今后的工作和研究打下坚实的基础;另一方面能提高学生的动手操作能力,帮助学生更快地适应工作实践需要。
应当适当增加实验课,根据不同仪器的特点、需要掌握的内容、学院仪器设备现状,精心设计实验操作课程,让每一名学生都能熟练掌握常用医学检验仪器的使用与维护。实验操作可按仪器设备、仪器特点、设备现状,采用分组、个人、见习等多种方法进行。例如:分析天平、显微镜、酸度计、血细胞计数器、电泳仪等可以采用个人实践操作的方式;设备维护保养、常见故障排除、大型仪器可采用分组实践操作的方式;一些贵重的、稀有的、自动化程度高不适合学生亲自操作实验的检验仪器,如自动生化分析仪、气相色谱仪、血气酸碱分析仪等可以先通过多媒体演示,再组织学生以见习的方式进行。
促进思维,提高学生自主学习能力 医学检验仪器课程的教学内容是局限于已有的仪器设备,即便教会了学生再多仪器设备的基本知识、基本构造,让学生掌握了再多的仪器操作、维护方法,如果学生不会变通,只会照本宣科地应用,依然很难满足未来工作的需要,因此提高学生的自我学习能力极为重要。在医学检验仪器课程中,应当重视学生思维能力、理解能力的培养,提升学生的自我学习能力,让学生在今后面对新仪器、新功能、新方法时能很快地学会并应用于实践中。要提高学生的自我学习能力,教师应当将自己放到引导地位,更多地对学生的学习进行引导和指导,而不只是简单地将知识灌输给学生。如在教学中,可以让学生自主分析仪器设备的结构和工作原理;在实践操作中可以适当提供一些非课程内容的仪器让学生探索操作方法、维护方法;在基础理论知识的教学中可以让学生自己通过各种途径,搜集相关资料进行学习。只有提高了学生的自主学习能力,才能使其在今后的实践工作中更好地适应工作的需要和技术的发展。
参考文献
[1]乔忠,蒋长顺.医学检验专业进行检验仪器技能培养的探索[J].安徽卫生职业技术学院学报,2008(4):96-97.
[2]陈文成,农乐根,韦叶生,等.《临床检验仪器学》教学平台建设初探[J].南方医学教育,2013(2):20-22.