HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 生物信息学服务

生物信息学服务

时间:2023-08-21 17:23:07

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇生物信息学服务,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

生物信息学服务

第1篇

关键词:生物信息学;计算机科学;教学模式

生物信息学是生物学、数学和计算机科学交叉所形成的一门新兴学科,它主要运用信息科学和计算机手段,通过数据分析和处理,揭示海量数据间的内在联系和生物学含义,进而提炼有用的生物学知识。当前,生物信息学教学还没有完善的教学模式,如何在高校进行生物信息学教学亟需探索。

进入21世纪,生物学的重点和潜在的突破点已经由20世纪的试验分析和数据积累,转移到数据分析及其指导下的试验验证上来。生物信息学作为一门学科被广泛研究的根本原因,在于它所提供的研究工具对生物学发展至关重要,因此成为生命科学研究型人才必须掌握的现代知识。今天的实验生物学家,只有利用计算生物学的成果,才能跳出实验技师的框架,做出真正创新的研究。现在基因组信息学和后基因组信息学资源已经成了地球上全人类的共同财富。如何获取和利用基因组和后基因组学提供的大量信息,如何具备享用全人类共有资源的能力,成了当今世纪生命科学学生必须掌握的基本技术和知识以及必须具有的初步能力。在信息学院中开设生物信息学应该有别于生物专业和物理、化学专业的学生,侧重于与计算机科学关系紧密的内容进行讲解。本文主要讨论在信息学专业中开设生物信息学的内容、教学方法[1]。

1国内生物信息学研究与教学现状

作为计算机科学和数学应用于分子生物学而形成的交叉学科,生物信息学已经成为基因组研究中强有力的必不可少的研究手段。在我国,生物信息学随着人类基因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。许多科研单位已经开始或准备开始从事这方面的研究工作。北京大学研究建立起一个EMBL的镜像数据库,并提供数据检索服务[2-3]。

在复旦大学遗传学研究所,为克隆新基因而建立的一整套生物信息系统也已初具规模。中科院上海生化所、生物物理等在结构生物学和基因预测研究方面也有相当的基础,中科院计算所作为我国计算机科学的顶尖机构,利用自身优势,也开始在生物信息方面投入大量的人力物力,从事相关的研究。另外清华大学生物学院与信息学院、中国科技大学生物学院、浙江大学也有相应的研究小组。有许多学校还增设了生物信息学的本科专业与二级学科的硕士、博士点。

在当前生物学信息呈爆炸性增长的背景下,急需要对这些数据进行分析、归类与重组,发现新线索、新现象和新规律,用以指导实验工作的设计。生物信息学的建设显得尤为紧迫,关键在于:1)加强相关学科之间的协作;2)加速培养一批在数学、物理、信息科学、计算机科学以及分子生物学方面均有造诣的跨学科青年人才。这样的人才在当前全世界都十分缺乏。我们如能充分发挥现有人才和单位的潜力,优势互补,相互协作,边做课题边培养研究生,进而在某些有条件的大学里设置生物信息学专业,就能迎接21世纪的挑战。

2生物信息学教学模式初探

2.1在计算机专业中开设生物信息学课程的几个问题

缺乏合格的生物信息学师资,教师队伍的整体数量和质量与我国生物信息学教育快速发展的规模极不相称。

对生物信息学专业人才培养的认识各异,造成课程设置不合理。事实上,国外在生物信息学专业的课程设置方面也缺乏成功的经验,围绕“哪些是生物信息学专业的必修课程”和“生物信息学专业的研究生需要哪些背景”之类的问题争议颇多。

生物信息学教育与其他专业的合作还有待加强。尽管生物信息学是一门新兴学科,但与其他专业之间存在许多联系。如生物信息学与统计学的关系极为密切,如能整合统计学教学资源,势必提升生物信息学教育水平。

在教学方法上,生物信息学仍沿用“以教师为中心,以课堂为中心,以教材为中心”的传统教学模式。重视系统知识的传授和授课计划的完成,忽视学生能力和素质的培养。理论教学与实验教学缺乏有机整合,实验教学只是以验证理论为目的,内容单一,无创新点,忽视了学生实际操作能力和创新能力的培养。

教学中还缺乏适合的理论和实验教材。近来,尽管生物信息学书籍呈快速增长的趋势,已不下百种,其中授权影印国外原版教科书和翻译书籍仍占主导地位。

2.2生物信息学教学模式的改进方法

借鉴其他学科成功的教学模式,结合生物信息学课程特点,采用新的教学模式势在必行。

2.2.1知识定位为中心,引入探究式教学方法

生物信息学既有较深的理论性知识,又有较强的实验技能,它涉及生物学、计算机技术、数学等方面的知识。因此,学校需针对培养目标与要求,制订具有专业特色的教学大纲,在教学内容上作合理的调整与优化。其教学过程大致分为三个步骤:(1)确立教学目标。目标可以由教师设定,可以是学生感兴趣的内容。(2)进行分组。对一个崭新事物的认识单靠个人的力量往往难以全面兼顾,需要集体的智慧,由小组成员围绕指定的问题进行讨论,最后由指导教师进行总结,对同学的讨论情况做出点评,并提出改进意见。

2.2.2整合理论教学与实验教学,提高学生综合素质

通过生物数据库的使用,提高学生处理生物信息的能力。由于大型服务器和计算机的参与,分子生物学对生物分子(主要是核酸和蛋白质)研究工作的效率大大提高。到目前为止,生物学数据库总数已达500个以上,在DNA序列方面有GenBank、EMBL和DDBJ等;在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等;在蛋白质和其他生物大分子的结构方面有PDB等;在蛋白质结构分类方面有SCOP和CATH等,各数据库均通过Internet提供多种形式的数据检索服务。

2.2.3充分利用现代化教育技术,采用启发式教学

目前,高等院校在教室内配备的多媒体投影播放系统促进了多媒体教学的广泛应用。生物信息学采用多媒体教学是与学科特点相适应,有利于提高教学效果。作为生物信息学教学的基本模式,多媒体教学使讲解的内容更加直观形象,尤其是对于具体数据库的介绍以及数据库检索、数据库相似性搜索、序列分析和蛋白质结构预测等内容涉及的具体方法和工具的讲解,可以激发学生的学习兴趣,加深学生对知识的理解和掌握,提高学生实践能力。同时,由于生物信息学依赖于网络资源和互联网上的分析工具和软件,教室内的多媒体计算机连接到互联网,可以极大地提高教学效果。但在实际教学中发现,多媒体教室也有局限性,学生主要以听为主,不能及时实践,教师讲解与学生实践相脱节,如果将生物信息学课程安排在计算机房内进行,并采用多媒体电子教室的教学方式,就可以解决上述问题。在教学中采用启发式教学,可为学生建立教学情景,学生通过与教师、同学的协商讨论、参与操作,能够发现知识、理解知识并掌握知识[4-5]。

3结语

现代生物技术将在21世纪迅速发展,为了跟上科学技术发展的步伐,在计算机专业中开设生物信息学课程是非常有必要的,也是有远见的。

随着生物信息学的快速发展,各种生物学数据信息,呈爆炸性增长,而计算机是有史以来最好的数据处理平台。因此,在计算机专业中开设生物信息学课程是非常迫切的。通过生物信息学课程的学习,使学生提高了生物信息处理的基本能力,对培养复合型、交叉型人才,提高毕业生综合素质进而提高就业竞争力具有积极意义。

参考文献:

[1] 萧浪涛. 现代生物信息学及其主要研究领域[J]. 湖南农业大学学报,2000(6):409.

[2] 王哲. 生物信息学概论[M]. 西安:西安第四军医大学出版社,2002:1-30.

[3] 郝柏林,张淑誉. 生物信息学手册[M]. 上海:上海科学技术出版社,2000:12-22.

[4] 赵国屏. 生物信息学[M]. 北京:北京科学出版社,2002:21-55.

[5] 何红波,姜鹏. 在计算机专业中开设生物信息学课程的几个问题[J]. 长沙铁道学院报:社会科学版,2003(3):114-116.

Establishment and Practice of Setting up Bioinformatics Curriculum in Computer Specialty

YU Xiao, SUN Hong-min

(Northeast Agricultural University, Harbin 150030, China)

第2篇

关键词: 生物信息学 农业研究领域 应用

“生物信息学”是英文单词“bioinformatics”的中文译名,其概念是1956年在美国田纳西州gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家collins f博士在华盛顿隆重宣布人类基因组计划(human genome project,hgp)的所有目标全部实现[3]。这标志着后基因组时代(post genome era,pge)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。

1.生物信息学在农业模式植物研究领域中的应用

1997年5月美国启动国家植物基因组计划(npgi),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(hgp)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(ta)集合数据库tigr、植物核酸序列数据库plantgdb、研究玉米遗传学和基因组学的mazegdb数据库、研究草类和水稻的gramene数据库、研究马铃薯的pomamo数据库,等等。

2.生物信息学在种质资源保存研究领域中的应用

种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至dna片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、aflp、ssap、rbip和snp等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。

3.生物信息学在农药设计开发研究领域中的应用

传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。itzstein等设计出两种具有与唾液酸酶结合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。tang sy等学者研制出新一代抗aids药物saquinavir[12]。pungpo等已经设计出几种新型高效的抗hiv-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。

现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。

4.生物学信息学在作物遗传育种研究领域中的应用

随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物

中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。

5.生物信息学在生态环境平衡研究领域中的应用

在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 dna,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。

美国农业研究中心(ars) 的农药特性信息数据库(ppd) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(toyohashi university of technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(iris) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。

6.生物信息学在食品安全研究领域中的应用

食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用pcr法[19]、rt-pcr法、荧光rt-pcr法、多重pcr[20]和多重荧光定量pcr等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、elisa法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。

转基因食品检测是通过设计特异性的引物对食品样品的dna提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。

生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。

参考文献:

[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.

[2]郑国清,张瑞玲.生物信息学的形成与发展[j].河南农业科学,2002,(11):4-7.

[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.

[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[j].国外科技动态,2001,1:24-25.

[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.

[6]卢新雄.植物种质资源库的设计与建设要求[j].植物学通报,2006,23,(1):119-125.

[7]guy d,noel e,mik

e a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.

[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.

[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.

[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.

[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.

[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.

[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.

[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[j].计算机与应用化学,1999,16,(5):400.

[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.

[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[j].微生物学杂志,2008,28,(4):93-97.

[17]程树培,严峻,郝春博等.环境生物技术信息学进展[j].环境污染治理技术与设备,2002,3,(11):92-94.

[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[j].微生物学杂志,2009,29,(6):61-64.

[19]赵玉玲,张天生,张巧艳.pcr 法快速检测肉食品污染沙门菌的实验研究[j].微生物学杂志,2010,30,(3):103-105.

[20]徐义刚,崔丽春,李苏龙等.多重pcr方法快速检测4种主要致腹泻性大肠埃希菌[j].微生物学杂志,2010,30,(3) :25-29.

[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[j].微生物学杂志,2010,30,(6):71-75

[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[j].重庆医学,2010,(22):3128-3131.

[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[j].微生物学杂志,2009,29,(4):79-83.

[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[j].微生物学杂志,2009,29,(5):67-72.

[25]苏晨曦,潘迎捷,赵勇等.疏水网格滤膜技术检测食源性致病菌的研究进展[j].微生物学杂志,2010,30,(6):76-81.

第3篇

【关键词】云计算 生物信息学

下一代测序技术的应用产生了大量的测序数据,这对生物学特别是生物信息学在数据的存储、管理和搜索等方面带来了新的挑战。一直以来计算机存储和处理数据能力的增长速度都快于生物数据的增长速度,但2003年后,由于测序技术的发展使得测序成本大幅度下降,产生了大量的生物数据,计算机的存储和计算能力逐渐无法满足大数据的需求。这促进了云计算的运用和发展,它使得用户可以根据需求租用硬件设备和软件,避免了对硬件设备的大量资金投入和管理投入。

1 云计算定义

“云”是一个通过虚拟技术把云端计算机或是服务器连接在一起的服务网络。存储和分析数据都由“云”端的服务器或是计算机完成。中国云计算专家刘鹏给出如下定义:“云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算力、存储空间和信息服务。”

按照资源的共享水平,云计算的服务模式分为三种,基础架构即服务(Infrastructure as a service), 平台即服务(Platform as a service)和软件即服务(Software as a service)。

IaaS(Infrastructure as a service) Service:基础架构即服务。它整合了基础设施如虚拟主机、存储设备、网络设备等资源成为一个服务平台提供给用户使用。IaaS位于网络的底层,向用户提供按需分配、按需付费的计算设备和存储设备。

PaaS(Platform as a service)提供服务平台,用户掌控运作应用程序的环境,可以在平台上应用,测试和开发软件。

SaaS(Software as a service)即在服务平台上提供软件供用户使用,用户只使用软件,不掌握操作系统、硬件等网络基础架构。用户不必自己安装软件,只需要浏览器连接到公共的服务平台即可。供应商会按照用户的要求安装所需的软件,并负责软件的升级和维护。

云计算的主要优点:

(1)把用户从安装和测试软件的工作中解脱出来。云计算平台可以按照用户的需求提供软件及硬件的服务。用户不需要考虑网络下面复杂的硬件架构,仅仅需要关注计算和分析就可以。

(2)按需租用计算资源可以让用户支付更少的费用。在云计算平台上,用户在最初时可以租用少量的机器,以后随着需求的增加或减少相应的增加或减少租用的机器。用户所付的费用就是实际租用机器的费用。

(3)云计算方便研究人员之间的数据共享和分析。不同研究者在本地服务器上安装的软件版本可能不同,所以共享数据和软件很困难。云计算可以使登录同一个平台的用户共享操作系统和所有的软件数据,保证了软件的版本同步更新。

2 云计算在生物信息中的应用

我们把云计算在生物信息学中的应用按IaaS, PaaS和SaaS三个方面分别介绍。

2.1 IaaS

用户租用云计算上的虚拟主机可以自己控制计算、存储等硬件设备,建立需要的计算环境。并且大量的生物信息学工具可以打包为虚拟镜像用于租用的云计算的虚拟主机上,可以很方便的进行多种数据分析。如CloVR提供的一个包含预配置和自动的生物信息学流程的虚拟主机,可以运行在本地的计算机上也可以运行在云计算平台上。这个虚拟机以Ubuntu和BioLinux为基础,安装了Grid Engine和Hadoop作为作业调度,Ergatis作为工作流系统,还有很多开源的生物信息学软件,如BLAST、16S rRNA等。用户也可以开发自己的软件运行在虚拟机上。Bioconductor是一个开源的关于R语言的生物信息学库,提供了一系列的软件包用于微阵列数据分析。用户可以下载Bioconductor提供的镜像安装到租用的云计算平台上。

2.2 PaaS

Galaxy Cloudman和Eoulsan可以看做PaaS。Galaxy整合了一系列的简单易用的工具,提供一个简易的网页用来分析数据。Galaxy Cloudman把Galaxy的软件工具打包成一个镜像,可以在AWS(Amazon Web Service)上应用。用户可以将其他安装在Galaxy平台上的软件安装到自己的云计算平台上,甚至可以在Galaxy Cloudman上定义插件。通过添加额外的工具,可以扩展默认函数并测试和使用。从这个意义上说,Galaxy Cloudman可以看做PaaS。

Eoulsan整合了很多下一代基因数据分析工具,如BWA,Bowtie,SOAP2,GSNAP,edgeR,和DEdeq于一个框架内,同时,它也支持用户自己开发的插件用于数据分析。

2.3 SaaS

很多传统的生物信息学工具如BLAST、UCSC Genome Browser仅仅用一个浏览器就可以登录到服务器使用相应的服务,它们也可以称为SaaS。这些服务一般由软件工具的开发者提供,伸缩性很差。我们主要介绍应用于云计算平台上可以伸缩的生物信息学工具。

短序列(读段)匹配是指将测序得到短序列匹配到参考基因组上,这是许多测序数据分析的第一步,如SNP识别和基因表达谱分析。CloudBurst,CloudAligner,SEAL和Crossbow都是应用于云计算基于MapReduce的软件,可以匹配数以百万计的序列。Schatz用”seed-and-extend”算法开发的CloudBurst可以确定错误匹配的数目。CloudBurst模仿了RMAP的算法,但速度提高了30倍。但是CloudBurst不支持fastq文件,并且不能处理重亚硫酸盐测序和(双)末端测序产生的数据。CloudAligner弥补了这个缺点,并且比CloudBurst快35%到80%。SEAL整合了BWA,在序列匹配时可以去除重复的序列,这对SNP识别和以后分析很有用。应用MapReduce的Crossbow整合了Bowtie和SOAPsnp,可以在几个小时内匹配数以十亿计的序列。

差异表达分析可以用来寻找不同样本中表达有明显差别的基因,而RNA测序(RNA-seq)用来量化样本中的基因表达水平。Myrna是一个云计算平台上计算大规模RNA测序的软件。它整合了序列匹配、归一化、聚类分析和统计模型,直接输出不同样本的基因表达水平和不同表达水平的基因。然而,Myrna 最大的缺陷是不能正确地将短序列匹配到外显子拼接位点上。但FX弥补了这个缺点。FX用改进的匹配函数分析RNA数据,以RPKM或是BPKM的格式输出不同基因的表达水平。

3 云计算面临的问题

云计算提供了强大的计算能力,但云计算自身的特点也使它的发展面临了一些困难和制约。云计算在生物信息学上的应用尚处于初期阶段,尽管已经出现了一定数量的生物信息学工具,但仍有很多的分析无法完成,很多的工具还需升级或者开发。云计算上数据的隐私性和安全性也是用户需要考虑的方面。特别是一些生物数据涉及到病人的隐私,但很多国家还没有保护这种数据隐私的法律。云计算服务提供商需要制定一些规则来保护用户的数据。

4 对应用云计算的建议

对于将要使用云计算的用户,需要考虑以下三个方面:数据规模、安全隐私和费用。

数据规模及安全隐私:首先要考虑你的数据规模是否超过了本地计算机的处理能力。现在本地的个人电脑可以处理数千兆的数据,服务器一次可以处理数百G的数据。如果用户熟悉并行计算的技术,可以处理数TB的数据。但如果你的数据更大并且不精通并行计算,本地计算机和服务器就很难处理了,就可以考虑云计算。用户如果要向云计算平台上传输数据,需要考虑数据的安全性和隐私性。比如涉及病人的隐私是否会泄露,云计算服务提供商是否可以保证数据的安全等。

费用:云计算的费用一般是按照使用的计算资源的多少和使用时间的长短计算的。使用云计算前应该评估其使用费用。用户应该考虑所有阶段的费用,如数据传输、保存、分析等。

目前,云计算和生物信息学都处在快速发展当中,云计算在生物信息学中的应用也越来越广泛和深入。特别是生物数据的大规模增涨,生物学家必须从大量的数据当中分辨出有用的信息。这就需要强大的存储能力和计算分析能力,云计算可以很好的解决这个问题。 云计算和生物信息学的结合将极大的促进生物学的发展。

参考文献

[1]刘鹏主编.云计算(第二版)[M].北京:电子工业出版社,2011(05).

[2]Schatz MC,CloudBurst:Highly sensitive read mapping with MapReduce,Bioinformatics

25(11):1363-1369,2009.

[3]Nguyen T,ShiW,Ruden D,CloudAligner:A fast and full-featured mapreduce based tool.for sequence mapping, BMC Res Notes 4:171,2011.

[4]Hong D,Rhie A,Park SS,Lee J,Ju YS,Kim S,Yu SB,Bleazard T,Park HS,Rhee H,Chong H,Yang KS,Lee YS,Kim IH,Lee JS,Kim JI,Seo JS,FX:An RNA-seq analysis tool on the cloud, Bioinformatics 28(5):721-723,2012.

作者简介

李渊(1985-),男,河南省延津县人。硕士研究生学历。现为苏州大学系统生物学研究中心助理实验师。主要研究方向为实验技术。

第4篇

>> 结合生物信息学的中药组分结构研究思路 癌症研究的生物信息学资源 青蒿琥酯和青蒿素抗肿瘤作用及其机制的初步研究 生物信息学方法在蛋白质―蛋白质相互作用研究中的应用 生物信息学在生物学研究领域的应用 生物信息学研究生教学初探 生物信息学中的机器学习 生物信息学中的序列比对算法 生物信息学基础 整合生物信息学 姜黄素抗肿瘤作用分子生物学机制的研究进展 小鼠肝质膜蛋白质的生物信息学研究 生物信息学在农学研究领域中的应用 计算机算法在生物信息学中的应用研究 青蒿素及其衍生物抗肿瘤机制 离散数学在生物信息学专业本科教学的开展研究 有关数据仓库技术在生物信息学中应用的研究 CM和PBL教学在生物信息学中结合的应用研究和深入探索 优化生物信息学专业中高等数学教学成效的路径研究 生物背景学生的《生物信息学》课程教学思考与探索 常见问题解答 当前所在位置:)获得。Polysearch系统是一种基于网络的文本挖掘工具,用于识别分析医学文献中医学实体,如人类疾病基因、蛋白质、药物、代谢产物、代谢途径、器官、组织、细胞之间的关系等方面的综合信息[4]。在Polysearch系统中查询到的青蒿作用靶点蛋白,通过人工阅读抽提语句的方式进行校正。

1.2肿瘤作用靶点数据肿瘤相关基因或蛋白质通过应用Polysearch系统和OMIM数据库获得。OMIM 数据库(online mendelian inheritance in man),是一个大型、持续更新的关于人类基因和遗传紊乱的数据库系统,包括文本信息和相关参考信息、序列纪录、图谱等其他数据,具有及时、准确、全面和实用等特点[12]。

2方法

2.1关键靶点蛋白寻找应用Cytoscape3.2.1软件[13],对上述信息进行可视化构网后,以Merge工具融合药物相关靶点和疾病相关靶点,寻找青蒿与肿瘤共同作用的关键靶点蛋白。

2.2蛋白质相互作用网络构建以青蒿与肿瘤相关的关键靶蛋白名为检索词,从分子相互作用数据库 BioGRID (http://thebiogridorg/)中进行检索,并用Agilent Literature Search(http: //appscytoscapeorg/apps /agilentliteraturesearch) 文本挖掘工具从文献中获得它们之间相互作用蛋白质的信息。

2.3中心性子网络分析中心性子网络是根据网络中心度进行计算得到的网络中可能起关键性作用的部分网络。用上述信息构建的关键蛋白相互作用网络,以Cytoscape3.2.1软件进行可视化。并采用MODE模块进行中心性网络分析,获得中心性子网络。为注释各显著性高的生物学功能,采用Cytoscape3.2.1软件中的BiNGO工具,进行GO(基因本位论,简称“GO”是一个广泛用于基因功能分类的系统[14])的聚类分析,评估存在于各GO注释中的蛋白质群[15],以P反应蛋白质群生物学功能的显著性。

3结果

3.1青蒿与肿瘤共同作用的关键蛋白根据文本挖掘结果,应用Cytoscape3.2.1软件对青蒿与肿瘤共同作用的关键蛋白进行可视化构网,结果见图1。可以看出青蒿与肿瘤存在相互关联作用,青蒿与肿瘤共同作用的关键蛋白有8个。

肿瘤坏死因子(TNF),TNF 按其结构分2型(TNFα和TNFβ),其中由活化的巨噬细胞、单核细胞和T细胞产生的能使肿瘤坏死的因子称为TNFα(旧称TNF),由活化的T 细胞和NK 细胞产生的淋巴毒素称为TNFβ[16]。目前研究较多的是TNFα,TNFβ所知有限。TNFα具有调节机体的免疫功

能和导致肿瘤细胞坏死的特性,TNFα与各种疾病的关系紧密,在许多疾病的研究中都将其作为检测的重要指标[17]。

血管内皮生长因子(VEGF),是血管内皮细胞特异性的肝素结合生长因子,具有促血管生成活性的功能,可在体内诱导血管新生,通过与其特异性受体的结合发挥生理功能[18]。肿瘤的生长依赖肿瘤新生血管的形成,VEGF及其受体介导的肿瘤血管新生,在肿瘤的生长和转移中具有重要作用[19]。

磷脂酰肌醇3激酶(PI3K),PI3K存在于体内各种细胞中,是脂激酶的一种,能募集和激活下游的靶物质而启动一系列信号联级反应,在细胞的有丝分裂、细胞存活与分化、细胞骨架的构型与重塑、血管生成、葡萄糖转运调控以及囊胞的运输中起着重要的作用[20]。PI3K与乳腺癌、卵巢癌、前列腺癌等肿瘤的发生发展密切相关,已成为潜在的癌症治疗靶标[21]。

乙醛脱氢酶1(ALDH1),是乙醛脱氢酶家族1.7种同工酶之一,也是正常干细胞与肿瘤干细胞(CSC)的通用标记物之一,在多种组织(特别是肿瘤组织)中起重要作用,能催化细胞内多种醛的氧化[22]。ALDH1突变可引起细胞的生长、分化障碍,从而导致肿瘤的发生。最初被发现与恶性肿瘤对环磷酰胺类药物的耐药有关,近期研究显示其是多种恶性肿瘤干细胞的表面标志[23]。

Bcl2,是细胞凋亡通路的关键蛋白分子,包括抑制和促进细胞凋亡2类功能相反的基因。抗凋亡Bcl2家族蛋白和促凋亡Bcl2蛋白家族成员之间的失平衡是肿瘤发生的重要原因和标志性事件[24]。在人类许多肿瘤组织中,Bcl2基因的表达水平通常会发生改变,且与肿瘤细胞的多药耐药有关[25]。

MicroRNA (miRNA),是长度为1.9~2.5个核苷酸的非编码小分子RNA,具有调节细胞增殖、分化和凋亡的功能,参与调控个体发育、细胞凋亡、增殖及分化等生命活动[26]。miRNA可通过调控其靶标基因参与的信号通路,影响肿瘤的发生和发展,参与心脏疾病、血管疾病、肿瘤及神经系统等疾病的发生和发展过程[27]。

p3.8,丝裂原活化蛋白激酶(MAPK)是细胞内主要的信号转导系统之一,p3.8属于MAPK家族中的重要一类。p3.8介导的信号转导通路不仅在炎症、应激反应中具有重要作用,还参与细胞的存活、分化和凋亡等过程[28]。p3.8MAPK信号通路的激活参与了不同刺激所致的一些常见的恶性肿瘤细胞凋亡的启动,例如胃癌、肺癌、乳腺癌以及白血病[29]。

CASP3,细胞内凋亡通路中下游效应分子,能酶切多聚ADP 核糖聚合酶(PARP1),在主要凋亡途径中CASP3被激活而剪切细胞内底物, 从而导致DNA裂解促进细胞凋亡[30]。CASP3 基因多态与肺癌、卵巢癌、非霍奇金淋巴瘤发病密切相关[31]。

3.2关键蛋白相互作用网络应用Agilent Literature Search对青蒿和种类相互作用关键靶蛋白的信息进行分析,构建关键蛋白相互作用网络,结果见图2。图中节点表示靶点蛋白,边表示相互作用。其中有961个节点,3.3.5条边。对相互作用蛋白网络进行的GO分析结果显示,图中蛋白涉及的主要生物学过程为细胞周期、翻译后蛋白修饰、细胞周期调控、蛋白泛素化和细胞器组织的调控共5个方面,显著性检验结果见表1。

3.3中心性子网络分析应用MODE模块对图3进行中心性网络分析,得到中心性子网络见图3。图中有2.1.3个节点,93条边。对中心性网络进行GO分析结果显示,关键作用可能与甘油三酯代谢过程调控、甘油三酯代谢过程正调控、甘油三酯分解代谢过程中的正调控、出芽细胞顶芽生长调节、有丝分裂细胞周期的负调控、减数分裂细胞周期的负调控、转录因子活性的正调控等7个生物学过程有关,显著性检验结果见表2。由此可推断,青蒿可能是通过调节细胞脂质代谢过程,分解大量脂质,释放能量,降低细胞分裂速度,加速细胞凋亡等产生抗肿瘤作用。

4讨论

本研究利用文本挖掘方法探讨青蒿与肿瘤之间的关联关系,发现青蒿与肿瘤具有8个共同的蛋白靶点,包括TNF,VEGF,PI3K,ALDH1,Bcl2,MicroRNA,p3.8,CASP3。通过生物信息学方法对蛋白靶点的相互作用进行深入分析,结果显示,青蒿和肿瘤之间存在一定关系,并且是通过甘油三酯代谢过程调控、甘油三酯代谢过程正调控、甘油三酯分解代谢过程中的正调控、出芽细胞顶芽生长调节、有丝分裂细胞周期的负调控、减数分裂细胞周期的负调控、转录因子活性的正调控等7个生物学过程产生作用。由此可推断,青蒿可能是通过调节细胞脂质代谢过程,分解大量脂质,释放能量,降低细胞分裂速度,加速细胞凋亡等产生抗肿瘤作用。不断深入的研究结果也显示,青蒿素及其衍生物的抗肿瘤作用,通过多种途径抑制癌细胞的生长、增殖与转移,最终诱导其凋亡,包括诱导细胞周期阻滞、促进细胞凋亡、抑制肿瘤血管生成、阻断肿瘤细胞的侵袭转移等[3.2.3.5]。

[参考文献]

[1]张勤肿瘤的生物治疗进展[J]药学服务与研究,2010(4):2.4.7

[2]信息速递――WHO:未来20年全球癌症患者或增加五成[J]. 中国全科医学,201.5(2.1):2.5.10

[3]C R Cantor, H A Lim Electrophoresis, supercomputing and the human genomes[M] Singapore:World Scientific Publishing Co, 1.991

[4]Cheng D,Knox C,Young N,et al PolySearch: a webbased text mining system for extracting relationships between human diseases,genes,mutations,drugs and metabolites[J]Nucleic Acids Res,2008,3.6:3.99.

[5]国际癌症研究称2030世界癌症病例增长将达75%[J]临床合理用药杂志,201.2(1.7):1.8

[6]潘D,牛飞玉,苏文媚,等 201.2年临床肿瘤学重大进展――美国临床肿瘤学会年度报告[J]循证医学,201.3(1):4

[7]王可鉴,贺林,杨仑 生物信息学在药物研究和开发中的应用[J]中国药理学与毒理学杂志,201.4(1):1.1.8

[8]王亚辉世纪之交生物学发展的主要趋势[J]中国科学基金,2000(3): 1.67

[9]张春霆生物信息学的现状与展望[J]世界科技研究与发展,2000(6):1.7

[10]中国药典一部[S] 201.5:1.98

[11]李天星,姚朗 青蒿素类药物抗肿瘤作用的基础与临床研究[J]中国新药与临床杂志,2008(3):2.2.7

[12]李群 OMIM数据库在医学遗传学实践中的应用[J]中国优生与遗传杂志,2010(6):7

[13]Shannon P,Markiel A,Ozier O,et al Cytoscape: a software environment for integrated models of biomolecular interaction networks[J]Genome Res,2003,1.3 (1.1):2.4.98

[14]Martucci D,Masseroli M,Pinciroli F Gene ontology application to genomic functional annotation,statistical analysis and knowledge mining[J]Stud Health Technol Inform,2004,102(5): 108

[15]Maere S,Heymans K,Kuiper M BiNGO: a cytoscape plugin to assess overrepresentation of gene ontology categories in biological networks[J]Bioinformatics,2005,2.1(1.6): 3.4.4.8

[16]吕志敢,郭政 肿瘤坏死因子的研究进展[J]山西医科大学学报,2006(3):3.1.1

[17]李卫,刘佳,白家媛,等 α肿瘤坏死因子的研究进展[J]动物医学进展,2010(1.2):108

[18]张瑞鹏,郭平凡 血管内皮生长因子最新研究进展[J]医学综述,2008(1.5):2.2.5.8

[19]王娟 血管内皮生长因子及其受体在抗肿瘤治疗应用的研究进展[J]中国医药工业杂志,2007(5):3.81

[20]李欣 磷脂酰肌醇3激酶结构与功能研究进展[J]成都大学学报:自然科学版,201.3(3):2.1.9

[21]戴炜辰,朱雍,陆涛 磷脂酰肌醇3激酶抑制剂抗肿瘤临床研究进展[J]海峡药学,201.4(6):6

[22]韩明利,吴诚义 ALDH1作为干细胞标记物的研究进展[J]生物医学工程学杂志,2010(5):1.1.83

[23]胡凯,毕明宏ALDH1在恶性肿瘤中的研究进展[J]临床肺科杂志,201.2,1.7(10):1.875

[24]钱海利,王海娟,林晨 抗亡Bcl2家族蛋白拮抗分子在肿瘤治疗中的研究进展[J]中国肿瘤,201.1(2):100

[25]曹银芳,关泽红,于晓鸿 凋亡抑制基因Bcl2在肿瘤中的应用研究进展[J]内蒙古医学杂志,2007(8):961

[26]周凡,庄诗美 MicroRNA与肿瘤[J]生命科学,2008(2):207

[27]刘禹,姜晓峰 MicroRNA与肿瘤的研究进展[J]国际检验医学杂志,2010(5):4.65

[28]夏春咸,苗永昌,梁辉 p3.8MAPK通路在消化系肿瘤研究中的新进展[J]实用肿瘤杂志,2008(5):4.88

[29]黄川,袁铿 JNK、p3.8MAPK信号通路与肿瘤细胞凋亡[J]实验与检验医学,201.2(5):4.4.7

[30]黄健清,梁红玲,张绪超,等CASP3与CleavedCASP3在肺癌中的表达及意义[J]实用医学杂志,201.2(8):1.2.4.7

[31]倪勤,刘冰,金明娟,等 CASP3基因多态及单体型分布与乳腺癌危险性的关联研究[J]浙江大学学报:医学版,201.1(3):2.5.9

[32]袁亚,李晓光,巴乾,等 青蒿素类化合物抗肿瘤研究新进展[J]生命科学,201.5(9):1.1.81

[33]徐春芳,胡小龙,岳小庆,等 青蒿素及其衍生物抗肿瘤作用机制研究进展[J]吉林医药学院学报,201.5(5):3.72

第5篇

[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。

一、生物信息学的产生

21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。

二、生物信息学研究内容

(一)序列比对

比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。

(二)结构比对

比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。

(三)蛋白质结构预测

从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。

(四)计算机辅助基因识别

给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。

(五)非编码区分析和DNA语言研究

在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。

三、生物信息学的新技术

(一)Lipshutz(Affymetrix,Santa clara,CA,USA)

描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen, Branford, CT, USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。

(二)基因的功能分析

Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。

Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列 是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distant relationship)。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(ab initio folding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segment matching)来完成的,计算机程弃SegMod就是基于同源模建方法的。

(三)新的数据工具

Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。

Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自ABⅠPrism dNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。

参考文献

第6篇

作为多年致力于生物医学信息学的科研工作者,刘雷站在时代的潮头,综合应用多门学科,在基因组数据的分析与挖掘、生物网络的构建与分析、生物系统的建模与模拟、医疗大数据整合与挖掘、临床决策支持、精准医学等方面做了大量工作,取得了一系列创新性成果。他用日复一日的勤奋与智慧,推动我国生物医学信息学向更高水平发展。

生物医学与计算机科学的双重人才

随着科学向综合性发展和大数据时代到来,各种交叉学科不断形成,生物医学信息学就是其中之一。

作为北京大学生物学系毕业的高材生,刘雷从一开始就选择了遗传学。后来,从中国科学院发育生物学研究所的硕士到美国康涅狄格大学分子与细胞生物学系的博士,刘雷在专业上日益精进,不断获得突破。当时,康涅狄格大学有一位生物系的老师,热衷研究分子进化,刘雷在他的影响下,对生物信息学产生了浓厚的兴趣。90年代,人类基因组计划正在轰轰烈烈地开展,生物信息学从中孕育而生。然而,生物信息学是一门交叉学科,融合了生物技术与计算机科学,这类复合型人才奇缺。刘雷抓住了这一契机,不顾别人疑惑的目光,毅然选择了到康涅狄格大学计算机系做博士后,从此成为兼备生物学与计算机技术的复合型人才。

1999年,博士后结束,由于刘雷既懂计算机又懂生物学,受聘于美国伊利诺伊大学香槟分校生物技术中心,组建生物信息学实验室并担任主任。在这里,刘雷进行服务器基础设施建设、基因组数据序列分析,还开课讲授生物信息的一些课程,各项工作顺利进行,成果迭出。“交叉学科存在语言的问题,你要听懂学计算机的人在说什么,也要听懂学生物的人在说什么。”在这种情况下,刘雷的双重学科背景为团队的沟通交流提供了便利,他一方面将生物学的问题转化成计算机的问题开展工作,一方面将计算机专用的算法与结果解释给生物学家们听,成为了不同学科之间沟通对话的桥梁。

为了适应交叉学科对不同专业人才的需求,生物信息学实验室招纳了计算机领域、生物领域、数学领域等不同领域的人才。刘雷在组建实验室的过程中对整个生物信息领域有了更加深切的了解,冥冥之中为他回国开展相关工作奠定了坚实的基础。

助力我国生物医学信息技术

2002年,上海生物信息技术研究中心成立,研究中心的两位负责人在去美国访问期间,与刘雷一见如故。应他们的邀请,刘雷从2003年开始担任上海生物信息技术研究中心客座研究员,逐渐与国内生物信息研究领域建立起广泛的交流和沟通。2007年,刘雷入选中科院“百人计划”正式回国,任中科院上海生命科学研究院系统生物学重点实验室研究员、上海生物信息技术研究中心副主任,用所学知识报效祖国。

面对数量大、内容层次复杂的医学证据,要想从中全面、系统、快速的获取最佳的医学知识和证据,就必须借助计算机巨大的存储和处理信息的能力。上世纪90年代之后,医疗信息化成为改进医疗服务质量、提高服务效率、把医疗卫生服务成本控制在民众可接受水平的主要技术手段。2010年,刘雷申请主持了国家高技术研究发展计划(“863”计划)项目“数字化医疗工程技术开发”中的第二课题“医学知识库与临床决策支持系统研发”,旨在为临床提供更为便捷和随需而得的医学知识和证据获取途径,促进医疗水平的提高。

在这一科研项目中,刘雷带领团队围绕医学知识库的构建和临床决策知识系统的研发,开展了医学知识库构建技术研究、数字化临床指南知识库与决策支持系统研发、数字化临床路径实现技术与应用模式研究、智能化合理用药系统研发、以及数字化人体仿真建模与辅助诊疗技术研究。

刘雷说:“现在医疗电子化程度已经很高了,有电子病例等各种系统,但是这些数据都是分散的,相互之间并不联通。我们想要建立一个数据中心,将分散的数据集中在一起,并整理成体系,以利于数据挖掘。”基于此,刘雷与团队研发了数字化临床指南知识库与决策支持系统。“当医生遇到一个难题,计算机的决策支持系统会将相关知识推送给他,省去了医生查阅文献的时间。”而对基层医生,知识库提供了一个医疗指南,“比如遇到高血压病人,系统会给基层医生提示,显示该做什么检查、开什么药,来辅助临床治疗”。

刘雷认为,数字化医疗不但在医学信息化、生物信息的发展过程中会起到重要作用,而且对构建和谐医患关系也大有裨益。“医患关系最大的问题是信息不对称。患者知道的很少,医生知道的很多,患者听不懂医生所说的专业术语。那么这时候还是沟通的问题,大家有误会就会造成医患关系紧张。”在刘雷看来,医学知识库和临床决策支持系统在给医生提供服务的同时,也应该给患者提供服务,要将医学知识库的知识进一步变得通俗易懂,让患者能够清楚了解。

曾经有医生不理解刘雷,“你们的工作难道要取代医生吗?”,他们认为,对患者解释医学知识只会浪费时间。刘雷解释说,“我是在帮你们,也是在帮助患者,让你们更好地沟通。只有这样工作才能更顺畅”。那么,如何让知识库更好地为患者服务呢?刘雷设想,现在中国的病人太多,排队等候时间很长,可以将患者排队等候的时间利用起来,将一些知识推送给患者,这样一来,患者对病况有所了解之后,再和医生沟通起来就会容易很多。

像马儿一样驰骋

如今,回国已有8年,刘雷说:“我做了正确的选择。”他目睹了2008年的北京奥运会,见证了2010年的上海世博会,中国大地上的一派欣欣向荣之景令他倍受鼓舞。“在国内,我有自己的实验室,承担大数据项目、‘863’项目,最近又在做精准医疗。这让我站得更高,看得更远。”

精准医疗是个性化医疗的延伸,将促使医学进入智能时代,产生颠覆式医学创新。刘雷说,他不久前刚去天津做了题为“生物医学信息――从大数据到精准医疗”的报告,精准医疗研究已经成为各国科研和医疗机构以及企业界高度关注和大力投入的重要研究领域。据刘雷介绍,精准医疗是一个很庞大的项目,一是要做生物信息数据分析总结,二是做临床数据信息的采集分析,三是软件和产品的开发。最终,要实现从临床数据到样本、到分析、再到知识库和临床决策支持系统的整合。

如今,刘雷身任多职,学校、医院、研究院,他到处奔忙,乐此不疲。他笑着说:“我是属马的,奔跑是马儿的天性。”

第7篇

【关键词】大数据 生物信息 知识提取 数据挖掘

1 数据挖掘的功能

数据挖掘是从大量的数据中四栋搜索隐藏于其中的具有特殊关系性的信息过程。它是数据库知识发现KDD中的一个步骤。知识发现KDD过程由以下3个阶段组成:数据准备、数据挖掘、结果表示和解释。数据挖掘跟许多学科都交叉关联,包括数据库技术、统计学、机器学习、人工智能、云计算和可视化等。

数据挖掘的实际应用功能可分为三大类和六分项:分类和聚类属于分类去隔类;回归和时间序列属于推算预测类;关联和序列则属于序列规则类。分类常被用来根据历史经验已经分好的数据来研究它们的特征,然后再根据这些特征对其他未经分类或是新的数据做预测。聚类是将数据分群,其目的是找出群间的差异来,同时找出群内成员间相似性。回归是利用一系列的现有数值来预测一个数值的可能值。基于时间序列的预测与回归功能类似,只是它是用现有的数值来预测未来的数值。关联是要找出在某一事件与数据中会同时出现的东西。

2 降维

从降维的角度讲,整个数据挖掘的过程就是一个降维的过程。在这个过程中,需要对数据删除线性关系比较强的特征数据,再用一些算法,如信号分析算法、傅里叶转换、离散小波转换等算法,从数据中提取特征,再对数据做主成分析处理,得到最后的特征,再用数据挖掘算法来将这些特征转化为人类可读取的数据或信息。

3 分布式数据挖掘解决方案

随着分布式计算技术、云计算技术、hadoop生态圈和非结构化数据库等技术的发展,以及对大数据挖掘的需求,出现了一批分布式数据挖掘,比较典型的有Apache推出的基于Hadoop的Mahout和加利福尼亚大学伯克利分校AMP实验室推出的基于Spark的MLBase。在Mahout中主要实现3种类型的数据挖掘算法:分类、聚类(集群)和协同过滤。相比Mahout而言,MLbase更好的支持迭代计算,它把数据拆分成若干份,对每一份使用不同的算法和参数运算出结果,看哪一种搭配方式得到的结果最优。

4 大数据下的具体应用实例――生物信息学的应用

生物信息学(Bioinformatics)是生命科学、计算机科学、信息科学和数学等学科交汇融合形成的一门交叉学科。近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术。在使用计算机协助生物信息时,处理仅有计算机辅助的方式存储数据很显然是不够的,生物信息学研究的目的是运用计算机强大的计算能力来加速生物数据的分析,理解数据中所包含的生物学意义。当前生物信息学研究的热点有:

(1)由以序列分析为代表的组成分析转向功能分析。

(2)由对单个生物分子的研究转向基因调控忘了等动态信息的研究。

(3)完整基因组数据分析。

(4)综合分析。

生物信息数据具有如下特点:高通量与大数据量;种类繁多,形式多样;异构性;网络性与动态性;高维;序列数据等特点[5]。针对这样的生物数据信息,要结合当前的大数据分析方法进行分析和理解。当前数据挖掘实现对生物信息分析的支持主要有:生物数据的语义综合,数据集成;开发生物信息数据挖掘工具;序列的相似性查找和比较;聚类分析;关联分析,生物文献挖掘等方面。

参考文献

[1]许凡.大数据时代的数据挖掘技术探讨[J].电子技术与软件工程,2015(08).

[2]洪松林.数据挖掘技术与工程实践[M].北京:机械工业出版社,2014(11).

[3]李荣.生物信息数据挖掘若干关键问题研究与应用[D].复旦大学(博士论文),2004(11).

[4]宋杰.生物信息数据挖掘中的若干方法及其应用研究[D].大连理工大学(博士论文),2005(04).

[5]孙勤红.基于梯度采样局部收敛的生物信息大数据挖掘[J].科技通报,2015(10).

作者简介

孙勤红(1979-),女,山东省人。现为三江学院计算机科学与工程学院讲师。研究方向为人工智能、数据挖掘。

沈凤仙(1984-),女,江苏省人。现供职于三江学院计算机科学与工程学院。研究方向为数据挖掘。

第8篇

【关键词】信息时代;医学信息化;发展前景;研究

1.引言

随着现代信息技术的发展与广泛应用,加快了人类信息社会的建设步伐,信息化、数字化已经逐渐进入到医学的各领域中,成为医学界不可或缺的重要工具与手段。信息技术的高速发展正改变着医学的教学、研究、医疗服务等的诸多传统方式,并随着现代信息技术的不断发展而不断推陈出新。但是,我们不能否认,现代信息技术在医学方面的应用不仅为医学的认知带来了新的渠道,转变了医学的思想观念与工作方式,同时也为医学界带来了一些问题,例如:新的伦理问题等。因此,在医学信息化建设迅速发展的今天,如何才能更好的将信息技术运用到医学中,医学信息化的发展前景如何?对医学界具有十分重要的现实意义与长远意义。

不可否认,医学信息化的建设是长期的,只有符合医学发展的信息化才具有生命力。在医院中,我们随处可见的CT、彩超等大型的数字化医疗设备、计算机网络的各种医疗收费系统、医疗信息处理系统等,还有在医学教学、科研领域,都逐渐开始使用现代信息技术的辅助来提升教学与科研的水平。信息技术在医学中的应用与改造与创新,使得医学的教学、科研、临床、管理、药品、医学器械的研制等都在借助信息技术来加快自身的发展,很难想象没有现代信息技术、计算机技术、网络技术的医学院校或者医院将会使什么模样。

2.信息时代医学信息化所面临的新挑战

2.1 数据的共享问题

美国在医学信息化数据的共享方面比较开放,美国的国立生物技术信息中心中存储大量的数据信息,这些数据信息对科学家是无偿提供研究的。但是,在我国的生物医学研究部门或者是医疗机构中,已经积累了大量的科研与临床数据,这些数据目前大多数仍处于独立使用的状态中,各机构之间缺乏数据共享数据孤岛现象严重制约着我国生物医学的研究与发展,同时也为我国社会医疗健康保障体系的建立带来了困难。在实际中,这些医疗机构之间由于存在各种利益关系,一般都对自己所持有的医学科研数据及诊疗数据资料保密,不愿意向同行与社会提供数据共享的服务。

2.2 数据标准化的问题

美国的著名劳伦斯伯克利国家实验基因租的科学部主任表示,最理想的状态就是能够建立统一的电子医疗系统,这些医疗病历系统应该具有统一的标准。但是,在我国的医学现实中并非如此。各医院存储的各种数据标准不同,不同的系统在存储的信息方面也不一样,目前,医疗系统与医疗科研机构之间的信息数据标准很难实现统一。究其原因主要是由于各种医疗设备的生产厂家、医疗系统的软件开发商之间的技术标准各不相同造成的。例如:不同的医院对信息管理系统中的电子病例数据信息的记录格式、标准不同,而信息中心的数据存储设备在构架上也不相同,这就造成各医院之间的医疗数据信息无法实现交流沟通、共享。如果同一个病人想在不同的医院进行治疗,就必须在不同的医院分别再做一次相应的检查,这不仅增加了病人的经济负担,严重的更影响了病人的最佳治疗时期。因此,要想在医学领域实现信息化就必须先打破各医院之间的技术壁垒,解决信息化的标准化问题。

2.3 医学信息化综合应用型人才严重匮乏

目前,医学信息学是建立在生物医学、信息技术、统计学、管理学等多学科基础上的一门交叉性的学科,在实际中,真正了解并掌握、精通信息科学知识的专业人才非常少。为了真正实现医学信息化并促进多学科的研究与教学,于2009年美国的特拉华大学创立了生物信息学与计算机生物学中心,这一中心集中了来自美国的5个学院的60多名知名教师,并创立了负责多个生物信息学教育的研究项目。纵观我国高校的现状,还尚未成立专门的医学信息专业,或者是生物医学与信息学相交叉的学科专业。在生物医学研究领域中的一些复合型研究人才大部分是由学生自己自学而成的,或者是由不同学科的导师共同培养而成的。这种状况就造成我国医疗信息化应用人才的严重匮乏,并为我国医疗信息化人才的培养带来了阻碍。不过我们坚信,在不久的将来,我国的医学教育界一定会认识到这一问题。

3.信息时代医学信息化的发展前景

3.1 医学信息化正朝着远程医疗与区域医疗的信息化发展

早在上世纪90年代,我国就曾经提出过实现远程医疗的发展,很多偏远地区的医院与大城市中具有实力的综合医院之间建立了远程医疗咨询会与会诊联系,但是由于当时采取的是调制解调器的电话网络或较高成本的卫星传输信息,在实际应用中很难得以实现,因此也就未在全国范围内进行推广。进入信息时代,随着互联网技术的发展与计算机技术的进步,网络音频技术、视频会议技术等在医学界得到广泛的推广,并实现了远程医疗教育,从而推动了我国医学影像信息的异地远程传输,进一步推动了我国的远程医疗发展。随着医学界对信息共享、电子病历等问题的探讨与研究,我国医学信息化逐渐向着区域医疗卫生信息化的方向发展。

3.2 数字化医院是医学信息化发展的必然趋势

目前对于数字化医院的定义至今还尚无定论,从一般意义上来看,它与医学信息化所寓意的实质性内容并不存在本质上的区别。目前,我国以病人为中心的HIS建设还处于初级阶段,虽然已经在很多方面发挥了重大作用,但是还远远不能满足病人、医护人员、管理者实现方便、低廉、高效、安全的就诊环境与模式,因此,数字化医院的发展还需要建立信息化条件下合理的诊疗流程与复合业务的需求。总之,实现数字化医院在研究、开发、应用方面还存在很大的发展空间。

总之,目前我国医疗领域信息化应用还属于起步阶段,还存在一些问题。但是我们坚信,在不远的将来,在我国政策的推动下、在信息科学技术的不断发展下,信息时代医疗信息化的发展将不断深入,将在我国生物医学领域中得到不断地发展与进步。

参考文献

[1]许德玮,桑梓勤.基于云计算的医疗卫生位置服务平台研究[J].医学信息学杂志,2013(6):8-13.

第9篇

[关键词] 雷公藤; 单萜合酶; 生物信息学分析; 基因表达分析; 蛋白表达

Cloning and protein expression analysis of monoterpene synthase gene TwMS in Tripterygium wilfordii

HU Tianyuan1, SU Ping2, ZHANG Yifeng1,2, GUAN Hongyu 1,2, ZHOU Jiawei1 ,

TONG Yuru1,2, GAO Wei1*, HUANG Luqi2

(1.Key Laboratory of Collateral Diseases, School of Traditional Chinese Medicine, Capital Medical University,

Beijing 100069, China;

2.State Key Laboratory of Daodi Herbs, National Resource Center for Chinese Materia Medica, Chinese

Academy of Chinese Medical Sciences, Beijing 100700, China)

[Abstract] In this study, we cloned a monoterpene synthases, TwMS from Tripterygium wilfordii suspension cells. TwMS gene contained a 1 797 bp open reading frame (ORF), encoding a polypeptide of 579 amino acids, which deduced isoelectric point (pI) was 6.10 and the calculated molecular weight was 69.75 kDa. Bioinformation analysis showed that the sequence of TwMS was consistent with the feature of monoterpene synthases. Differential expression analysis revealed that the relative expression level of TwMS increased significantly after being induced by methyl jasmonate (MeJA). The highest expression level occurred at 24 h. TwMS protein was successfully expressed in Escherichia coli BL21 (DE3), which laid the foundation for identifying the function of T. wilfordii monoterpene synthases.

[Key words] Tripterygium wilfordii; monoterpene synthases; bioinformatics analysis; mRNA expression analysis; protein expression

中雷公藤Tripterygium wilfordii Hook. f.来源于卫矛科植物雷公藤的根或根的木质部,具有祛风除湿、通络止痛、活血消肿,杀虫解毒等功效。现代研究表明,雷公藤的药用活性成分萜类物质具有显著的抗炎、抗肿瘤、调节免疫等药理活性[1],其主要活性成分包括二萜类成分雷公藤甲素和三萜类成分雷公藤红素等。其中雷公藤甲素可有效抑制肿瘤细胞生长,对胰腺癌的治疗效果显著[23],此外,雷公藤甲素还具有神经营养活性,是治疗帕金森和老年痴呆等疾病的重要活性分子[45]。雷公藤红素除了具有神经保护作用和抗遗传性疾病等作用外,近年来还被报导是一种瘦素增敏剂,可以起到减肥的作用[6]。

单萜化合物是由2个异戊二烯结构单元组成的链状或环状化合物,广泛存在于植物挥发油和树脂中[7]。 单萜化合物多具有较强的香气和生物活性,在植物种群竞争、吸引昆虫传粉、防御植食性动物和控制病虫害发生等方面发挥着重要作用[810]。植物单萜由质体内的4磷酸2甲基赤藓糖 (2CmethylDerythritol4phosphate,MEP)途径合成,其前体物质为脚6基焦磷酸(geranyl diphosphate,GPP)。单萜合酶 (monoterpenesynthases,monoTPS)是单萜生物合成的关键酶,单萜合酶基因的表达是植物生长发育过程中所必须的,具有明显的时空表达规律,其基因家族的不同成员往往在组织或器官的特定发育阶段表达,以合成植物通讯和生物防御所需的化感物质[1112]。单萜合酶基因的表达对环境的影响极为敏感,生物胁迫等外在压力可激活单萜合酶基因表达生成相应的单萜化合物,以对付食草动物、病虫害和病原菌等,很多单萜是植物防御系统的重要组成部分[10,13],对植物的生长发育具有重要意义。

本研究首次克隆得到1条雷公藤的单萜合酶基因,并对其进行了生物信息学分析、茉莉酸甲酯(MeJA)诱导表达分析,以及IPTG 诱导蛋白表达分析等研究,为深入研究雷公藤单萜合酶基因功能以及对雷公藤植物生长发育的调控机制奠定了基础。

1 材料

1.1 雷公藤悬浮细胞

实验所用材料来源于本实验室继代保存的悬浮细胞。培养方法:在含有 0.5 mg・L-1 2,4D (2,4二氯苯氧乙酸) +0.1 mg・L-1 KT (激动素) + 0.5 mg・L-1 IBA (吲哚丁酸) 的MS 液体培养基中,于25 ℃,120 r・min-1黑暗条件下振荡培养。

1.2 菌株

实验中使用的 Escherichia coli trans 5α及E.coli BL21(DE3)购自北京全式金生物技术有限公司。

1.3 试剂及仪器

2×EasyTaq PCR SuperMix、pEASYT3 Cloning Kit 购自北京全式金生物技术有限公司;RNA 纯化试剂盒、琼脂糖凝胶 DNA回收试剂盒、质粒小提试剂盒、Fast Quant RT Kit (With gDNase) 购自天根生化科技(北京)有限公司; KAPA SYBR FAST Universal 2×qPCR MasterMix 购自 KAPA Biosystems 公司;Dnase I,Phusion HF PCR Master Mix,BamHⅠ 限制性内切酶,PstⅠ 限制性内切酶及 T4 DNA 连接酶购自NEB(北京)有限公司; IPTG 为 Sigma 品牌,购自泰科兰博生物科技有限公司;其他化学试剂为国产分析纯。PCR 扩增仪型号为 ABIverity;实时定量 PCR 仪型号为 ABI 7300 系统;蛋白电泳仪型号为BIORAD Mini PROTEAN Tetra System;蛋白扫描仪型号为 UMAX PowerLOOK 21OOXLUSB;引物合成及测序服务由北京睿博兴科生物技术有限公司完成。

2 方法

2.1 雷公藤总RNA提取

取培养 10 d的雷公藤悬浮细胞,加入 MeJA诱导子,使之终浓度为 50 μmol・L-1。分别于诱导后 0,4,12,48,72 h 后取材,液氮速冻后置于-80 ℃ 冰箱保存。利用 CTAB 法提取雷公藤悬浮细胞总 RNA,并用 DNase (NEB) 和 RNA 纯化试剂盒去除基因组污染,将纯化的 RNA用液氮速冻后置于-80 ℃ 冰箱保存。

2.2 雷公藤单萜合酶基因克隆与测序

参考雷公藤悬浮细胞转录组数据结合NCBI (http://ncbi.nlm.nih.gov/) BLAST,获得雷公藤单萜合酶TwMS基因序列和开放阅读框(open reading frame,ORF),设计cDNA克隆引物(表1)。利用FastQuant RT Kit (With gDNase)将纯化得到的雷公藤悬浮细胞总RNA反转录成cDNA,将各时间点的cDNA取出少量混合,作为单萜合酶全长基因克隆的模板。根据 Phusion HF PCR Master Mix 说明书配制PCR体系:cDNA 2 μL,2×Phusion HF PCR Master Mix 25 μL,正反向引物各2.5 μL (10 μmol・L-1),ddH2O 补足到50 μL。反应程序: 98 ℃ 30 s; 98 ℃ 10 s,55 ℃ 15 s,72 ℃ 30 s,重复 35 个循环;72 ℃ 5min。 将 PCR产物切胶回收后连接 pEASYT3 载体,转化至大肠杆菌 trans5α克隆感受态细胞中,通过菌液PCR挑选阳性克隆进行测序验证。

2.3 TwMS基因序列的生物信息学分析

将测序得到序列通过InterPro在线软件(http:// ebi.ac.uk /Tools/InterProScan)进行结构域分析,PRABIGERLAND(https://npsaprabi.ibcp.fr/)进行二级结构预测,TargetP1.1 server (http://cbs.dtu.dk/services/TargetP/)进行信号肽分析,ExPAS ProtParam tool(http:///protparam/)预测蛋白相对分子质量和理论等电点,TRMHMM server v2.0 (http://cbs.dtu.dk/services/TMHMM2.0/)进行跨膜域分析,Psort(http://psort.hgc.jp/)及Wolfpsort(http:///)分析亚细胞定位,SWISSMODEL(http:///) 进行二级结构分析和结构域的三维同源建模。根据NCBI BLAST结果下载同源序列,分别使用DNAMAN软件和MEGA 5.0软件进行多重序列比对和系统进化树的构建。

2.4 TwMS基因的表达分析

以反转录得到的MeJA 诱导不同时间的cDNA为模板,选取βactin 作为看家基因,检测雷公藤悬浮胞中单萜合酶TwMS基因表达量的变化,设计实时荧光定量引物(表2)。反应体系如下:2×SYBR green Mix 10 μL,ROX 校正染料 0.4 μL,正反向引各 0.4 μL (10 μmol・L-1),ddH2O补足至20 μL。反应程序:95 ℃ 3 min;95 ℃ 3 s,60 ℃ 30 s,40个循环。每个循环后采集荧光信号,65~95 ℃ 做溶解曲线分析。反应结束后分析扩增曲线和溶解曲线。每个样品做技术重复3次,并通过2-ΔΔCT法[14]分析TwMS基因的相对表达量。

2.5 TwMS 的蛋白表达分析

2.5.1 TwMS 表达载体构建 选择重组蛋白表达载体pMALc2X,对载体和基因序列的限制性酶切位点进行分析,选取BamH Ⅰ 和 Pst Ⅰ作为载体构建的连接位点。在雷公藤单萜合酶基因TwMS的ORF两端设计添加限制性酶切位点的引物(表3),使用NEB Phusion HF PCR Master Mix进行PCR扩增,产物经切胶回收后,将回收得到已添加酶切位点的目的片段与载体分别进行双酶切,反应体系:Cutsmart buffer 5 μL,BamH Ⅰ 1 μL,Pst Ⅰ 1 μL,载体或片段5 μL,ddH2O补足至50 μL。反应条件为37 ℃,1 h。反应结束后将酶切产物进行切胶纯化,回收产物测浓度后按照NEB T4 DNA 连接酶说明书配制反应体系,并于16 ℃,连接过夜。将连接产物转化至大肠杆菌 trans5α克隆感受态细胞中,涂布在含有100 mg・L-1Amp的LB固体培养基上过夜培养,选取单克隆进行菌液PCR验证,并将阳性结果送公司测序验证。将测序结果正确的菌液扩大培养,保菌、提取质粒,得到的重组质粒即为构建成功的pMALc2XTwMS。

2.5.2 IPTG诱导蛋白表达 将重组质粒pMALc2XTwMS与空载体pMALc2X分别转化到大肠杆菌 BL21(DE3)表达感受态细胞中,挑取阳性单克隆于2 mL LB+100 mg・L-1Amp的液体培养基中,37 ℃ 250 r・min-1培养至A600为 0.6~1.0,取1 mL离心收集菌体,弃上清,用新的培养基重悬,转移至50 mL 的LB+100 mg・L-1Amp液体培养基中,37 ℃ 250 r・min-1摇到A600约 0.8,加入异丙基硫代半乳糖苷(isopropylbetaDthiogalactopyranoside,IPTG)至终浓度 1 mmol・L-1,20 ℃,200 r・min-1诱导12 h。将诱导完的菌液4 ℃,3 000 r・min-1离心20 min收集菌体,用新制的TrisHCl 缓冲液(50 mmol・L-1 Tris/HCl (pH 7.5),500 mmol・L-1 KCl,1 mmol・L-1 MnCl2,5 mmol・L-1 dithiothreitol,0.05% NaHSO3,10% glycerol)清洗2次,最后用5 mL TrisHCl 缓冲液重悬菌体。将重悬菌液置于冰中,超声破碎5 min(功率30%,超声5 s,暂停5 s),重复破碎1次后4 ℃,12 000 r・min-1离心 30 min,分离上清与沉淀,取上清再离心20 min,再次取上清,即为蛋白粗提物。

以含有空载体pMALc2X的大肠杆菌BL21(DE3)表达的蛋白粗提物为对照,与上述含有重组质粒大肠杆菌BL21(DE3)表达的蛋白粗提物上清共同进行十二烷基硫酸钠聚丙烯酰胺(SDSPAGE)凝胶电泳检测。

3 结果与分析

3.1 雷公藤TwMS全长 cDNA 的获得

设计特异性引物以雷公藤悬浮细胞cDNA为模板进行PCR扩增,产物经琼脂糖凝胶电泳检测,在1 800 bp附近有明亮单一的条带(图1),与预期目的条带大小一致。测序结果表明,TwMS的ORF大小为1 797 bp,编码579个氨基酸。

3.2 同源性比对及系统进化分析

将得到序列在NCBI上进行 BLAST,发现TwMS与其他植物的单萜合酶具有较高的同源性,与毛果杨Populus trichocarpa、葡萄Vitis vinifera、冬青栎Quercus ilex、黑杨Populus nigra、蓖麻Ricinus communis等植物单萜合酶的相似度均大于50%。通过Editseq软件将TwMS序列翻译成氨基酸序列,利用DNAMAN软件进行多重序列比对。比对结果显示, TwMS基因含有多个萜类合酶基因的高度保守结构域,包括富含天冬氨酸的底物结合基序DDxxD,N末端精氨酸富集基序RRx8W,C末端NSE/DTE基序以及DDxxD上游35个氨基酸处的高度保守域RxR基序(图2),符合被子植物单萜合酶序列特征[15]。

TwMS与其他15个不同来源的单萜合酶氨基酸序列进行比对,通过软件 MEGA 5.0相邻连接法构建系统进化树(图3)。在萜类合酶7个亚家族(TPSag)中,单萜合酶分布于b,d,f,g 4个亚家族[1516]。裸子植物单萜合酶归属于TPSd亚家族,均包含一个RRx8W基序,谱系分化小;被子植物单萜合酶进化较快,分化较大,其中TPSg 亚家族单萜合酶缺少RRx8W基序,催化产物形成非环状、易挥发单萜[17];大多数被子植物单萜合酶属于TPSb 亚家族,包含1个RRx8W基序;而TPSf亚家族是比较古老的分枝,主要成员包括仙女扇单萜合酶和拟南芥单萜合酶TPS04。进化树分析表明,雷公藤单萜合酶TwMS与被子植物黑杨P. nigra亲缘关系最近,归属于被子植物单萜合酶TPSb亚家族,与TPSf亚家族亲缘关系较远。

3.3 理化性质与 3 D 结构预测

TwMS蛋白的相对分子质量为69.75 kDa、理论等电点为5.37,为亲水性蛋白。信号肽分析显示无信号肽,跨膜域分析结果表明其为非膜蛋白,无分泌蛋白。亚细胞定位预测结果显示TwMS可能定位在内质网或质膜上。结构域分析表明,TwMS在62~270 aa 处含有萜环化酶/异戊烯基转移酶结构域,65~245 aa处编码N末端结构域,276~540 aa处含有1个金属结合结构域。TwMS蛋白的二级结构预测结果显示:无规则卷曲和α螺旋结构是其主要结构原件,无规则卷曲占49.41%,α螺旋结构占39.36%,剩余11.22%是长链结构。蛋白三维结构以4Slimonene synthase 2ong.1.A [18]为同源建模模板,建模范围为 56~596位氨基酸残基,序列同源性为44.80%(图4)。

[9] Holopainen J K. Multiple functions of inducible plant volatiles[J]. Trends Plant Sci, 2004, 9(11):529

[10] Pichersky E, Gershenzon J. The formation and function of plant volatiles: perfumes for pollinator attraction and defense[J]. Curr Opin Plant Biol, 2002, 5(3):237.

[11] Chen F, Tholl D, D'Auria J C, et al. Biosynthesis and emission of terpenoid volatiles from arabidopsis flowers[J]. Plant Cell, 2003, 15(2):481.

[12] Chen F, Ro D K, Petri J, et al. Characterization of a rootspecific Arabidopsis terpene synthase responsible for the formation of the volatile monoterpene 1,8cineole[J]. Plant Physiol, 2004, 135(4):1956.

[13] Steele C L, Katoh S, Bohlmann J, et al. Regulation of oleoresinosis in grand fir (Abies grandis). Differential transcriptional control of monoterpene, sesquiterpene, and diterpene synthase genes in response to wounding[J]. Plant Physiol, 1998, 116(4):1497.

[14] Livak K J, Schmittgen T D. Analysis of relative gene expression data using realtime quantitative PCR and the 2-ΔΔCT, method[J]. Methods, 2001, 25(4):402.

[15] Bohlmann J, MeyerGauen G, Croteau R. Plant terpenoid synthases: molecular biology and phylogenetic analysis[J]. Proc Natl Acad Sci USA, 1998, 95(8):4126.

[16] Natalia Dudareva, Diane Martin, Christine M Kish, et al. (E)βocimene and myrcene synthase genes of floral scent biosynthesis in snapdragon: function and expression of three terpene synthase genes of a new terpene synthase subfamily[J]. Plant Cell, 2003, 15(5):1227.

[17] Aharoni A,Giri A P,Verstappen F W, et al. Gain and loss of fruit flavour compounds produced by wild and cultivated strawberry species[J]. Plant Cell, 2004, 16(11):3110.

第10篇

新医改以来,卫生信息化建设速度加快与人才储备不足的问题日益凸显,而长期以来,由于我国卫生信息化投入的不足和医院等卫生机构对处于边缘化的信息部门不够重视,更遏制了卫生信息化人才的培养和医学信息学学科的发展。人才短缺,已经成为全国横在医改面前的一道难题。

用人单位面对人才短缺的困惑与解决办法

其实无论是甲方还是乙方,也无论是基层医疗卫生机构还是各级卫生主管部门,都普遍存在医学信息学人才捉襟见肘的局面。远在经济落后的西部医院,近在一线城市中的三甲医院,医疗卫生信息化的发展还在严重依赖供应商。而作为医疗IT软件供应商的乙方,也同样存在招不到交叉型人才的困惑。

在笔者采访过程中,记忆深刻的是一次走访医院,一位不愿透露姓名的部门主管向笔者“诉苦”:“说实话,以前的信息科就是领导随意安排岗位的部门。因为信息科在医院长期处于一个服务部门的地位,作为一个边缘化的部门,从来没有被重视过,仕途上也不吸引人。”正因为信息部门是一个辅助部门,而非战略管理和规划部门,即使现在的卫生信息化建设把信息部门的地位提升了起来,其还是处在上没有顶层设计、下没有人才引进的尴尬境地。

作为研发医疗信息产品的供应商,同样存在招不到合适员工的困惑。银江股份有限公司COO,医疗事业部总经理裘加林告诉记者,现在的厂商之所以将医疗软件做成一个工程,是因为医院业务和流程的复杂性与不可复制性。而厂商所拥有的人才大部分是计算机专业的IT人才,在对医院业务一点儿都不了解的情况下去做的产品,何谈标准!因此医疗IT厂商只能“八仙过海,各显神通”,有的聘用学习临床医学的本科或研究生;有的从医院高薪挖来专家教授;有的建立自己的培训机制,似乎只有这样才能弥补IT对医疗认识的不足,才能贴合医院的需求来生产产品。“一方面我们自己有很多做信息化做了很长时间的IT设计人员。第二,我们有很多医院顾问,他们是把握方向的人。就像是船长和水手的关系,懂行的人来把握方向,不懂行的人按照懂行人的建议来设计。”裘加林说,这也是企业中最常见的将医疗与IT结合的方式。

在基层医疗机构,人才不足的现象则更为严重。时任山西省安塞县副县长的赵燕曾经在采访时解答乡村卫生信息化人才的培养问题。当时,作为国际IT企业英特尔参与支持革命老区医疗信息化建设项目,并为基层医疗组织提供电脑操作、教程课件等方面的培训。赵副县长说:“我们自己要造血才是根本,不能光靠人家输血。先培训我们已有的部分员工,首先把我们这些员工培训得会管理了,会操作了,让我们这些人再下去培训村医,只能用这种办法。”确实如此,医疗卫生信息化是比较复杂的系统工程,需要比较专业的人才,作为第三方培训力量不可能长期为基层提供人才支持。但项目总要持续发展下去,这个时候,自身的“造血”功能便显得尤为重要了。

回归卫生信息化人才的话题,我们发现,当下最缺乏的是既了解医疗需求又掌握IT设计的复合型的交叉人才。从现在社会上存在的人才现状来看,可以说企业做出了不小的贡献,因为现在的医疗IT厂商变成了一个人才的大熔炉,不但提品,还培养人才。企业做了本该是教育来做的事情,这对我们的教育界来讲又是个不小的压力。

人才的培育不能离开教育

人才的培养必然不能离开教育,现在我国卫生信息化人才的短缺,很大一部分原因是由于教育没有配套造成的。在国外,医学信息学已经成为一个独立的学科,有30年的积淀,但它仍然在发展,每一个领域都有其主要的研究内容,内部已经有很严谨的知识体系。现在很明确的是,医学信息学的发展必将成为医疗卫生建设的重要组成部分,并为医疗改革提供实际的建议和指导。在我国,医学信息学的发展仍然面临很多问题。

1. 公众对医学信息学的理解仍然不够

现在,仍然有很多人不知道医学信息学到底是怎样的一门学科。有人认为它仅仅是一个工具,有人认为它是一项技术或是一个软件。“真正意义上的医学信息学是一门交叉学科,其分支学科临床信息学指信息技术在医院管理、医院临床包括信息管理中的应用。但在完整的学科体系里,医学信息学是涵盖生物信息学、图像信息学、临床信息学、公共卫生信息学这几个领域的。”北京大学医学信息学中心常务副主任雷健波说。

应用在临床诊疗、医院管理方面应该就叫做临床信息学;应用在设备、信号获取、信息处理及图像方面可以归到图像信息学;而生物方面、蛋白质翻译转录、通过计算机来模拟生物过程,通过信息学的方式来研究其规律,可以归结到生物信息学范畴。

其实,医学信息学就是一门交叉学科,不可以说它绝对属于或不属于某个领域。比如数字人体等研究,这项技术原属于解剖学,但经过数字化的三维重建,将一个传统的研究方式导入到信息技术中,那么这个学科就已经涵盖到医学信息学里面。计算机辅助手术,辅助治疗等技术,都是很典型的临床信息学研究的内容。

2. 学科没有独立,高度不够

为什么医学信息学要成为一门独立的学科呢?这是因为医学信息学所涵盖的这几个方面都是有内在联系的,它有很多的方法和技术是可以相互借鉴,很多IT技术可以相互促进,所以才整合成一个大的医学信息学,一门独立的学科。

我们可以看到,在近年来随着医疗卫生信息化的发展,很多卫生信息化人才的培养方式都在慢慢起步和发展。不同的是,高校、高职专科乃至社会培训机构所采用的方式不尽相同,尽管我们每个人都在做这件事,但鲜有人站在学科建设的高度去做这项事业。

现在很多高校的做法是将“医学信息学”挂靠在别的一级学科下,这就存在很多问题,一方面“医学信息学”专业尚属目录外专业, 设置该专业的院校屈指可数, 能否在教育部新一轮的专业论证和目录调整中确立应有的专业位置和学科归属还是一个未知数。另一方面,对专业的定义不同也会导致学生培养方向的不同,培养出来的人才是否符合社会需求还有待时间来考证。

在国外,都是先把医学信息学这个学科体系建立起来,然后在学科的高度下来做研究,这样才更有利于培养系统化、专业化的人才,才有利于进行更有价值的科研。

3. 师资力量不够

如果说学科建立是战略性的,那么医学信息学教师队伍不专业,专业教材不系统,专业培养模式等等则属于战术性的混乱。这也从很大的程度上造成了现阶段培养不力的尴尬局面。由于医学信息学教育在我国起步较晚,师资力量薄弱的问题不容忽视。现阶段应实实在在地建设和规划好教材体系,学科体系和教学体系,没有实实在在的知识把医学信息学的理论体系支撑起来,整个的学科构架就不能实现。

我们应该怎么去做

面对如此多的问题,想在朝夕之间得到解决问题的办法是不可能的。我们关注的不是一蹴而就的解决方式,而是一个水到渠成的,从思想上的转变。

1. 用三个标准衡量,培养专业化人才

中国医科大学计算机中心主任王世伟教授说:“我在给学生讲课的时候,也提到这个问题。我问同学们将来学什么?大家都说‘学医学,学技术’。其实这个标准已经不全面了。联合国对全世界的医学院校的学生有一个标准,来评价医学院学生的核心能力――一是信息技术处理能力,二是与人沟通的能力,三是批判性思维。这三个是一个核心,缺少任何一条都不行。”

可以看到,联合国这个标准的核心并不是我们一贯强调的医疗技术。怎么理解呢?在信息化社会,对学生的核心能力评价已经逐渐由过硬的技术转变为更灵活的信息处理能力。广东省在十一五期间做了一个医学院校的毕业生就业率调查,调查发现,具备了相当的IT知识和信息化处理能力的学生就业率最高。这说明信息化处理能力已经成为整个国家的共识。

王世伟认为,医生要有真正的批判性思维,才能当一个好医生。恰恰我们中国很多医学院的学生在这一点上很欠缺,我们学的知识很死,靠背,靠高分。医生不能完全凭经验,就算治好了100个病人,也不能用同样的治疗方法去对待第101个病人。所以医生要大胆得否定自己,同时要借助网络化的技术来共享经验。要记住――共享的不只是自己的经验,而是全国乃至全世界的经验。

2. 认清发展机遇

从我国的国情来说,新一轮的医改方案明确提出要建立高效统一、系统整合、互联互通和实用共享的医药卫生系统,这是新医改的重要支撑,为我国医学信息学的发展提供了历史性的机遇。

第11篇

信息、生物、新材料三大前沿领域

信息、生物、新材料是21世纪前30年发展最快、最热门的三大领域,它们集结了当今世界最强势的研究力量。但在这些关系未来发展的关键领域中,我国许多核心技术仍依赖追踪、模仿和引进国外技术,原始创新能力明显不足。

从更宽的视野来看,不仅仅是这三个领域的发展需要高扬“自主创新”的信心与勇气。实际上,整个中国科技正面临着前所未有的发展压力:对外要适应国际科技竞争的紧迫形势,对内要满足经济社会发展进程中的重大战略性需求。而原始创新能力和技术创新能力的薄弱,已成为当前和未来相当长时期内影响我国整体竞争力的极大障碍。

面向未来15年的《国家中长期科学和技术发展规划纲要》即将,科技部等有关部门正在着手制定科技“十一五规划”——关于中国科技“未来”的探讨与关注,在最近一年多来达到了前所未有的程度。就是在这样带着几分焦灼、几分期待、几分信心的探讨氛围中,“自主创新”成为人们关于中国科技发展的共识。

带着这个共识,再来看中国科技发展面临的“压力”,在很大程度上已经变成了未来发展的重大机遇。未来10年,中国在这三大领域中最有可能实现自主创新的关键技术群究竟有哪些?有限的科技经费究竟应当投入到哪些突破口?

下一代移动通信技术

移动通信是人类社会发展中的一大奇迹。2004年12月,全球(蜂窝)移动通信用户总数已达17亿以上,超过已有百年发展历史的固定通信用户数。过去10年,移动通信技术完成了由第一代模拟通信技术向第二代数字通信技术的过渡,当前正处于由其巅峰状态向第三代(3g)移动通信技术过渡的进程中。

目前,世界发达国家纷纷投入力量进行第三代及下一代移动通信标准、技术和产品的开发。

——3g移动通信:国际电信联盟(itu-t )批准为3g 的三大标准分别是欧洲的wcdma,美国高通公司的cdma2000和中国大唐电信的td-scdma。3g已在全球30多个国家开始商用。

——增强型3g(enhanced 3g):为了克服3g 技术不能很好支持流媒体等业务的不足,国际电信联盟已在制定增强型3g技术标准。专家预测,增强型3g技术将进入商用。

——4g(或beyond 3g):下一代移动通信即所谓超3g(以下统称beyond 3g)技术的研究是国际上的热点。beyond 3g具有更高的速率与更好的频谱利用率。 欧盟、日本、韩国等国家已开始4g框架的研究,预期beyond 3g技术可望在2010年后开始商用。

中国移动用户总数已达3.34亿,居世界第一,总体技术水平与国际同步,处于由第二代向第三代的过渡时期。我国3g移动通信技术已经具备了实现产业化的能力,我国大唐电信2000年5月提出的td-scdma标准已成为国际电信联盟正式采纳的三大标准之一。此外,在国家“863”计划的支持下,开展了beyond 3g技术的研究,预期该技术可望在2010年后开始商用。

beyond 3g技术对我国经济社会发展和国防建设具有十分重要的意义。 德尔菲专家调查统计结果显示,我国研发水平比领先国家落后5年左右, 通过自主开发或联合开发,在未来5年可能形成自主知识产权。以华为、 中兴为代表的一批高技术通信设备制造业公司,在第三代移动通信设备(3g)等研发方面紧跟国际前沿,打破了国外公司对高技术通信设备的垄断,开始参与国际通信标准的制定,开发具有自主知识产权的核心技术,具备了参与国际竞争的能力,具备实现技术和产业跨越式发展的契机。

中国下一代网络体系

下一代网络(ngn)泛指以ip为核心,同时可以支持语音、 数据和多媒体业务的因特网、移动通信网络和固定电话通信网络的融合网络。

世界各国和国际通信标准化组织都在积极开展下一代网络的研究开发工作。国际电信联盟电信标准化部门(itu-t)、欧洲电信标准化协会(etsi)、互联网工程任务组(ietf)、第三代伙伴组织计划(3gpp)等,都在致力于下一代网络体系的研究。目前,美国、日本、韩国、新加坡以及欧盟都已启动了下一代互联网研究计划,全面开展各项核心技术的研究和开发。

我国在下一代网络的研究方面已取得了较大进展。“九五”期间,863计划建成了“中国高速信息示范网”(cainonet)、国家自然科学基金委支持的“中国高速互连研究试验网nsfcnet”等重大项目,目前已开始基于ngn的软交换技术在移动和多媒体通信中的应用研究。中兴、华为等企业还推出了基于软交换的ngn解决方案;在下一代互联网研究上,中兴、港湾网络等推出的高端路由交换机,可应用于国家骨干ip网络建设,以及大中型宽带ip城域网核心骨干和汇聚。国内公司还开始自行设计高端分组交换定制asic芯片。我国已成为少数几个能够提供全系列数据通信设备的国家之一。

下一代网络技术对促进我国高新技术的发展,以及对改造和提升我国传统产业具有举足轻重的作用,对国家安全至关重要。从总体上看,我国互联网技术跟随国外发展,在技术选择上缺乏系统研究,走过一些弯路,至今与国外仍存在较大差距。无论网络用户规模、网络应用、网络技术或网络产品都尚有很大的发展空间。从全局着眼,应不失时机地开展中国下一代网络体系的研究、应用试验、关键技术研究和产品开发。不能像第一代互联网那样,技术、标准都是外国的,给国家安全造成隐患。

纳米级芯片技术

当前,集成电路的发展仍遵循“摩尔定律”,即其集成度和产品性能每18个月增加一倍,按照器件特征尺寸缩小、硅片尺寸增加、芯片集成度提高和设计技术优化的途径继续发展。

自上世纪90年代以来, 全球集成电路制造技术升级换代速度加快。 当前国际上cmos集成电路大规模生产的主流技术是130nm, 英特尔等部分技术先进的芯片制造公司已在用90nm进行高性能芯片生产。2005年,美国amd公司已开始量产90nm的高性能芯片,国际上对65nm技术的开发也已成功。伴随130nm到90nm技术的升级, 考虑到扩大生产规模和降低成本,大多数公司将使用12英寸替代8英寸硅基片, 这也必将带来半导体设备的大量更新。

近年来我国一些先进集成电路制造公司的崛起,使国内集成电路制造工艺技术与国际先进水平的差距有了显著的缩小,但整体水平仍与先进国家相差2~3代。目前,我国集成电路设计公司年设计能力已超过500种,主流设计水平达到180nm,130nm技术正在开发中,90nm技术的研发也开始着手进行。从产业发展看,我国集成电路已初步形成由十多家芯片生产骨干企业、十多家重点封装厂、二十多家初具规模的设计公司、若干家关键材料及专用设备仪器制造厂组成的产业群体,设计、芯片制造、封装三业并举的蓬勃发展态势。以中科院计算所为代表的研究机构和企业在cpu研发方面所取得的新进展,标志着我国集成电路设计具有较强能力,与国际先进水平的差距进一步缩小。目前我国芯片业大多集中在低端的交通、通信、银行、信息管理、石油、劳动保障、身份识别、防伪等领域,ic卡芯片所占比重一直占据芯片总体市场的20%左右。

世界第一颗0.13微米工艺td-scdma 3g手机核心芯片10月9日在重庆问世

今后的ic是纳米制造技术的时代,而纳米级芯片技术是我国赶超国际的关键,它的成功将会是我国ic工业发展史上的重要里程碑和持续发展的动力,专家认为应优先发展。

中文信息处理技术

包括汉字和少数民族文字在内的中文信息处理技术,是汉语言学和计算机科学技术的融合,是一门与语言学、计算机科学、心理学、数学、控制论、信息论、声学、自动化技术等多种学科相联系的边缘交叉性学科。

随着互联网的发展,中文信息处理技术已渗透到社会生活的各个方面。1994年,微软开始进入中文软件市场,微软的word把国产wps挤出了市场,继而windows中文版又把国产中文之星挤垮。微软凭借其强大的优势地位,使国产的中文信息处理软件举步维艰。中文版的windows、office等占据了大部分的中文软件市场,使中文信息处理逐渐丧失了其特殊地位。

经过二三十年的努力,我国的中文信息处理,包括中文的编码、字型、输入、显示、输出等的基本处理技术已经实用化,目前正在逐渐摆脱“字处理”阶段,处于向更高级阶段快速发展的时期。包括中文的文字识别机和手写文字识别、语音合成、语音识别、语言理解和智能接口等技术的研究已获得进展。中文的全文检索、内容管理、智能搜索、中文和其他文字之间的机器翻译等技术也正在开发、研制,并取得了较大进展,涌现了联想、方正、四通、汉王、华建等公司。

随着中国加入wto与世界各国交流的逐渐扩大以及网络信息时代的来临, 中文信息处理技术越发显得重要,其自动化水平的提高,将大大促进我国科技、国民经济和社会发展,同时使中华民族的文化在信息时代得到新的发展。未来无疑应当加强中文信息处理技术的研发投入与政策倾斜。

人类功能基因组学研究

20世纪末启动的人类基因组计划被公认为生命科学发展史上的里程碑,其规模和意义超过了曼哈顿原子弹计划和阿波罗登月计划。随着人类基因组、水稻基因组以及其他重要微生物等50多种生物基因组全序列测定工作的完成,国际基因组研究进入到功能基因组学新阶段。

功能基因组学已成为21世纪国际研究的前沿,代表基因分析的新阶段。它是利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究,是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。从1997年迄今已发表的有关功能基因组学的论文数以千计,其中不少发表在《细胞》《自然》《科学》等国际著名刊物上。

目前功能基因组研究的重点集中在四个方面:一是基因测序技术研究。预计今后几年内,测序技术将继续发展,特别是有一些重要的改进将直接用于功能基因组的研究;二是单核苷多态性(snp)以及在此基础上建立的snp单体型研究;三是基因组有序表达的规律研究。主要包括基因的深入鉴定、基因表达与转录组研究、蛋白和蛋白质组研究、代谢网络和代谢分子研究、基因表达调控研究等;四是计算生物学和系统生物学研究。

近几年来,在国家“863”计划、国家重大科技专项等的资助下,我国功能基因组学研究取得了一系列进展。中华民族占世界人口的1/5,有丰富的遗传疾病家系资源,这是我国发展功能基因组研究的有利因素。“十五”期间,我国参与国际蛋白质组计划、国际人类基因组单体型图计划,高质量按时完成了项目中所承担的21号染色体区域的任务,建立并完善了中华民族基因组和重要疾病相关基因snps及其单倍型的数据库的建设,在国际一流杂志上发表了一批高水平学术论文,申报了一批国家专利,收集、保存了一批宝贵的遗传资源,并初步建立了遗传资源收集网络和资源信息库的采集管理系统,组建了一批国家级基地,培养了一支队伍,建立了一批技术平台。但总体而言,我国在功能基因组研究及应用方面的原始创新成果数量较少,还不能为医药生物技术产业的发展提供足够的知识和产品。

未来研究重点包括:

——功能基因组研究。重点开展植物功能基因组研究、人类功能基因组研究和重要病原微生物及特殊微生物功能基因组研究;

——蛋白质组学研究。蛋白质组学是一个新生领域,目前还处于初期发展阶段,仍有许多困难有待克服。我国应选择具有特色的领域开展研究;

——生物信息技术。我国的研究重点应集中在生物信息数据库的构建、生物信息的开发、加工、利用及生物信息并行处理方面;

——生物芯片技术及产品。通过微加工技术和微电子技术在固体芯片表面构建的微型生物化学分析系统,以实现对细胞、蛋白质、dna以及其他生物组分的准确、快速、大信息量的检测。常用的生物芯片包括基因芯片、蛋白质芯片、生化反应芯片和样品制备芯片等。生物芯片的主要特点是高通量、微型化和自动化。我国生物芯片研究紧跟国际前沿,它将对我国生命科学研究、医学诊断、新药筛选具有革命性的推动作用,也将对我国人口素质、农业发展、环境保护等作出巨大的贡献。

专家认为,我国人类功能基因组学研究的研发水平比领先国家落后5年左右, 若能高度重视,充分利用我国已有的技术和资源优势,未来10年我国可能实现人类功能基因组学研究的跨越发展。

蛋白质组学研究 随着被誉为解读人类生命“天书”的人类基因组计划的成功实施,生命科学的战略重点转移到以阐明人类基因组整体功能为目标的功能基因组学上。蛋白质作为生命活动的“执行者”,自然成为新的研究焦点。以研究一种细胞、组织或完整生物体所拥有的全套蛋白质为特征的蛋白质组学自然就成为功能基因组学中的“中流砥柱”,构成了功能基因组学研究的战略制高点。

目前蛋白质组学的主要内容是建立和发展蛋白质组研究技术方法,进行蛋白质组分析。为了保证分析过程的精确性和重复性,大规模样品处理机器人也被应用到该领域。整个研究过程包括样品处理、蛋白质的分离、蛋白质丰度分析、蛋白质鉴定等步骤。

附图

自1995年蛋白质组一词问世到现在,蛋白质组学研究得到了突飞猛进的发展。我国的蛋白质组研究也在迅速开展,并取得了许多有意义的成果,中国科学家已经在重大疾病如肝癌,比较蛋白质组学的研究等方面取得了重要成就,在“973 ”计划的资助下,我国已经开始了二维电泳蛋白组分离研究、图像分析技术和蛋白质组鉴定质谱技术研究等。

如何抓住国际上蛋白质组学研究刚刚启动的时机,迅速地进入到蛋白质组学研究的国际前沿,是摆在我国生命科学研究发展方向上的一个重要课题。

目前我国在该领域的研发基础较好,只比先进国家落后5年左右。 蛋白质组学属科学前沿,专家建议结合我国现行的基因组研究及其他有我国特色或优势的领域开展研究,不要重复或追随国际已有的工作,而应走自己的路,未来10年内有可能取得重大科学突破。

生物制药技术

生物制药被称为生物技术的“第一次浪潮”,其诱人前景引起了全世界各国政府、科技界、企业界的高度关注。

在过去的30年间,全球生物技术取得了令人瞩目的成就。据美国著名咨询机构安永公司2004年和2005年发表的第十八和第十九次全球生物技术年度报告分析,2003年全球生物技术产业营收达410亿美元。目前已有190余种生物技术产品获准上市,激发起投资者对生物技术股与融资的兴趣。

近20年来,我国医药生物技术产业取得了长足的进步,据《中国生物技术发展报告2004》统计,我国已有25种基因工程药物和基因工程疫苗,具有自主知识产权的上市药物达9种,重组人ω-干扰素喷鼻剂2003年4月获得国家临床研究批文,可用于较大规模高危人群的预防。但总体上与世界先进水平相比还存在很大的差距,医药生物技术产品的销售收入仅占医药工业总销售额的7.5%左右。

为加快我国生物制药技术的发展,今后的研究开发重点是:

——生物技术药物(包括疫苗)及制备技术。围绕危害人民健康的神经系统、免疫系统、内分泌系统和肿瘤等重大疾病和疑难病症的防治与诊断,应用基因工程、细胞工程、发酵工程和酶工程等技术,开发单克隆抗体、基因工程药物、反义药物、基因治疗药物、可溶性蛋白质药物和基因工程疫苗,拓宽医药新产品领域;

——高通量筛选技术。目前,国外许多制药公司已把高通量筛选作为发现先导化合物的主要手段。典型的高通量筛选模式为每次筛选1000个化合物,而超高通量筛选可每天筛选10万多个化合物。随着分析容量的增大,分析检测技术、液体处理及自动化、连续流动以及信息处理将成为未来高通量筛选技术研究的重点;

——天然药物原料制备。目前,已经发现人类患有3万多种疾病,其中1/3靠对症治疗,极少数人能够治愈,而大多数人缺乏有效的治疗药物。以往多用合成药物,随着科技的进步,人们自我保健意识增强,对天然药物的追求与日俱增。当前世界各国都在加强天然药物的研发。

生物信息学研究

在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析,对基因组研究相关生物信息获取、加工、储存、分配、分析和解释——上世纪80年代一经产生,生物信息学就得到了迅猛发展。其研究一方面是对海量数据的收集、整理与服务;另一方面是利用这些数据,从中发现新的规律。

具体地讲,生物信息学是把基因组dna序列信息分析作为源头, 找到基因组序列中代表蛋白质和rna基因的编码区;同时, 阐明基因组中大量存在的非编码区的信息实质,破译隐藏在dna序列中的遗传语言规律;在此基础上,归纳、 整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。另外生物信息学还利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。

生物信息学的发展已经将基因组信息学、蛋白质的结构计算与模拟以及药物设计有机地连接在一起,它将导致生物学、物理学、数学、计算机科学等多种科学文化的融合,造就一批新的交叉学科。

科学家们普遍相信,本世纪最初的若干年是人类基因组研究取得辉煌成果的时代,也是生物信息学蓬勃发展的时代。据预测,到2005年生物信息的全球市场价值将达到400亿美元。

我国生物信息学研究起步较早。20世纪80年代末,国内学者就在《自然》上报道了免疫球蛋白基因超家族计算机分析的工作。目前,多家大学和研究机构也相继成立了生物信息中心或研究所,各种原始数据库、镜像数据库和二级数据库也已经逐步建立,同时我国还建立了相关的工作站和网络服务器,实现了与国际主要基因组数据库及研究中心的网络连接,开发了用于核酸、蛋白结构、功能分析的计算工具以及蛋白质三维结构预测、并行化的高通量基因拼接和基于群论方法开发的基因预测等多种软件。中国学者还运用自主开发的电脑克隆程序,开展了大规模est 数据分析,建立了一系列基因组序列分析新算法和新技术,并在国内外著名科学杂志上发表了一系列论文,取得了引人注目的进展,尤其在人类基因组基因数目的预测上获得了与目前的实验事实相当吻合的结果,在国际上获得普遍认可。

农作物新品种培育技术

最近几年,农业生物技术的发展对农业产业结构调整产生的巨大影响,已引起各国政府和科学家的高度重视。农业生物技术领域研究中最活跃的是育种技术——应用现代分子生物学和细胞生物学技术进行品种改良,创造更加适合人类需要的新物种,获得高产、优质、抗病虫害新品种。这使得新品种层出不穷,品种在农业增产中的贡献率将由现在的30%提高到50%。国际水稻研究所已经培育出每公顷7500公斤的超级水稻,非洲培育出增产10倍的超级木薯。

我国该领域的基础研究和高技术研究取得了一批创新成果:如植物转基因技术、细胞培育技术、籼稻的全基因组测序、花粉管通道转基因方法等,使研制具有自主知识产权的转基因农作物新品种成为现实和可能。目前,已培育出亩产达到807.4公斤的超级杂交稻;2004年转基因抗虫棉的种植面积已占全国棉花种植面积的50%左右;利用细胞工程技术培育的抗白粉病、赤霉病和黄矮病等小麦新品种已累计推广1100多万亩;植物组织培养和快繁脱毒技术在马铃薯、甘蔗、花卉生产中发挥了重要的作用。

专家认为,我国农作物新品种培育的研发基础较好,整体科研技术与国外处于同等水平,只要充分利用资源,发挥优势,很可能在该领域取得突破。

纳米材料与纳米技术

纳米科技是上世纪末才逐步发展起来的新兴科学领域,它的迅猛发展将在21世纪促使几乎所有工业领域产生一场革命性的变化。纳米材料是未来社会发展极为重要的物质基础,许多科技新领域的突破迫切需要纳米材料和纳米科技支撑,传统产业的技术提升也急需纳米材料和技术的支持。

近年来,科技强国在该领域均取得了相当重要的进展。

在纳米材料的制备与合成方面,美国科学家利用超高密度晶格和电路制作的新方法,获得直径8nm、线宽16nm的铂纳米线;法国科学家利用粉末冶金制成了具有完美弹塑性的纯纳米晶体铜,实现了对纳米结构生长过程中的形状、尺寸、生长模式和排序的原位、实时监测;德国科学家巧妙地利用交流电介电泳技术,将金属与半导体单壁碳纳米管成功分离;日本用单层碳纳米管与有机熔盐制成高度导电的聚合物纳米管复合材料。

在纳米生物医学器件方面,科学家用特定的蛋白质或化合物取代用硅纳米线制成场效应晶体管的栅极用以诊断前列腺癌、直肠癌等疾病,成百倍地提高了诊断的灵敏度。另外,纳米技术在医学应用、纳米电子学、纳米加工、纳米器件等方面也有新进展。与此同时,国外大企业纷纷介入,推动了纳米技术产业化的进程。

当前纳米材料研究的趋势是,由随机合成过渡到可控合成;由纳米单元的制备,通过集成和组装制备具有纳米结构的宏观试样;由性能的随机探索发展到按照应用的需要制备具有特殊性能的纳米材料。

纳米材料和技术很可能在以下四个领域的应用上有所突破:一是it产业(芯片、网络通讯和纳米器件);二是在生物医药领域应用纳米生物传感的早期诊断和治疗,到2010年将给人类带来新的福音;三是在显示和照明领域的应用已有新的进展,纳米光纤、纳米微电极等已产生极大影响;四是纳米材料技术与生物技术相结合,在基因修复和标记各种蛋白酶等方面蕴育新的突破,预计2010年纳米技术对国际gdp的贡献将超过2万亿美元。

我国纳米材料研究起步较早,基础较好,整体科研水平与先进国家相比处于同等水平,部分技术落后5年左右。目前有300多个从事纳米材料基础研究和应用的研究单位,并在纳米材料研究上取得了一批重要成果,引起了国际上的广泛关注。据英国有关权威机构提供的调查显示,我国纳米专利申请件数排名世界第三位。

国内目前已建成100多条纳米材料生产线,产品质量大都达到或接近国际水平。与发达国家相比,我国的差距一是在纳米材料制备与合成方面尚处于粗放阶段,缺乏应用目标的牵引,集成不够;二是纳米材料计量、测量和表征技术明显落后于国外,对标准试样和标准方法的建立重视不够,对表征手段的建立投资不足;三是纳米材料的基础研究、应用研究和开发研究出现脱节,纳米材料研究缺乏针对性;四是学科交叉、技术集成不够。

链接:

信息技术正在发生结构性变革

目前,信息技术正在发生结构性的变革,在信息器件向高速化、微型化、一体化和网络化发展的同时,软件和信息服务成为发展重点。大规模集成电路正快速向系统芯片发展;移动通信技术正在向第三代、第四展,将提供更优质、更快速、更安全的服务,并带来巨大的经济利益;电信网、计算机网和有线电视网三网融合趋势进一步加快,无线网络成为世界关注的重点;全球化的信息网络将像电力、电话一样为社会公众提供各种信息服务,越来越深刻地改变着人们的学习、工作和生活方式,也将对产业结构调整产生重大影响。

微电子技术、计算机技术、软件技术、通信技术、网络技术等领域的发展方兴未艾,极有可能引发新一轮产业革命。

大显神通的新材料

高性能结构材料是具有高比强度、高比刚度、耐高温、耐腐蚀、耐磨损的材料,对支撑交通运输、能源动力、电子信息、航空航天以及国家重大工程起着关键性作用。

新型功能材料是一大类具有特殊电、磁、光、声、热、力、化学以及生物功能的材料,是信息技术、生物技术、能源技术和国防建设的重要基础材料。当前国际上功能材料及其应用技术正面临新的突破,诸如信息功能材料、超导材料、生物医用材料、能源材料、生态环境材料及其材料的分子、原子设计正处于日新月异的发展之中。

第12篇

【关键词】 sla?dr基因; 湖南大围子猪; 基因克隆; 异种移植

cloning and bioinformatics analysis of sla?dr genes in hunan daweizi pigs

wang yan1, xing xiao?wei1, xue li?qun2, huang sheng?qiang2, wu xiao?li1, wang wei1*

1cell transplantation & gene therapy center, third xiangya hospital of central south university, changsha 410013; 2department of animal science and technology, hunan agriculture university, changsha 410128, china

[abstract] aim: to evaluate the potential of daweizi pigs as xenotransplantation dnors from pigs to humans by analyzing the characteristics of sla?dr genes in hunan daweizi pigs. methods: sla?dra and sla?drb genes were amplified by rt?pcr, cloned into pucm?t vectors, sequenced and analyzed through blast in ncbi and related software in expasy. results: the sla?dra and sla?drb genes were 1 177 bp and 909 bp nucleotides in length, which contain opening reading frame (orf) and encode 252 and 266 amino acids respectively. comparing the sla?dra and sla?drb genes with their counterpart sequences of human, the homologies of amino acid sequences were 82% and 73% respectively. the amino acids in sla dr α chain of daweizi pigs from position 124 to 136, which bind to human cd4, showed only two differences with hla dra: a lleval change at position 127 and a serthr change at position 136. the amino acids in sla dr β chain of daweizi pigs from position 134 to 148, which bind to human cd4, were identical with hla?drb. further comparison with sla sequences published in genbank indicated that sla?drb gene found in daweizi pigs has polymorphism while the homology of sla?dra gene is up to 100%. conclusion: the cloned sla?dra and sla?drb in hunan daweizi pigs has high polymorphism with hla?dra and hla?drb in human, indicates that daweizi pigs have some advantages as xenotransplantation dnors from pigs to humans.

[keywords]swine leukocyte antigen dr allele (sla?dr); daweizi pigs; gene cloning; xenotransplantation

同种异体器官移植已成为治疗终末期器官衰竭的一种有效手段, 猪被认为是异种移植最理想的供体来源[1]。然而, 如何解决免疫排斥问题仍是阻碍临床大规模应用的主要问题之一[2]。猪的主要组织相容性复合体(majorhistocompatibility complex, mhc), 又称作猪白细胞抗原(swine leukocte antigen, sla), 是由紧密连锁的高度多态基因座所组成的染色体的一个遗传区域, 它作为主要组织抗原, 参与移植排斥反应, 是引起异种移植急性细胞性排斥的主要遗传因素[3]。通过对供体猪种进行筛查, 尽可能选择与人类mhc同源性较高的猪种将有助于提高异种移植物在人体内的存活时间, 为临床大规模开展将猪器官或细胞异种移植到人提供理想的供体猪种来源。

中国具有丰富的猪种种质资源, 不同的地域分布形成了猪种的多样性和遗传的相对稳定性, 为异种移植提供了可贵的研究和利用资源[4]。湖南大围子猪是我国特有的地方猪种之一, 亦是湖南省著名地方优良猪种, 具有繁殖力强、 抗逆性强、 耐粗饲、 肉质好、 生长慢、 饲料效率高等种质性状。但是, 大围子猪能否作为异种移植的供体, 尤其是该猪种细胞表面sla特性如何, 目前尚不清楚。本研究将克隆湖南大围子猪sla?dr基因, 分析其sla?dra和sla?drb基因特性, 比较与人cd4 分子结合部位大围子猪sla?dr编码氨基酸与人类相应dra、 drb的同源性, 为评价湖南大围子猪在异种移植中的应用前景, 提供免疫学方面的依据。

1 材料和方法

1.1 材料 总rna抽提试剂盒购自美国gentra公司; cdna第一链合成试剂盒购自fermentas 公司; pucm?t载体、 引物、 电泳试剂等购自上海生工生物工程技术服务有限公司; pcr高保真克隆酶easy?a购自stratagene公司; dna marker(100 bp ladder)购自晶美生物工程公司; 湖南大围子猪来自湖南望城大围子猪保种基地。

1.2 方法

1.2.1 湖南大围子猪sla?dra和sla?drb基因引物设计 根据genbank数据库中已登录的明尼苏达小型猪(minnesota miniature swine)的sla?dr序列(登录号为m93028, ab205163), 采用pcrdesn软件设计以下引物。sla?dra: 上游引物 : 5′?ggc atc taa gga gaa aat gac?3′; 下游引物: 5′?cca ctc aaa gtt tat tgt att cag?3′, 预计扩增片段大小为1 177 bp; sla?drb: 上游引物: 5′?ttg tcc tct cct gtt ctc cag?3′; 下游引物: 5′?tag gac gca gag cat agc agg?3′, 预计扩增片段大小为909 bp。

1.2.2 rt?pcr扩增湖南大围子猪sla?dra和sla?drb基因 在湖南大围子猪保种群中随机挑选两头个体, 以700 ml/l乙醇消毒耳尖取耳样组织, 按rna抽提试剂盒(gentra公司)说明书方法提取总rna。测定每一样品总rna的浓度, 模板定量为1 μg rna, 按revertaidtm first strand cdna synthesis kit说明书方法逆转录合成cdna第一链。以合成的cdna为模板进行pcr扩增, 20 μl pcr反应体系中, 分别加入下列物质: depc处理水13.5 μl, pcr缓冲液2 μl, 25 mmol/l mgcl2 1.6 μl, 10 mmol/l dntp混合物0.5 μl, 50 mmol/l上、 下游引物各0.2 μl, 模板1.6 μl, easy?a 高保真酶0.4 μl。在pe9700 型pcr 扩增仪上完成pcr扩增, 扩增条件如下: 先95℃预变性2 min 30 s, 94℃变性40 s, 58℃~59℃退火40 s, 72℃延伸40 s, 完成35个循环, 最后72℃延伸5 min, 置 4℃保温。取3.5 μl pcr扩增产物, 1.5 g/l琼脂糖凝胶电泳, 以鉴定pcr扩增结果。

1.2.3 湖南大围子猪sla?dra和sla?drb基因克隆与鉴定 连接反应在10 μl体系中进行: 双蒸水3 μl、 pcr产物1 μl、 pucm?t载体1 μl混匀后加入5 μl solutionⅰ, 16℃水浴连接过夜, 转化感受态大肠杆菌jm109(采用cacl2法制备), 4℃静置30 min后放入42℃水浴中热休克90 s, 加入300 μl预热的lb培养基, 37℃下振荡培养(200 r/min) 45 min, 将菌液平铺于含氨苄青霉素的固体培养基上, 37℃恒温箱中培养过夜。挑取单克隆, 在含氨苄青霉素200 mg/l的液体lb培养基中培养, 以菌液为模板, pcr鉴定为阳性克隆, 抽提质粒, 送上海英骏生物技术有限公司双向测序。

1.2.4 湖南大围子猪sla?dra和sla?drb基因生物信息学分析 用ncbi homepage中的orf对湖南大围子猪sla?dra和sla?drb基因的开放阅读框进行识别; 用expasy服务器中的prosite scan软件对sla?dra和sla?drb基因的功能域进行预测; 用ncbi中的blast及expasy服务器中的clustalw等软件对获得的sla?dra和sla?drb基因的序列结构进行比较分析。

2 结果

2.1 湖南大围子猪sla?dra和sla?drb基因rt?pcr扩增结果 rt?pcr扩增结果显示, 两头湖南大围子猪sla?dra和sla?drb均有特异性扩增条带, 大小分别为1 177 bp和909 bp, 与预期扩增片段大小一致(图1)。

2.2 湖南大围子猪sla?dra基因测序结果 测序大围子猪sla?dra基因, 结果表明: 来源于两个不同个体的sla?dra基因序列是一致的, 其cdna全长均为1 177 bp, 包含一个759 bp的完整的开放阅读框, 推测编码252个氨基酸。生物信息分析发现, sla?dra第1~23 位氨基酸为信号肽, 第24~107位氨基酸为α1 功能区, 第108~202位氨基酸为α2 功能区, 第203~252位氨基酸为穿膜和胞浆功能区。推测sla?dra蛋白中有1个camp和cgmp依赖的蛋白激酶磷酸化位点, 6个n?肉蔻酰化位点, 2个n?糖基化位点, 2个蛋白激酶c磷酸化位点, 1个酪蛋白激酶ⅱ磷酸化位点。

2.3 湖南大围子猪sla?drb测序结果 测序大围子猪sla?drb基因, 结果表明: 来源于两个不同个体的sla?drb基因序列是一致的, 其cdna 全长为909 bp, 包含一个完整的开放阅读框, 大小为801 bp, 推测编码266个氨基酸。生物信息分析发现, sla?drb蛋白序列第1~29 位氨基酸为信号肽, 第30~123 位氨基酸为α1 功能区, 第124~217 位氨基酸为α2 功能区, 第218~266位氨基酸为穿膜和胞质功能区。推测sla?drb蛋白包括3个n?肉蔻酰化位点, 1个n?糖基化位点, 3个蛋白激酶c磷酸化位点, 1个酪蛋白激酶ⅱ磷酸化位点。

2.4 湖南大围子猪sla?dr与人类相应hla?dr同源性比较 大围子猪sla?dra与人类的hla? dra(bc071659)相比较, 在核苷酸水平同源性为88%, 编码的氨基酸序列同源性为82%。sla dr α链与人cd4 分子结合部位介于第124至136位氨基酸, 大围子猪sla?dra在此结合区域与人类相应的dra存在两个氨基酸差异, 即: 第127 位(vallle), 第136位(thrser)(图2)。

大围子猪sla?drb与人类的hla?drb*09012(ay622551)相比较, 在核苷酸水平同源性为82%, 编码的氨基酸序列同源性为73%。sla dr β 链与人cd4 分子结合部位位于第134至148位氨基酸, 大围子猪sla?drb在此结合区域与人类相应的drb相比氨基酸序列源性为100%(图3)。

2.5 湖南大围子猪sla?dr基因与genbank里其它猪种序列同源性比较 大围子猪与nih小型猪d单倍型(m93028)、 湖南沙子岭猪(ef143987) sla?dra编码的氨基酸同源性为100%, 与genbank里已发表的其它猪种的相应基因比较, 同源性高达99%以上。大围子猪sla?drb基因与genbank登录的许多猪种核苷酸和氨基酸序列同源性分别是93%~95%, 89%~95%, 并根据氨基酸比较结果建立种系进化树(图4)。

3 讨论

免疫排斥反应仍是目前异种移植面临的最大难题, 其中供受体组织相容性是研究异种移植排斥反应的关键问题。因此, 组织相容性复合物即白细胞抗原是筛选供体时必须考虑的因素。异种猪抗原(主要是猪白细胞抗原sla)是引起异种移植t淋巴细胞介导的急性细胞性排斥反应的主要遗传因素[2]。sla被人t淋巴细胞识别存在直接识别和间接识别途径[3]。在直接识别途径中, 猪sla?ⅱ类抗原经自身抗原提呈细胞(apc)处理, 提呈给人cd4+t辅助细胞参与免疫排斥反应。人t细胞对猪异种抗原的间接识别是指猪的异种抗原以外源性蛋白质抗原的方式为人apc摄取、 加工后, 引起人特异性cd4+ t细胞的激活与效应。在异种移植细胞性排斥反应中, 异种抗原被人t细胞识别到底哪种识别途径占优势目前尚不清楚。andres等[5]认为在异种胰岛移植中, 种系差异越小直接识别途径占优势, 种系差异越大、 间接识别途径占优势。因此, 对sla?ⅱ类基因的深入研究将有助于猪人异种器官移植的供受体配型选择, 有助于攻克异种移植排斥反应, 筛选异种移植供体。

目前, 国内外都积极致力于研究各猪种的sla, 筛选异种移植供体, 更好的为异种移植应用于临床服务。国外对yucatan小型猪[6]、 westran猪[7]等, 国内对中国西双版纳微型猪[8]、 湖南沙子岭猪[9]、 广西猪、 贵州香猪、 云南小耳猪[10, 11]等猪种作为研究模型, 通过克隆、 测序分析sla基因, 研究sla在异种移植排斥反应的发生机制中的作用。吴群等[12]对中国海南五指山猪进行研究, 指出五指山猪种在与人类mhc遗传基因水平相似性方面有一定优势; 在与人cd4相结合部位, 五指山猪sla?drb参与结合的关键氨基酸残基与人类完全相同, 并且通过基因工程对五指山猪sla?dra分子两个不同的氨基酸残基进行必要的修饰和改造, 使其成为理想的异种移植供体。

湖南大围子猪是湖南省著名的地方优良猪种, 具有繁殖力强、 抗逆性强、 耐粗饲、 肉质好、 生长慢、 饲料效率高等种质性状。本研究首次克隆湖南大围子猪的sla?dra和sla?drb序列。sla位于猪的第七号染色体, 由i类、 ⅱ类和ⅲ类3个基因簇组成。sla?i类基因和sla?ⅲ类基位于7号染色体的短臂, sla?ⅱ类基因则位于染色体长臂上。研究表明: sla?ⅱ类抗原的基因主要有β链基因和α链基因两种, 分别编码sla?i类抗原的β肽链和α肽链。编码sla?ⅱ类抗原β链的基因座sla?dr和sla?dq已被证明存在显著的等位基因多态性, 而这种多态性与sla?ⅱ类抗原的生物学特性又是密切相关。生物信息分析发现, sla?dra基因为高度保守序列, 各猪种间dra基因同源性高达99%以上, 而sla?drb基因在各猪种间具有丰富的多态性, 这一结论与文献报道一致。

大围子猪sla?dra 和sla?drb 与人类相应的dra、 drb相比, 氨基酸同源性分别为82%和73%。人cd4分子在排斥反应中发挥重要作用, sla dr α链与人cd4 分子结合部位介于第124~136 位氨基酸, 大围子猪sla?dra在该结合区域与人类相应的dra存在两个氨基酸差异, 即: 第127 位(lleval), 第136 位(serthr); sla dr β链与人cd4 分子结合部位位于第134至148位氨基酸, 大围子猪sla?drb在该结合区域与人类相应的drb相比氨基酸序列同源性为100%。该结果说明, 湖南大围子猪sla?dr基因与人的相应基因组织相容性较好, 可在异种移植排斥反应中以直接识别途径即人cd4+t细胞直接识别猪细胞表面的sla?ⅱ分子。

总之, 通过本研究首次成功克隆了湖南大围子猪sla?dra 和sla?drb基因序列, 发现该猪种与人类相应的dra和drb有高度同源性, 在免疫学特性方面具有一定的优势, 提示该猪种可作为异种移植侯选供体。

【参考文献】

[1] kazuhiko yamada, adam griesemer, masayoshi okumi. pigs as xenogeneic donors[j]. transplantation reviews, 2005, 19(3): 164-177.

[2] sprangers b, waer m, billiau ad. xenotransplantation: where are we in 2008?[j]. kidney international, 2008, 74(1): 14-21.

[3] vincenzo mirenda, dela golshayan, joseph read, et al. achieving permanent survival of islet xeno?grafts by independent manipulation of direct and indirect t?cell responses[j]. diabetes, 2005, 54: 1048-1055.

[4] 李幼平, 何秋明, 蔡绍晖, 等. 异种移植与中国地方猪种资源的利用[j]. 中国修复重建外科杂志, 1998, 13(1): 43-46.

[5] andres a, toso c, morel p, et al. phylogenetic disparity influences the predominance of direct over indirect pathway of antigen presentation in islet xenotransplantation[j]. transplantation proceedings, 2005, 37(1): 463-465.

[6] smith m, martens w, ho s, et al. dna sequence based typing of swine leukocyte antigens in yucatan miniature pigs[j]. xenotransplantation, 2005, 12(6): 481-488.

[7] lee jh, simond d, walters s, et al. characterization of the swine major histocom patibility complex alleles at eight loci in westran pigs[j]. xenotransplantation, 2005, 12(4): 303-307.

[8] 曾 嵘, 苗永旺, 霍金龙, 等. 微型猪近交系133家系sla?dq cdna的克隆和序列分析[j]. 中国实验动物学报, 2005, 13 (4): 215-221.