HI,欢迎来到学术之家股权代码  102064
0
首页 精品范文 古籍数字化

古籍数字化

时间:2023-05-30 09:28:12

开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇古籍数字化,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。

古籍数字化

第1篇

【关键词】 中医古籍数字化;古籍数据库

中医古籍是中医药学传承和发展的载体,既具有重要的学术价值,又具有相当的文物价值。最新出版的《中国中医古籍总目》共收录中医古籍13 455种,基本上反映了当前我国中医古籍的存世和分布现状。如何在保护的基础上更好地利用这些珍贵的中医药资源是中医药研究人员的历史使命。通过数字化处理,既实现了对中医古籍的永久保存,又可为方便、快捷、无损地开发和利用这些宝贵资源搭建起研究平台。中国中医科学院中医药信息研究所自2002年始,对馆藏中医典籍进行了数字化再生性保护和利用研究,目前,已建成“中医药珍善本古籍多媒体数据库”、“中医药古籍资源数据库”,实现了部分中医古籍的数字化保护与利用。

1 “中医药古籍资源数据库”建设

1.1 研究背景

中医古籍是中华民族几千年来防病治病宝贵经验的结晶,是中华民族的优秀文化遗产。中医药古籍文献中所收载的理法方药、养生保健知识是取之不尽、用之不竭的宝库,具有极高的实用价值。古籍属于不可再生的文化资源,近年来,尽管我国加大了对于古籍的保护力度,使古籍的保存环境得到改善,但随着历史的推进,古籍还是会悄无声息、不可避免地出现损毁,乃至消亡。中医古籍整体保存环境较差,各藏馆保存条件良莠不一,中医古籍保护和传承令人担忧。

鉴于此,用数字化手段对中医古籍进行处理,既可以使中医古籍的原图原貌永久保存,又可以通过数据库和网络广泛利用,避免阅读原书对古籍造成的损伤。因此,中医古籍数字化是中医古籍保护和利用的理想方式。中国中医科学院图书馆所藏中医古籍占存世中医古籍数量的一半以上,其中中医珍善本古籍就达2万余册。中国中医科学院中医药信息研究所利用该资源优势,构建了“中医药古籍资源数据库”,现已收录1 500种中医古籍的元数据信息和其中的850种中医古籍的原文图像,已经可以通过中医古籍阅览系统实现电子阅览,为中医古籍数字化保护和利用开辟了途径。

1.2 “中医药古籍资源数据库”建库流程

1.2.1 中医古籍书目的选取

根据中医古籍的年代、版本价值、文献价值、保护等级等确定收录标准,对破损严重的珍善本古籍优先进行数字化处理。

1.2.2 数据库结构设计

考虑到对古籍的再生性保护,我们

以古籍原文图像作为主要数据来源,部分古籍实现全文本化。由于图像要求的存储空间较大,我们采用支持多媒体数据的oracle 9i数据库系统,并对系统结构进行优化,基本解决了运行速度问题。

1.2.3 元数据加工

根据古籍文献的特点,按中医古籍的分类、题名、责任者、出版年代、出版者、版本项、版式、卷数、馆藏地、书籍特征、保存状况、复制状况等进行著录,著录规则参见“我国数字图书馆标准规范建设”项目研究成果——古籍元数据著录规则(CDLS-S05-014),对收录古籍撰写提要,力求建立完整的古籍书目数据库。

1.2.4 数字化处理

包括古籍的扫描、质检、图像处理、文本录入等。为实现保存和利用双重目的,扫描时采用全彩模式,300 dpi,JPEG格式保存,按页码顺序重命名,对扫描后图像的顺序、偏斜度、完整性、清晰度进行检查,并进行纠偏、去污、裁边等处理。对部分古籍进行文本录入,实现图文对照。

1.2.5 古籍原文图像标引

采用自主开发的古籍编辑器对文中有效的检索点进行抽取和xml格式标引,如病证方药的名称、索引信息、各级标题等,力求实现图像的全文检索,避免标引过繁或过简,影响检索效果。对标引后数据进行审核。

1.2.6 数据

将图像数据、元数据、标引数据、文本数据合成、入库,形成中医古籍电子书,到阅览系统后进行数据库测试,实现中医古籍的数字化保护与利用。

1.3 采用技术

数据库采用Oracle 9i,数据搜索采用Oracle Text技术。整个系统采用基于Java的Web应用技术,结合基于J2EE的Struts 和实现数据持久化的Hibernate框架的MVC设计模式,构建了高内聚、弱藕合、可维护和可扩展的中医古籍数字化系统[1]。

2 中医古籍数字化存在的障碍

2.1 中医古籍中生僻汉字的处理

汉字从产生至今经历了漫长的演变过程,由此也产生了大量的繁简字、异体字、古今字、通假字等。中医古籍数字化过程中遇到的字体障碍有两个方面,一个是对字体的认知障碍,生僻汉字的准确录入需要很深的中医文献学功底,而对于一般的操作人员很难办到;一个是技术障碍,Unicode字符集虽然可以解决字库问题,但是很多软件不支持,常用的输入法和搜索引擎不支持大字符集,很多生僻字仍不能正确显示和检索。用造字的方法费时费力,而且很难共享和检索,生僻汉字的处理仍是中医古籍数字化过程中的一大障碍。

2.2 全国古籍数字化标准尚待建立

目前,虽然参与中医古籍数字化工作的单位较多,但几乎都处于各自为战的状态,所采取的途径多样,因此产生的数字化成果形式多样,不利于中医古籍数字化发展,也不利于中医古籍数字化资源共享。究其原因,除了缺乏统一的协调规划外,没有可参照的行业标准也是其中重要的原因。

2.3 中医古籍数字化软件有待改进

软件功能是否强大对中医古籍数字化过程和成果具有直接影响,选择合适的软件可以起到事半功倍的效果。目前,可供选择的数字化加工系统很多,扫描和图像处理技术已较为成熟。而OCR软件对古籍中部分繁体字和不规则用字的识别效果很差,辅以人工校对则需要大量的时间和人力,如何提高OCR在古籍字符识别上的准确率是古籍数字化面临的一大难题;数据加工软件在批处理、大字符集、内容管理等方面存在缺陷;检索系统如何根据中医古籍的特点提高检索速度和精准度也是值得进一步研究的问题。

2.4 古籍信息的精准检索

快速、准确地检索到所需要的内容是古籍数字化应有的基本功能,也是评价其优劣的重要指标。全文本的数字化古籍可以实现任意字符的检索,但是数据准确度小、检索噪音大的问题尚待进一步解决;图像版可以保证信息的准确无误,但在全文检索上存在一定缺陷,通过对有效检索点的标引可以在一定程度上弥补上述不足,但仍不可避免地要遗漏某些信息。由于中医古籍中病、证、方、药的同名异义、异名同义现象普遍存在,使内容的精确检索更加困难。如何建立后控词表,实现关联检索也是中医古籍数字化面临的一个难题。

2.5 研究支持功能尚不完善

研究支持功能是指能够提供有关古籍内容本身科学、准确的统计与计量信息,提供与古籍内容相关的参考数据、辅助工具,这些信息、数据或工具都是古籍内容的增值或补充[2]。中医古籍具有极高的研究价值,其研究支持功能应更强大。除常用的中医古籍研究辅助工具外,还应具有不同版本和相关数据的链接。对病、证、方、药的参考数据进行汇聚,对生僻字进行注解,建立学术论坛等,都是研究支持功能的重要组成部分,而目前的中医古籍数字化成果在此方面尚显薄弱。

2.6 深度开发不够

中医古籍数字化不应仅仅满足于对古籍的阅览和查询。古代中医药文献是一个知识宝库,在数字化的基础上挖掘古籍中的宝贵知识财富,实现知识发现和知识拓展,更好地为中医药事业的发展和人类健康服务是中医古籍数字化的最高目标。

3 中医古籍数字化建设的建议

3.1 图文关联是实现中医古籍数字化的较好方式

图文关联是将古籍文献分别存储为图像、文本两种形式。图文关联是将文本对应放在与之相匹配的图像之下,并建立索引关系,实现图文对照。此种方式可以弥补“图像”在检索和内容编辑上的不足,又可以校对“文本”的准确性,使读者既能看到原书原貌的古籍文献,又可以快速准确地查到所需要的内容。尤其对于研究者,对原始版本信息和文本的准确性要求更高,而通过图文对照便可很好地解决这一问题。

3.2 中医文献与计算机专业人员的通力协作

中医古籍数字化是古典文化与现代技术的结合,需要有精通中医古籍整理、目录学和版本学知识的人才与掌握计算机网络知识和多媒体技术的专业人员通力协作。中医古籍数字化虽属新的古籍整理方式,但仍归于中医文献整理范畴,离不开文献整理的知识。在整个过程中,中医知识不可或缺;同时,在数据处理、数据库设计、应用平台构建等方面都需要计算机专业人员参与。中医文献专家的需求和建议能指导计算机技术人员对整个系统的设计,进而改善中医古籍数字化系统的功能。上述两方面人员的深入合作是创建理想中医古籍数字化模式的前提。

3.3 重视统一标准的研究和制定

建立完整的中医古籍资源库需要全行业的合作。因此,有必要建立统一的标准,包括中医古籍的分类法、著录规则、软件和数据库的使用、数字化加工标准、加工和利用平台等。统一的标准是实现中医古籍数字化资源共享的基础,也是促进中医古籍数字化建设进程的有力保障[3]。

3.4 统一规划,共建共享

中医古籍数字化是对中华文化遗产的保护和弘扬,具有强烈的公益色彩。各单位需要在统一的协调和领导下,建立一个整体的规划。整体规划应包括数字化对象的内容,确定工作重点和合作分工,同时包括相关标准、规范的统一,而恰好这两方面问题在目前的工作中较为突出[4]。解决了这两方面问题,就避免了重复建设和资源浪费,才能实现共建共享。

4 结语

中医古籍数字化是一项长期的系统工程,需要中医药科研人员付出长期的艰辛和努力。虽然在建设过程中还有许多问题有待解决,但随着研究的深入,信息技术的飞速发展,中医古籍数据库建设和利用将呈现广阔的前景。

参考文献

[1] 符永驰,李 斌,郭敏华,等.中医古籍电子化系统的研究与实现[J].中国中医药信息杂志,2008,15(2):103-104.

[2] 李国新.中国古籍资源数字化的进展与任务[J].大学图书馆学报,2002, (1):21-26.

第2篇

关键词:数字化;古籍软件;成就;挑战

中图分类号:G250.76 文献标识码:A 文章编号:1007-9599 (2012) 13-0000-02

一、引言

自古以来,古籍是我们的祖先留给我们的最珍贵的精神财富遗产。据不完全统计,古籍的存在,有大约130,000种。他们有一部分的收集掌握在私人手中,也有一部分分布在各地的图书馆中以及国外和国内的科研院里面。在很早以前古籍整理都依赖手工,这样不仅低效、而且费力。

二、古籍数字化工程的主要成就

古籍的数字化,其实质就是怎么用数字化媒体来承载古籍。我国的古籍数字化至今已走过20多年的发展历程。它起步于20世纪80年代,发展于90年代中后期。从目前的情况下看,在国内古籍数字化的工作还是主要依赖于如社科院文献信息中心等学术型研究机构和北京大学等学校,如迪志、汉文化联盟的出版社,还有一些像北京书同文、超星等专门技术公司,以及公共图书馆(如上海图书馆、北京图书馆),并且已经有大量的优秀的成果问世。

(一)为古籍整理的检索提供了高效的工具

以《国学宝典》为例,《国学宝典》大型古籍文献数据库全文检索系统,含二千多部重要古籍文献,具有全文逐字索引、字词频统计、智能模糊查询、自动卡片生成等功能,极大地满足了科研开发和学术研究的需要,在统计分析、主题查找、古书辑佚辞书编纂、等方面具有极大的辅助作用。《国学宝典》不仅为古籍整理后研究成果的出版创造了方便条件,同时也为古籍资源整理提供了高效的工具。

(二)解决了古籍的保护与使用之间的矛盾

我国古籍是我们的前人给后人最宝贵的遗产,数量一般不会有大的增加。一直以来,我们对估计进行物理和化学保护,实行防霉、防虫等基础工作,为了保护古籍,许多古籍保存单位严格限制古籍使用这就使得书不能不使用,不能发挥它应有的作用。古籍保存是一个问题,但是数字产品却易于保存,所以只有通过将古籍制成数字产品就可以真正的达到永久保存的目的,这些史料就会被人们充分的利用和共享。

(三)目前已经完成和开发了大量的古籍数字化相关工程

在我国古籍数字化在20世纪90年代中期以后才算是真正的得到迅速的发展。当时一些比较大的商业公司、学术机构和出版单位开始对古籍的数字化产生兴趣,开始着手古籍数字化的工作,所以就开始迅速扩大古籍数字化的规模。例国学公司推出了《国学宝典》等系列产品。如北京大学图书馆推出了“秘籍琳琅”项目,北京大学“中国基本古籍库”光盘工程。该工程正式启动于1998年,共500张光盘库,分哲学、史地、艺文、综合4个子库20个大类,范围涉及先秦至民国的重要典籍1万余种,并提供多重检索功能,每种典籍有1个通行版本的全文信息,另附1-2个珍贵版本的图像数据,预计全文20亿字、版本图像2千万页。书同文公司推出的《四部丛刊》的全文检索版。中华书局正在进行的中华古籍语料库的建设。

另外还有一些个人和机构都对古籍进行了数字化工作。在整理的过程中,人们对古籍实现数字化的原则、数字化古籍资源的特征等基本问题的认识都会有一定的加深,这些个人和机构经过持续的研究和试验,对我国古籍数字化实现的一些关键性技术也做出了不少的贡献,使得估计数字化也取得了很明显进展。

三、古籍数字化工程所面临问题

在我国古籍数字化是具有很大的现实意义,在充分挖掘古籍的史料价值和文化价值的基础上,对古籍的长久保存发挥重要作用,但是也面临这很大的问题。

(一)重复建设严重

我国分散各地,并且古籍数量十分庞大。目前,我国的数字化古籍整理没有一个统一的结构,来做出一个统一的协调与指导。一般都是单独开发。而古籍数字化工作基本上处于一种缺乏宏观调控和管理的状态,古籍整理出版规划也并没有明确规定古籍数字化的规划问题,重复性建设严重。很多开发单位各自为政,也大量的造成冷门项目少有问津,热点项目重复建设。就拿《四库全书》为例,它是我国历史上规模最大的从书,单是1998年一年内就至少出现了3种不同的光盘版,这就造成了很大的浪费,很大程度上阻碍了我国古籍数字化的发展。

(二)录用字时的识别和检索问题

古籍汉字识别的规模一般是很大的,这就使得工作变得困难重重,所以专家就要对古籍汉字识别进行严格控制,对于一些大型古籍数据库,由于操作人员本身的知识水平,就很难识别古籍中的异形(体)字、俗字,不得不“照搬照画”,其结果就是大量生造的字,这不仅仅增加了检索“模糊度”,还会出现一大堆生造的繁简字、俗字、异形(体)字。这些生造的字,对资源的共享造成了很大的困难,另外还有一些制作单位,可能会因为一些识字,采取替代法来代替一些疑难字符,这就很大程度上违背了真实性。另外,从目前看来,现行的繁简字转化系统是一种单一的一对一对应关系,没有办法解决繁简字的一对多、多对一的对应关系,所以简化字对繁体字进行转化输出时出现错误或一些其他的有歧义的字。

(三)古籍数字化缺乏一定的引导

在古籍数字化迅速发展的同时,是缺乏一定的引导的,并且在数据内容、数据质量等方面也存在不足:

1.缺少复合型人才。目前看来,从事这种古籍整理工作的人才不多,尤其是不仅仅可以熟练的应用信息技术又具备很强的古籍整理知识的人才。

2.缺少统筹规划。在我国国内是缺乏一个统一的协调和指导,缺乏一个统一的机构,各个开发单位就可能做一些重复建设,这就浪费了很多的时间。

第3篇

关键词: 古籍概况古籍数字资源古籍数字化应用

随着计算机科学信息技术的发展,大多数史学研究者很自然地提出古籍数字化。以网络为主要载体,数字图书馆建设迅速发展,古籍数字资料的应用与史学研究的结合日益紧密,信息技术对人文社会科学研究的影响在向深度和广度发展,相关问题的应用与研究也越来越受到人们的重视。

一、古籍概况

中华民族创造了辉煌浩瀚的历史文化遗产,古代典籍是我国历史文化遗产最为重要的物质载体,是世界文化的重要组成部分。虽然经史研究有很多优秀遗产,但存在着范围狭窄,缺乏参考资料等积弊。针对以上缺陷,近代以来学术界编纂了多种引得、通检、索引、汇编等工具书,部分完成了索引式整理的任务,为查阅古籍提供了诸多便利。但中国历史古籍卷帙浩繁,经过系统整理的只是少数,即便已有的索引古籍,在解决具体问题时仍会有种种不便。古典整理主要包括标点、校勘、笺注等工作。史料是历史研究的基础,每一个从事史学工作的人都要搜集和积累史料,以前抄录卡片的方法基本上是按照个人的需要辑录的,难以大家共享。搜集资料的工作麻烦而又艰巨,但十分重要。而且,只有尽可能全面地占有资料,才能对所研究的问题进行科学论证,得出正确的结论。因此,我们需要应用便捷、高效、准确的检索工具为人文学术研究服务。

信息时代,数字卡片将取代传统的纸质卡片是不争的事实,数字图书馆正在迅速丰富着个人的数字藏书。古籍数字资料的搜集与整理是一个完整的过程,包括数字资料搜集范围的确定,数字资料的筛选与鉴定等[1]。利用计算机把史料的整理归类工作做好,方便广大读者,这需要史学工作者熟悉、掌握基本的计算机信息技术,便于和信息技术人员配合协作,把古籍数字资料建设和史学研究推向深入。

现阶段古籍数字资料的应用喜忧参半。一方面,信息技术的迅速发展,为古籍数字化提供了充分的技术条件。互联网提高了电子文献的检索效率,扩大了服务范围,便捷的信息传递节省了远程通信费用。另一方面,现有的网络古籍数字资料分布极不平衡,大部分网络古籍数字资料库集中在海外,我国学者在使用上存在诸多不便。

二、古籍数字资源

数字化古籍文献为史学文化研究的繁荣奠定了基础,其功能不仅在于一般的信息查询,更重要的是古籍文献中的知识发现。古籍数字化应符合国际通用标准,具有开放性,可以在网络上传输,实现信息资源共享。古籍数字化的过程,基本上可以视为文献全文数据库的生成过程。通过计算机输入一部古籍文献,就形成了无标引的全文数据库,即半结构化的数据库。[2]但其最大的缺陷就在于,半结构化的数据库不能像结构化数据库一样,由排序、筛选、分类和统计等管理过程产生再生资源,更谈不上知识发现。这远远不能发挥计算机的技术优势,也难以达到研究者的要求。因此,只有对古籍中的数据进行充分的分析和处理,制作成结构化数据库,与半结构化数据库相结合,才能满足研究者的需要。古籍数字资料搜集得方便快捷的同时,带来了新的问题。

古籍数字资料尚没有方便适用的程序和统一的方法,古籍研究者可根据自己对资料的理解和研究需要进行二次归类整理。其方式有以下几种:按性质归类,按时间顺序排比,按研究问题分组等。检索得到的数字资料可以分为两类:一是数据性资料,二是需要进行逻辑分类的文字。对数据性资料进行分析,是史学研究的重要内容。我们可通过Excel之类的电子表格软件来实现常用的数据,如平均数、近似值、时间序列、分布规律等。在古籍中的数据性资料也占有相当一部分,但更多的是文字资料。

从古籍学术研究的角度上来看,古籍中既有我们古代先贤哲人所表述的撰述,又有保存历史断片的记注。研究古代先贤的思想,首先,当然要尊重其撰述的完整性,而每当我们对其研究发现之后,往往会有新的解读,这就是史学研究的一般过程。其次,古籍研究者对文献本身的认识也是随着研究工作的深入而逐步清晰起来的,如果在大范围内进行模糊查询或渐进式查询,纸本检索工具书就不能解决。使用数字检索系统就能解决上述困难,然后再使用Word和Excel,对文字性资料进行逻辑分类,以便从中获得新的知识发现。[3]

三、古籍数字化现存的主要问题

1.技术问题

目前古籍文本输入的主要方法有两个:键盘输入,但手工作业,效率低成本高;而OCR虽然是一种较为先进的自动化信息资源输入技术,但也存在一些诸如图像质量不高,扫描速度低,识别率低等技术性问题。此外,现有的汉字识别系统多数针对简体,识别竖排繁体古籍的效果非常不理想。相对古籍中众多的繁体字、异体字、通假字、避讳字而言,计算机的文字编码不敷应用,缺字一直是古籍电子化的瓶颈。

2.人才问题

因为古籍原本都是竖排繁体字,包含大量的异体字、通假字等,没有标点符号,必须先进行整理,而古籍整理工作只能依赖于专业人员,所以古籍数字化需要一批既懂得古籍整理又精通计算机技术的人才。现状却是急需培养古籍资源数字化专门人才。

3.统筹问题

我国古籍数量庞大,往往分散各地,而国内的古籍数字化工作缺乏一个全国性的权威机构的统一指导和协调。

4.标准问题

我国急需建立规范、统一的数据库形式。没有规范的机读目录格式,数据库就无法进行交换,无法真正实现国家乃至世界范围内的资源共享,给读者的使用和研究带来极大不便。

5.经费问题

现在我国公共图书馆拥有古籍文献资料最多,但因缺少经费,无法购置必需的设备和软件,并且缺乏相关的古籍与计算机人才,无法正常开展古籍数字化工作。

四、古籍数字资源在史学领域的应用

目前,尽管许多的史学研究者对应用计算机的认识,已经有了很大的提高,但是我们应该更加努力地提高利用计算机综合分析处理文字信息的水平,丰富研究手段,积极主动地参与信息化与史学关系的方法和理论研究,深入挖掘蕴含在浩瀚古典文献中的知识宝藏。此外,历史研究是一项系统而全面的学术活动,我们在运用古籍数字资料时,要摆正系统读书和按需搜集资料之间的关系,应当对古代文献中最基本的史料有比较正确、全面的理解,在此基础上搜集资料、发现问题和研究问题。掌握和运用的电脑网络知识,充分利用信息技术和古籍全文检索料为我们带来的方便快捷,可以把大量的时间和精力投入到文献资料的考订、分析和历史问题的思考上,提高我们的研究质量和效率。总之,加快古典文献数字化进程,对于史学研究有着极其重要的意义。

参考文献:

[1]龚娅君,刘春金.中文古籍数字化建设[J].浙江大学学报:人文社科版,2006,(4):176.

第4篇

关键词:古籍保护;数据库建设;统一标准

中图分类号:G253.6 文献标识码:A

古籍是指以文字符号(含图形)方式记录的古代典籍。其载体则以纸本印刷书籍为主,也还包括了像碑刻,青铜铭文,简牍帛书等以文字为记录符号的古代文献。

从某种概念上说,古籍属于文物,但又不同于其他种类的文物。人们对古籍的利用,也就是对其的研读,是要通过翻阅的,但由此产生的二次伤害又给古籍保护带来新的难题。我们不能因噎废食,不能为了保护古籍,而将其“冷藏”不提供使用,又不能为了利用古籍,而无节制使用。面对这个两难的命题,数字化,无疑是个很好的折衷点。

1 古籍数字化相关的保护背景

古籍的重要历史文化价值,已经被全社会认可,并由政府不断出台相关的配套政策,提供古籍抢救性保护和数字化开发的政策支持。2007 年国务院办公厅《关于进一步加强古籍保护工作的意见》( [2007]6 号) ,其中第五条提出了古籍数字化的具体要求,更将古籍数字化推向了。

2011年文化部、财政部发出实施全国范围的“数字图书馆推广工程”中,古籍的数字化作为其建设的重中之重,并成为其推广的对象。截止到目前为止,古籍数字化工程已完成的重大项目包括了建成“中国基本古籍库”。

2 进一步解读古籍数字化

2.1古籍数字化的技术简介

所谓古籍全文数字化就是在保持古籍原貌的前提下,通过多媒体的图文扫描技术,提取古籍的内容,生成JPEG、TIFF等格式存储的图片,该图片文件可以直接作为源数据存储成古籍档案,也可以通过进一步的文字识别,如采用OCR技术,生成以WORD、TXT、HTML等格式文字文件,在此过程中涉及到的最基本的就是数字影像技术。这也是古籍数据库的建立的前提。我们通过现今的数据库对象处理技术,是能够给读者提供了方便快捷的界面,来进行古籍的全文搜索,全文阅读,甚至可以图文并茂,呈现出高真度的阅读体验。

2.2 古籍数字化的意义

2.2.1 从保护性开发的角度,可以避免原件丢失与损坏的风险

能保留至今的古籍大部分已是孤本,文献纸质已经脆化、图片发黄褪色,把其进行数字化转换,一方面可以通过减少与原件直接的使用接触,从而达到最大限度保护文献的目的。笔者通过与县市区图书馆的文献互助加工的工作,了解到,例如肇庆地区的高要馆,正是通过将孤本古籍进行高清度图像摄影,首先把纸质文献转化为可辨识的图像,实现了数字化的基础工作;与此同时,把原件通过恒温恒湿的冷冻技术,通过物理技术的转换,最大限度优化了文献的储存环境。

2.2.2 古籍数字化资源的直接便捷检索,利于优秀传统文化的传播

古籍文献作为一个文本化的物质文化遗产,对于现代中国社会建立一个完整系统的传统文化学习研究的体系,起到根本性的支撑作用。正是基于现代社会对数字资源的高比重需求,现代图书馆的古籍资源数字化应运而生,以便捷的全文检索为核心的古籍数字化建设,建设目的是使得有研究需求的读者人群,能最快速最直接的得到准确的“第一手”研究资料。

2.3 古籍数字化关键点

古籍数字化涉及到如下几个关键点:元数据,文献图像,全文文本等。

在数据库技术的层面上的元数据,是整个数字化物理层的基础,它以数据条的形式记录了古籍对应的特征和属性等

古籍原文图像,就是将古籍以图像形式扫描,全文录入计算机,它一定程度上规避了文本搜索的过程存在一些技术上的“失真”的情况。

全文文本就是把扫描后的图像识别转换成数字文本,它的优点在于方便检索,编辑,存储空间小。缺点是对于生僻字,繁简字,通假字,识别后的错讹率高,不方便录入。

3 国内古籍数字化现状调查与问题分析

3.1 技术实现层面上

由于考虑到研究相关技术和相关设备投入的成本过高的问题,仅仅依靠政府的投入还是无法有效推动古籍数字化的发展,因此迫切需要一些有技术实力的企业参与到该项工作中来。

由于有相关的法律法规关于版权的规定,很多拥有古籍孤本或者需要做古籍研究的学术机构,包括了上至国家图书馆,各大学图书馆,以及相关学术研究机构大部分采用与数据库出版商合作或购买的方式,主要通过租用或购买数据库产品的途径,拥有数字化古籍的使用权限。同时还可以用相对少的经费,轻松解决内容更新等等冗繁的问题。

成功的案例里就有《广东省历代方志》,广东省历代方志具体项目内容是,先通过图书馆方面内部的协调,通过总分馆之间的协调,省级馆与市级馆之间的协调,市级馆到县级馆之间的协调,全面的协调机制开始运作以后,实现了纸质珍贵孤本方志,在省级图书馆广东省立中山图书馆的总调度和统筹下,完成了纸质文献的基础收集工作,接着,就是通过图书馆方,和数字化加工商之间的协商,完成了文献每一页的图像高清度摄影工作,也就是文献原本图像化。

在这个过程中,图书馆方与数字加工商很好的协调了版权方面的问题,就图像化的原本,再加工出版成为精装版的版权归属问题已经达成了很好的共识。精装版的《广东历代方志》从明清到民国,形成一个连贯的历史发展脉络,精美的装潢,高辨识度的文字阅读效果,使得有研究需要的读者群体得到了最终的阅读需求和权益的满足。同时《广东历代方志》的数字化平台,版权的归属也是属于馆方的,这也体现了对原始资源的占有方的尊重。数字化的《广东历代方志》通过网络,可是在图书馆以外的外网直接访问,与精装版的《广东省历代方志》的阅读效果等同,这也排除了很多离图书馆相距较远的读者直接“登门”的麻烦。

3.2 技术成果背后的隐忧

3.2.1 项目形式单一,图书馆与数字开发商缺乏深层互动

业界成功的数字化古籍的案例无一不是,技术开发商和图书馆方的“无缝”对接的成果。这是一个合作而非彼此“博弈”的一个过程,作为主导方的图书馆,因其本身占有原始资源的优势,往往轻视了与数字开发商平等交流的一个合作基准。

基于以上种种因素,造成了最后资源的使用者――古籍研究的读者群的阅读质量和权益得不到保障。

比如广东省立中山图书馆的古籍的数字化阅览功能。只对持有本馆读者证的读者,在本馆范围内使用。

从一个侧面看,用户的需求还是和现在的项目开发还存有一定的差距。

3.2.2 直接经济利益驱动不足,市场不成熟,经济效益不明显

我国古籍数字化产业的特点是:在数字化开发商的前期投入研发的成本巨大,而研发资金的投入主要来自国家、和拥有古籍文献的图书馆,国内的数字化开发商由于行业形成时间比较滞后,商业的推广和营销策略跟不上市场的发展,出现了盲目的搜索用户群,往往收效欠佳,不但浪费了时间也消耗了宝贵的研发成本。

古籍数字化的研究开发、商业化应用都需要大量资金投入,而资金回收期相对较长,在很大程度上限制了我国古籍数字化的发展。

3.2.3 对从事古籍数字化的复合型人才的缺乏

在古籍数字化的过程,一项基础的关键工作是录入文本前对古籍的整理,在全国范围内,从事这方面工作的人才非常少,因其需具备的不单是古籍整理知识,更需要熟练的计算机技术。

3.2.4 涉及版权的问题

古籍数字化要解决的另一个重要问题是版权。所有的文化产品都涉及到版权,而对于古籍资源,版权归属的界定尤其困难。

比如最简单的标点整理,就牵涉到版权问题。某A方整理的版本,与某B方整理的版本,由于都基于同一文本但仅仅因为标点的差异,两者就存在版权的争议,到底是谁盗用了谁,我国版权法执行了多年,积累了不少经验,但对于这样的案例的责任追究难度还是比较罕见的高。

另外,原本文献由于盗窃的难度,责任易于认定。一旦实现了数字化,由于数字化古籍处理系统安全管理存在这样那样的漏洞,很容易数据库被恶意攻击访问,从而盗窃了相关的数字资源,用于非法的复制和使用。这样的版权的认定就增加了难度。

4 探求古籍数字化发展对策

4.1 行业内急需标准化的制定和有力度的执行

古籍数字化标准是古籍数字化建设长远持久的根本保障。在多年的数字化实践中,陆续研制并应用《古籍著录规则》、《古籍专门元数据著录规则》、《汉语文机读目录格式使用手册》等等相关标准,可参照执行。目前大部分古籍数字化标准规范已经研发完成,可直接参照执行。国家古籍保护中心组织编制了《古籍数字化工作手册》,对即将开展的珍贵古籍数字化工作进行规范。古籍数字化标准规范体系建设要以实现古籍资源的共建共享为基本目的,优先采用已经成熟的国际标准和通用规范,认真贯彻国家标准和行业标准。建立全国统一标准,包括元数据著录标准、数字化影像标准、资源格式标准、资源标引标准、数字化古籍长期保存和标准等。

4.2 古籍资源共建共享的统一平台开发方案的相关设计。

古籍数字化的目标是通过统筹规划,共同建设,使所有古籍数字化成果能够在统一平台上便捷的检索和利用,真正实现古籍资源的共建共享。

古籍数字化是通过图书馆方与数字化开发商在项目开发协议的指引下,共同开发,达到使数字化成果在一个统一的平台上方便快捷的检索的最终于目的。

而针对现今古籍处理业界各自为阵,缺乏交流的现状,在技术层面的理解是,根源在于缺少公用的计算机支撑环境,因此以上提到的古籍数字化统一平台的开发,就尤显必要。

该平台应针对不同对象,进行操作界面的切换。主要是数字化建设方,和数字化使用者之间的切换。

而对于建设者,应该具有以下具体功能:

(1)扫描录入

通过扫描将古籍以图片形式录入系统,可以随时编辑更改、放大缩小、旋转、精密打印等操作;能够对扫描图像进行数据库管理;能提供强大的OCR汉字识别软件,以便将古籍图像转化成文本。

应当由一个适用于古籍整理的汉字库,具有古籍中常见字、异体字及某些特殊用字,应有补字软件。

(3)全文检索功能

能够将普通文本文件植入检索系统中,实现主题词检索和全方位检索,并根据检索要求自动汇集成段资料。

(4)能够和互联网直接联通,满足网络交流的需要。

而对于古籍资源的使用者,也划分为两种:

一种是大众读者,由于古籍数字化成果的服务利用的公益性质,可以免费向大众读者开放的功能包括:用户检索,普通阅览等。一般的这类读者可以通过图书馆官网的统一平台,凭借自己的读者证,通过单点登录,实现无障碍阅读。

另一种是从事古籍研究工作的用户,在兼备以上大众读者的使用权限的前提下,还可以提供图像数据的下载功能。这也有赖于文献平台的技术基础,比如首先检索的技术要实现图文数据库的技术。

但由于涉及到版权的问题,在使用下载功能之前,必须获得授权许可、签署保证书。

结语

数字化古籍是现今数字化时代古籍保护上的必然选择,在有关政府,研究机构,和数据库商三方的共同努力下,建设初现规模,但距离真正实现古籍资源的共建共享的目标,还有待各界同仁的共同努力探索,完善数字化工作的制度执行体系,建设体系,共享体系和服务体系,为古籍文化传播和古籍文物保护贡献自己的力量。

参考文献

[1]杨琳.大陆古籍数字化的现状及存在的问题[D].第一届中国古籍数字化国际学术研讨会论文集.

第5篇

关键词:素质;古籍数字化;数字化进程;发展方向

我们所说的古籍数字化,也就是利用计算机技术,对古籍文献进行加工、处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中所蕴涵的极其丰富的信息资源,为古籍的深度开发打下良好的基础。目前高校古籍工作者在网络时代应该加强自己的素质修养,提高古籍工作人员的素质。以便更好地顺应古籍数字化工作的要求,重点要从以下几方面人手:

一、认识和了解古籍

古籍没有明显、固定的著录依据。普通图书翻开版权页,几乎所有的著录款项皆一目了然,而古籍往往在书名前冠上说明性文字,而且有的是用不同的书法题写书名,并在著者前加上籍贯、职官、爵位、字号等,版本式样更是风格各异,木刻、石印、抄稿本一应俱全。它涉及经史子集、天文地理、星象术数等。作为一名古籍工作人员,要想出色地做好本职工作,一方面应具有广博的知识;另一方面更要具有文字学、音韵学、版本学、目录学、考据学等方面的专业知识。要具备较强的古籍整理功底和较高的综合素质能力,要清楚中国古籍分类源流的递变脉络,了解中国古代文化的发展走向。

二、掌握古汉语知识

图书馆的古籍编目,主要是对古籍进行著录、确定版本、分类等,而这些工作往往与理解分析古籍的内容是分不开的。要想对一本古籍书有一个完整的了解,就必须能看懂古籍的序跋以及它的大致内容,如果没有一定的古汉语知识,是很难胜任这项工作的,因此掌握古汉语知识也是古籍工作人员的一项基本素质。

三、掌握古籍编目知识

一般来说,古籍编目工作可分为两个步骤:第一步是著录图书,就是按照一定的标准记录一部古籍:第二步是将著录好的卡片组织起来,使它按一定的规定组织形成为一套有逻辑性的体系,经过工作人员认真、细致的工作,在经、史、子、集、丛之下就出现了一个井然有序的系统,读者查阅起来非常方便。

四、熟悉古蒋分类

我国古籍分类虽然目前还没有一个统一的标准,但分类体系和主导思想都是基本相同的,大体分为经、史、子、集、丛五个部分。经部是指四书、五经等儒家经典和文字、音韵等方面的著作;史部是指各种体裁的历史著作;子部是指诸子百家的著作。集部是指各种体裁的文学著作;丛部是指汇集一人或多人的多种著作,用一个总名概括起来刻印出版的书。在熟悉了古籍分类的范围后,对于一些还不能定下分类的书要多查看各种工具书,看哪一种分类更为合理,千万不可妄下定论,这样会给管理工作和读者的利用带来不良的后果。

五、有良好的职业道德

作为一名古籍工作人员,对待读者要像对待朋友那样,同他们真诚交流,互通信息,尽量为他们提供有用的文献资源,注意留心读者查找的系列资料,以便日后再有读者查找该系列资料时提供快捷服务。要经常翻看藏书,熟悉了解藏书内容,这样就可以帮助读者分析、查找文献,达到古籍文献得以充分使利用的目的。

六、古藉数字化发展的展望

在古籍数字化的过程中,以下几项技术和目标将会逐步采用和实现。

一要做好古籍标准的研究和制定工作

要想建立一个完整的中国古籍数据库,使用户一上机就能纵览古籍全貌,用其所需,就要重视统一标准的研究和制定工作,因为资源库建设是依靠各单位的合作,因此必须统一标准,以保证数据库的质量和查询服务效果。

二要实现古籍数字化的标准化和规范化

可由中国图书馆学会古籍整理专业委员会牵头,以国家图书馆、上海图书馆、南京图书馆为龙头,在深入研究的基础上,确立古籍数字化的统一著录格式和标引方法。

三要培养新型的古籍研究员

第6篇

【关键词】 中医古籍;书目数据库;古籍标注

以往中医古籍整理研究采用的传统方式受到技术条件的制约,虽然在中医古籍的保存方面取得了很大成就,但是在利用方面效果并不显著。虽然目前国内对古籍数字化的研究开展了很多项目,而且诸多企业也在积极参与,但由于商业运作模式的不同,各个软件之间很难兼容,而且我们对软件只有使用权,没有修改权,这在很大程度上制约了古籍数字化、智能化的发展。目前,我们采用具有自主知识产权的古籍标注软件以及相应的器,古籍标注软件(古籍编辑器)的作用是通过在原始图像上增加一些置标信息,以便加工后的图像可以被有效地检索。它可以输出中医古籍电子书,电子书包含如下信息:置标信息,可用于全文检索和浏览;原扫描图像,可和文本信息对照使用;包括书目的元数据信息,如分类、成书年(出版年代)、作者、版本、馆藏地、内容提要、书籍特征、保管措施、复制状况等。通过使用古籍编辑器和器,不仅实现了中国中医科学院图书馆部分馆藏古籍的数字化,而且赋予了这些古籍智能化的特点。因此,通过标注,彻底改变了这些古籍的传播和使用方式,展现出了大量隐含的有用信息。由于我们对软件具有修改权,为古籍有效信息的深度发掘开拓了巨大的空间,并且为今后古籍数字化、智能化积累了一些可以借鉴的经验。

古籍标注分为语义标注和引导标注,目前我们的工作是引导标注。主要工作是抽取已经图片化古籍中隐含的有效信息,将其文本化,便于检索,有别于全文文本化。从某种意义上来讲,实际上是对古籍目录的扩充。通过对古代医籍的标注,发现了其中一些问题,并且试图找到解决问题的方法。

1 研究意义

中医药古代文献记录了中医学数千年来积累的丰富理论知识和临床经验,不仅具有珍贵的史学价值,而且具有重要的学术研究和开发利用的实用价值,因此,中医古籍在中医学的发展过程中占有极其重要的地位。中医古籍不仅在古代是中医学理论发展和实践探索的源泉和动力,而且对现代中医学的发展和实践也具有启发和指导作用。例如,获得国家科技成果奖的中药“青蒿素”的研制开发,就是受到中医古籍有关“青蒿截疟”记载的启迪。因此,加强对中医古籍内容的深入研究,将会促进中医现代化进程的发展。考虑临床医生、科研人员、医学生等在阅读古籍时确实有很多实际困难,受到时间、空间等多种因素的限制,制约了对古代医籍内容的深度开发,即使有了古籍的电子版本,解决了时间与空间的一般困难,但是要在浩如烟海的众多古籍中找到所需要的信息,仍然是很大的工作量,那么能够检索文本和图片的古籍阅读器将使这个难题迎刃而解,所以针对古籍内容有效信息的抽取将直接影响专业人员对古籍的应用,信息点的取舍直接影响检索结果,所以古籍标注标准解决得当与否决定着古籍阅览器的应用程度,长远来看,影响着专业人员对古籍的深度发掘,进而影响中医事业的健康发展。

2 遇到的问题

古籍标注质量的优劣直接影响专业读者的检索,进而影响对古籍价值的深度发掘与利用,所以探索适合中医古籍的标注标准是十分必要的。首先考虑的问题是古籍标注的深度,以“临证各科”类古籍为例,仅仅按照目录来进行有用信息的提取是远远不能满足专业检索需求的,因为许多有意义的信息点并未包含在目录中,这类书的目录仅编写到“疾病门”,而其中疾病的具体分类、症状、方剂、自拟方的加减、服药宜忌等内容同样是重要的信息点,对这些内容的取舍直接关系到标注细节问题。其次,如何规范字形也是问题之一。古籍标注的基本原则是尊重原文,但是如何处理繁体字,还有诸如通借、古今、异体等文字,对这项工作就要有一个适当的尺度。还有就是针对一些大型著作,如何处理各类“序”、“叙”、“跋”,也是需要慎重处理的问题。

3 标注方法探讨

古籍标注基本分为两大部分,一部分是古籍的自然状况,比如分类、成书年(出版年代)、作者、版本、馆藏地、内容提要、书籍特征、保管措施、复制状况等,这一部分需要专人进行标注。本文针对的主要是古籍内容的标注。

3.1 预览概况

在正式标注之前,应用读图软件对古籍进行浏览,确定书的分册情况,章节信息,有的书目还要留意其具体内容的分类,比如内科杂症类的书籍,除了内科以外,还分别列出妇科、儿科等等;“分科”之下又分“门”、“门”下列“类”,“类”中还根据辨证的差别而继续分列出“阴”、“阳”、“表”、“里”等证。为了利于划分书的清晰层次结构,要根据内容建立不同级别的文件夹,这种结构暂时命名为树状结构。根据数字序列命名,比如一级文件夹为01,二级文件夹则为001,三级文件夹为0001,以此类推,进入编辑界面后可以根据文件夹内容重新命名,但前提是这些分类不能互相跨越。举个例子,如果卷一中的“中风门”跨越到了卷二,那么将不再建下一级文件夹,文件夹仅涉及至“卷”这一级别。建好文件夹后通过“添加”直接进入编辑界面,但文件夹不能以“卷一”、“卷二”这种形式命名,转入编辑器后出现自动排序,需要人工调整,费时费力。预览的主要目的是通过浏览文献的全貌,建立清晰的目录结构,既利于掌握该书的基本结构,又加快了标注速度。需要指出的是,就目前情况而言,新建的树状结构最多不超过3级。

3.2 遵照原文

即标注的内容要符合古书的原貌,比如《孙丰年先生幼科三卷》,第一卷中有这样一页内容,“幼儿杂症说要 治幼首重望闻二诊”,标注时,这段话看作是两个特征,分别标注为“幼儿杂症说要”、“治幼首重望闻二诊”,虽然这两个特征不符合现代语义特征,但是保留了古籍的原貌;从检索角度讲,可以通过不同的检索式来控制检出数量,通过图片来补充、对照相关的内容。

3.3 优先标注的原则

在古籍标注中我们制定了标注中的优先原则。根据书名和目录,凡是目录中存在的,必须优先标注出来;凡是单独以标题形式出现的信息,必须优先标注出来。但是,特征提取如果仅仅局限于这些方面,将会遗漏很多有意义的信息,所以,虽然不以标题形式出现的、具有概括意义的词语也纳入优先标注的范畴。比如《丹溪先生医说》其中的“中风门”,“中风有汗”不是以标题形式出现,但书中还有“中风无汗”,并且有相应的方药,那么,“中风有汗”、“中风无汗”都要作为特征标示出来。优先标注的原则主要还是取决于书目的题目和分类,比如本草类的古籍,除了建立清晰的树状结构之外,主要标示出药品名称,如果该书具备功效分类,那么也要相应标出。至于医案类、杂类的标示,除了依据目录外,在选取信息特征时,要参考以下几个特性:独立性,唯一性,完整性,单一性。比如《农经酌雅》,属于本草类的杂著,其内容和作用近似于工具书,书中汇集了29种本草类书籍所记载的本草别名,没有记载功效,这种情况下只能标注本草的正名,其他一律不予标注。

就《全国中医图书联合目录》来讲,“医经”和“基础理论”属于一类,基本按照目录标注,由于这类书的主要内容都是集中论述。“诊法”与“针灸推拿”列为一类,除目录以外,还要将书内所涉及的疾病名等列出。“本草”自成一类,主要以建立树状结构为主,标注出书中所列的每一味药;如果有功效分类,也要标示;但功效分类中再次出现的中药不必标示;“伤寒金匮”与“方书”视为一类,除建立树状结构和一般标注外,增加的内容比较多,“门”、“类”以及有实义方名的方剂必须标示,同方异治、同病异方也要标注,避免漏检,但是疾病的症状、方剂的加减、无名自拟方不必做出标示。“养生”、“医案医话医论”、“医史”和综合性著作同属一类,由于体例、内容等比较繁杂,尚无规律可循。

古籍标注目前还不是全文文本化,不可能将所有信息标示出来,依据文献自身的特点、分类而有所取舍。所以,目前针对提取古籍信息这项工作,必须具体问题具体分析。

3.4 正字规范

古籍标注虽然不同于校斟学,但在实际操作中还是会遇到很多棘手的问题。在抽取有效信息点时,常常会遇到各种繁体字、区别字、异体字等古籍有的汉字现象,这一部分在概念的定义上一直是激烈争论的焦点,但如果从检索角度来讲,可以归避部分错误的出现。在提取特征信息时,尽可能使用简体字,这一点是从检索角度出发的,因为就软件本身而言,暂时不能解决繁体字和简体字互相转化的问题,所以考虑到普遍性的原则,尽可能以简体字标示,比如“鬱金”,应该标注为“郁金”,比如“芎藭”,应该标示成“川芎”,又比如“藏府”,标注为“脏腑”,“四支”标注为“四肢”,“药齐”标注为“药剂”,“文理”标注为“纹理”,“金丝艸”标注为“金丝草”。采取这种方法进行标注,还是有一些汉字无法处理,如果遇到因年代问题而丢失的文字,可以用简体版来补充;利用“逍遥笔”、“金山词霸”等软件查找生僻字,再经过正式出版的字典加以对照。上述方法都不能辨认的字,则需要专家进行校斟。所以在实际操作当中,标注者都必须建立“工作日志”,以便记录无法解决的难题,汇总后统一处理。

3.5 其它

针对大型著作中出现比较多的“序”、“叙”、“跋”,如果作者不同,直接标示,如“黄序”、“李序”;如果有时间标志,则按照“先序”、“后序”标注;如果没有任何标志,可以标注为“序一”、“序二”,其余依此类推。

4 结语

第7篇

【关键词】 中医药信息 古籍数字化 中医古籍

古籍数字化是当前中医古籍文献整理工作的热点。中医古籍传承了数千年中华医药文化,是宝贵的历史遗产。对中医古籍文献进行数字化处理,不仅可以再生性保护这些珍贵的中医古籍,而且为更加便捷地开发和利用古籍资源开辟了新的途径。

通过对目前国内外古籍数字化尤其是国内中医古籍数字化的研究与发展现状的深入研究,结合中国中医科学院中医药信息研究所近几年来在中医药珍籍秘典的整理抢救、保护及相关研究方面所取得的经验,本研究提出了一种新的中医古籍电子化系统的解决方案。旨在介绍一种实现无缺/错字、图文对照、通用性好、检索快捷方便、输入/输出灵活、读者互动交流、辅助研究性强的中医古籍电子化系统。该系统具有电子化编辑、压缩、上传、存储、图书分组管理、读者分组管理、读者-图书授权借阅、网络在线阅读、原文图像浏览、图书需求信息分析、计费电子借阅、古籍学术论坛、短信互动平台、准确快速检索等功能。其科学、便捷、安全、高效的古籍资源管理,将进一步实现古籍阅览由传统方式向电子/网络方式的重大转变。

1 系统主要功能结构

1.1 中医古籍编辑平台

中医古籍编辑平台提供对数字中医古籍的编辑处理功能。我们开发了《古籍编辑器》软件,用来对古籍图片元数据进行标注和压缩,输出电子书。

中医古籍电子书籍一般包含的信息有:①置标信息,古籍中的主要知识点,如病、证、方、药等;用于全文检索和浏览古籍图片;②原扫描图像,保待原图原貌,用于与文本信息对照使用;③书目的元数据信息,如分类、书名、成书年(出版年代)、作者、版本、馆藏地、内容提要、书籍特征、保管措施、复制状况等;④书的章节信息,用于划分清晰的书籍层次结构。

其特点主要体现在以下方面: ①古籍的卷、章、节可以灵活分级管理;②支持对图片的标记和编辑,不会改变原始图片,可以搜索图片信息和图片的标记数据;③支持缩略图方式浏览章节中的图片,支持鼠标放大/缩小图片和旋转查看,图片能自动播放和根据显示器分辨率调整大小;④依据中医古籍总目的分类标准归类书籍。

1.2 电子古籍系统

电子古籍系统用于将中医古籍编辑平台输出的电子

古籍上传、解压、导入并存贮到阅览系统中。系统会根据古籍分类信息自动归入正确的分类位置并建立索引,以树状形式展示,且在树的每个层次上显示该层次结构下的总条目数,与原有书库无缝集成。

1.3 电子古籍阅览系统

电子古籍阅览系统实现了用户在线进行图文阅览,并可以记录用户在线阅览古籍的种类和时间信息,从而分析读者对各古籍的借阅和需求信息。同时,电子古籍阅览系统具有网上计费借阅功能,以便于珍贵古籍的保护和有效利用。计费借阅方案灵活,主要有按时计费(按实际借阅时间、包月/年等)、按书籍计费、按会员级别计费、按流量计费和综合计费。

1.4 古籍信息搜索平台

搜索平台具有简单查询、组合查询和全文搜索功能。对于中医古籍涉及众多生僻字的问题,平台建立了中医古籍的繁简字体对照表,增加繁简字体关联互检功能,提高搜索准确率,同时提供基于内容的高效检索和对知识的准确挖掘功能。

1.5 学术论坛即时通讯

古籍学术论坛和即时通讯平台提供读者与读者之间、读者与中医古籍管理员之间进行互动古籍学术交流和即时通讯功能。

1.6 辅助软件操作平台

辅助软件操作平台提供了字数词频统计、历史年表、古今纪年换算、干支/公元纪年换算、六十四卦表等辅助功能,为古籍研究者对古籍数据进行多角度的分析研究提供方便,从而提高系统的实用性和友好性。

2 系统采用的主要技术

考虑到基于Java的Web应用技术的实用性、灵活性和稳定性,同时结合基于J2EE的Struts和实现数据持久化的Hibernate框架的MVC设计模式所具有的优良特点,本文采用了该架构来构建高内聚、弱耦合、可维护和可扩展的中医古籍电子化系统。数据库采用Oracle 9i,数据搜索采用Oracle Text技术。下面对其中一些关键技术予以介绍。

2.1 MVC设计模式

MVC(Model-View-Controller,模型-视图-控制器)是一种著名的用户界面软件开发设计模式,最早由Xerox在20世纪80年代为Smaltalk-80语言发展提出,后来被广泛应用于其它面向对象的编程语言中。MVC设计模式把应用程序分成了3个核心部分,将应用程序进行了分层,视图和模型通过控制器连接,从而减少了用户界面和业务逻辑之间的耦合,使程序设计更加清晰、灵活,也提高了软件的可扩展性、可维护性,克服传统Web系统的不足之处[2]。

2.2 Struts框架

Struts框架是Apache的一个开源项目,体现了MVC设计模式的特性,遵守了J2EE的Servlet、JSP等技术规范,同时根据J2EE的特点做了相应的变化和扩展,是J2EE体系架构的一种轻量级实现。作为一款优秀的Java Web应用程序的开发框架,Struts框架凭借其清晰性和灵活性,成为当前最为广泛应用的轻量级Java Web开发框架[3]。

2.3 Hibernate框架

Hibernate框架是开放源代码的对象关系映射工具(Object-Relational Mapping),是一款基于Java环境的优秀的对象持久化开发框架,根据O/R(对象/关系)映射技术思想,对JDBC进行了轻量级封装,使开发人员可以使用一种面向对象的方式来操纵和管理关系数据库,所以从技术本质上来说该框架是一种提供面向对象的数据库服务中间件[4]。

2.4 Oracle Text搜索技术

Oracle Text是一种功能强大的搜索技术,内置于Oracle数据库中,其提供的开发API使软件设计人员能轻松实现功能齐备的内容搜索应用程序,可用于搜索结构化和非结构化文档,是对SQL通配符匹配技术的补充。Oracle Text支持使用基本的布尔运算符(AND、OR、NOT、NEAR等)将多个搜索条目组合到一起,同时具有更高级的功能,如soundex和模糊搜索以及结果排序等。该技术支持数百种文件类型,包括Microsoft Office和PDF。

2.5 中医古籍中生僻汉字处理

古籍生僻汉字问题是中医古籍电子化工作的一大障碍。目前很多电子化古籍系统采用偏旁相加的方法来写,看起来非常别扭,而且如果遇到无法用偏旁相加的方法来输入的汉字,表达起来会更为麻烦。本系统通过对中医古籍电子化中遇到的生僻汉字问题进行深入研究并对生僻汉字进行分析统计后,对其进行编码、造字,建立繁简字体对照表,增加繁简字体关联互检功能,从而有效提高了搜索准确率。用户可以通过输入相近的简化字或者生僻汉字的模糊发音,即可进行生僻汉字有关的查询搜索。这种简单易用的方法实现了古籍电子化中遇到的生僻汉字的存储、检索和显示,较好地解决了古籍电子化中遇到的生僻汉字问题。

3 中医古籍电子化系统的实现

从2002年开始,中国中医科学院中医药信息研究所先后承担了科技部公益项目《1 100种中医珍籍秘典的抢救整理》、《中医药珍贵典籍的保护技术及相关问题研究》的工作,已初步建立起中医古籍电子化系统。通过自主开发的《古籍编辑器》、《古籍系统》,已经完成了1 500种中医古籍的书目元数据信息编辑工作,850余种的数字中医古籍的编辑工作;建立起的中医古籍阅览管理系统,实现简单检索、组合检索、全文检索、模糊检索、精确检索,实现了用户的分级管理,图书分组管理、读者分组管理、网络在线阅读、原文图像浏览等功能。可检索信息48多万条。系统功能正在逐步的建设和完善。

在系统建设中我们也碰到很多问题,如据根项目支持的经费,我们尚不能对数字化的中医古籍全文本化,那么如何实现阅读的检索呢·我们采取了对原书图标注的方法,通过标注,基本能实现古籍中主要知识点的检索。标注的度是达到检索量的要点,标注度过细,会大量增加工作量,标注度过粗,又会遗漏主要认知点,为此我们制定了标注的基本原则。数字古籍的图像,保待了原图原貌,除海外回归古籍是缩微胶片扫描完成外,原书扫描都是彩色储存。这样就大大地增加了储存的量,使图像的处理、图像上传及网上阅读都出现了速度慢的问题,为提高检索和阅读的速度,我们对数据库结构进行了多次优化和设备功能的提升,基本上解决了速度问题。速度问题随着数据量的加大,可能还会出现。

4 小结

本研究结合中国中医科学院中医药信息研究所多年来在中医药珍籍秘典的整理抢救、保护及相关研究方面所取得的经验,提出了一种基于数据库和Web网络技术的中医古籍电子化系统的解决方案,并就解决方案设计了技术路线和系统架构。该方案已在中国中医科学院中医古籍电子化研究项目中得到了良好的应用并取得了一定成效。

随着技术的进步和人们对电子古籍阅读需求的变化,中医古籍电子化系统是在不断发展,许多问题还需进一步研究。如:古籍中同药异名、异药同名,古籍中的病证和现代病名问题,这些目前已有相关的研究成果,如何利用这些成果建立起关联词表,将为中医古籍的阅读检索提供更加便捷的支持。

电子古籍生僻汉字问题的研究。传统的计算机二字节编码技术只能处理2万多个汉字,对古籍中大量的生僻字、俗体字、异体字、通假字、避讳字无能为力。龙语瀚堂典籍数据库采用Unicode四字节编码技术解决了古籍整理和研究中生僻汉字数字化的瓶颈,完善了汉字信息网络化的平台。

提供人性化的电子中医古籍阅读方式也是一个值探讨的问题。新加坡电子书系统有限公司推出的E-Book Systems Pte.Ltd.解决方案,其用户界面将传统浏览的多媒体内容如数码相片、文字、音乐乃至动画等表现形式通过三维翻页界面以虚拟翻书页的方式呈现出来,将自然贴切的真实书本效果带入电脑及网络世界。如何将其技术应用到中医古籍电子系统中,我们还需进一步的探讨。

【参考文献】

[1] 符永驰,孙海舒,李 斌,等.多媒体技术在中医药信息工作中的应用[J].中国中医药信息杂志,2006,13(12):103-104.

[2] Steve McConnell. Code Complete[M]. Washington:Microsoft,2006. 101.

第8篇

摘要:信息化是中医药向高效、科学方向发展的必然选择,通过阐述医疗信息化、资源数字化、学术交流虚拟化,明确信息化于中医药发展

>> 我国中医药信息化建设与发展的思考 高职院校信息化建设中存在的问题与对策 浅谈渔业信息化建设中存在的问题与对策 高校档案信息化建设中存在的问题与解决对策 粮食行业会计信息化建设中存在的问题与对策 企业信息化建设中存在的问题与对策 浅谈监狱财务信息化建设中存在的问题与对策 林业信息化建设中存在的问题与对策 财务管理信息化建设中存在的问题与对策 中医药信息化建设重标准 用“标准”规范中医药信息化建设 中医药信息化建设向“标准”看齐 高等中医药教育信息化建设探析 人事档案管理信息化建设中存在问题分析与对策 中医药信息化建设机遇与挑战并存 军队审计信息化建设中存在的问题及对策 浅谈消防部队信息化建设中存在的问题及对策 企业会计信息化建设中存在的问题及对策 煤炭企业财务信息化建设中存在的问题及对策 市级国土资源信息化建设中存在的问题及对策分析 常见问题解答 当前所在位置:中国 > 政治 > 中医药信息化建设中存在的问题与对策 中医药信息化建设中存在的问题与对策 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者: 沈杰 赵兴官")

申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 摘要:信息化是中医药向高效、科学方向发展的必然选择,通过阐述医疗信息化、资源数字化、学术交流虚拟化,明确信息化于中医药发展的意义。为进一步完善中医药信息化,针对中医药信息化建设过程中存在的问题,提出了建设性措施,包括强化信息检索功能、深入规范中医药信息标准、加强中医药信息学科建设等。关键词:中医药;信息化;问题;对策doi: 10.3969/j.issn.2095-5707.2014.02.001Problems and Solutions in the Informatization Construction of Traditional Chinese MedicineShen Jie, Zhao Xingguan(Library of Zhejiang Chinese Medical University, Hangzhou Zhejiang 310053, China)Abstract: Informatization is the inevitable choice to facilitate traditional Chinese medicine to move in a direction of high efficiency and science. The article described medical treatment informatization, resource digitalization, virtualization of academic communication, with a purpose to clarify the significance of informatization to Chinese medicine. In order to tackle problems in the informatization construction of Chinese medicine, the article further proposed some solutions as follows: strengthen functions of information retrieval, perfect standards of Chinese medical information, and consolidate subject construction of Chinese medicine information sciences and so on.Key words: traditional Chinese medicine; informatization; problems; solutions 中医药是我国独具特色和优势的传统医学,积淀了数千年的理论知识和临床经验。我们需要继承珍贵的传统经验,而发展更是首要任务。在信息技术高速发展的今天,中医药信息化建设是使中医药走向现代化的必然选择。中医药信息化,能够集中整合中医药信息资源,促进信息交流和知识共享,改善中医药服务质量,推进中医药事业跨越式发展的过程。1 信息化是中医药向高效、科学方向发展的必然选择1.1 诊疗信息化――进一步提高医疗质量,满足中医药服务需求中医药是我国独具特色和优势的传统医学。病历中会记录望、闻、问、切的四诊、辨病辨证、中医处方、中医诊断等具有中医特色的内容,以往这些病历信息都是靠医生书写记录,由于字迹的辨识、保存不便等障碍,造成了珍贵经验流传中断。根据扩展标记语言(XML)技术,设计开发出的中医电子病历系统,不仅给医生的诊治提供了便利,还升级了病历信息的基金项目:浙江省科技厅公益技术研究社会发展项目(2013C33045)第一作者:沈杰,馆员,研究方向:图书情报信息。E-mail: 统计保存。同时对中医病历进行了结构化的处理[1],如将24个节气、各种舌色、舌苔、舌形、脉象等通过下拉列表形式加以提供,可以让医生快速完成病历,而且电子存档的诊疗数据可以实时检索,使得典型病例的用药方案等信息可以随时被查询借鉴,挖掘出更多的价值。还有的电子病历系统设置了用药错误提醒功能[2],能对中药方剂配伍禁忌发出即时警示,从而避免医生疏忽导致的失误发生,进一步提高了中医治疗质量。另外,信息化助推下建立的中医医疗服务平台、在线医生、专家远程网络会诊等,方便了患者异地咨询、就诊,提升了中医医疗服务水平。1.2 资源数字化――有效集中信息资源,保障资源利用充分中医药文献信息最大的特点是拥有近万种古籍,这些古籍是数千年的理论知识和临床经验的积淀,其中所蕴含的科学信息难以计量,因此,要做到资源的充分利用,就必须对海量信息进行挖掘与整合。中医古籍数字化[3]是利用数字化技术,将中医古籍进行扫描、文字识别与转换或录入,并经专门软件使之结构化,制作出新的电子版中医古籍。中医古籍数字化有效集中了具有传承性和连续性的中医药珍贵文献资源,可以通过计算机进行检索和阅读,也可以在网络上传输、共享,还解决了中医古籍保存价值与使用功能之间的矛盾。中国中医科学院中医药信息研究所自2002年开始,对馆藏中医典籍进行了数字化再生性保护和利用研究[4],目前已建成“中医药珍善本古籍多媒体数据库”、“中医药古籍资源数据库”等,实现了部分中医古籍的数字化保护与利用。中医药数据共享平台的建立,实现了各类相关中医药信息的有效整合。如国家中医药管理局网络平台上,已经建立了中医基础数据库、中医方剂应用数据库、中医药养生、北京中医药数字博物馆等的链接。1.3 学术交流虚拟化――打破地域限制,资源信息无障碍传输信息资源只有经过整合与交流,才能得到不断的扩展、延伸。“中医药虚拟研究院”[5]的建立,利用网络空间,形成跨行业、跨部门的研究组,实现了跨地域的数据库整合与学术讨论交流。“中医药虚拟研究院”人力集成虚拟化、信息网络化、研发活动并行分布化、组织结构柔性化、产权模糊化的特征,解决了中医药信息化过程中资金分散、建库无组织、研究与开发技术能力不足的状态。在该虚拟研究院提供的共建平台下,全国30余家中医药院校和研究院所的数百位中医药专业人员共同进行数据库的整合与建设,完成了中医药药理实验数据库、中医个案数据库、中药化学实验数据库、针灸临床病案数据库等。同时还建立了网上专家研讨厅系统,当专家或科研人员想就某一类科研问题进行讨论时,该系统可按需求召集相关领域的专业人员,提供网上协作环境和沟通平台。这种无地域障碍的学术交流实现了快速、便利与集中解决问题。同时,在“中医药虚拟研究院”中,集中培养了全国的中医药信息人员,通过利用虚拟研究院提供的计算机设备与网络环境,掌握了最新技术,而通过共享平台上的科研数据,又可提高自身的科研能力。2 中医药信息化建设中存在的问题2.1 中医药古籍数字化的障碍在中医古籍数字化过程中,生僻汉字的处理是一大障碍[6]。由于对字体的认知障碍,只有具备扎实的中医文献学功底才能保证生僻汉字的准确录入;另外,中医古籍数据库检索功能单一,实现精确检索成为困难。全文本的数字化古籍可以进行任意字符的检索,但是数据准确度小,检索噪音大,以任意的实义词检索,都会出现成百上千条信息,而其中大多数与用户需求无关,用户必须逐条浏览挑选才能得到所需信息,信息检索专指度差。而中医古籍中病、证、方、药的同名异义、异名同义的普遍现象[4],又使内容的精确检索更加困难。 2.2 中医药数据信息化过程中的标准问题近年来,各中医药医疗机构及研究院所组织建立了大量中医临床数据库,很大程度地促进了医疗、临床教育、科研工作的发展。然而在中医临床数据信息化过程中,却缺乏统一标准,如中医术语、方剂组成原则与变化规律、中医诊疗方案等,没有统一标准,就使得大量临床数据间互不兼容,造成数据集成效果差、不规范,形成大量分散的信息孤岛,中医临床数据资源的不合理开发和低水平重复建设对深入共享临床数据[7]、深度挖掘其中的内在价值造成了很大的阻碍。2.3 中医药信息研究领域尚缺乏统一的学科体系和学科规范中医药信息数字化及现代化的发展,离不开中医药学科知识与信息学的支撑,而仅靠单一学科的知识体系也是不能实现中医药信息化过程的,必须将两者紧密结合,相互渗透,这就需要一个交叉学科来支持中医药信息化建设。中医药信息学作为一门新兴学科应运而生,但是理论研究较为薄弱,在基本理论内涵的确定及明晰方面还存在较大争议,学科的基本框架结构也主要是基于各自的研究领域及应用需求来设计,缺乏对学科系统深入的概念内涵的研究、理论的梳理和提炼,以及理论体系结构的合理构建等[8],难以满足指导实践的需要。而中医药信息学的建立完善也体现出复合型中医药人才培养的迫切需要。3 完善中医药信息化的建设性措施3.1 强化信息检索功能,建立辅助功能平台将全文检索配合条件检索,对检索范围进行限定,限定范围包括一定的字数、类别、段落、特定作者、特定作品等,从而帮助用户快速准确获取所需资料。另外,还可将关联检索功能嵌入到全文检索的引擎中,实现简繁异体字及同义词的关联、知识工具与内容主体关联(如联机字典等)、原文图像与文本的关联等,而图文关联既可以弥补图像在检索和内容编辑上的不足,又可校对文本的准确性,使读者既能看到原书原貌的古籍文献,又可以快速准确地查到所需要的内容。另外,将中医古籍中的多内容分解成多个具有独立意义的信息单元并加以多级标引,并采用XML标识语言定义链接点,包括多目标链接、扩展链接等。当用户完成目标检索后想进行深入检索相关信息时,就可通过超文本链接方式汇聚发散性的相关资料,从而充分满足个性化的信息需求。建立基于超链接技术的阅读环境,实现中医古籍各种传本、校勘本和注释本等相关内容之间的链接,能够汇聚相关信息,使读者可以对发散性的相关资料进行对比分析和综合研究。还可以建立相关研究的辅助功能平台,提供辅助工具,如在线字典、字频统计、异体字的汇聚显示,读音的自动标注和朗读等等[7]。3.2 深入规范中医药信息标准制定中医药信息化标准规范,包括总体性和分体系标准规范。首先根据总体方案,从框架性思路出发,制定所涉及的基本术语、主题词表、标准体系、标准化指南等方面的标准。其次建立中医临床数据标准分体系,包括信息资源标准分体系、交换标准分体系、安全标准分体系及业务应用标准分体系。而信息资源标准分体系包括信息资源采集与共享,以实现不同格式、不同类型中医临床数据信息资源的加工、分类、标引、入库管理等,是整个标准体系的核心内容[8]。3.3 加强中医药信息学科建设,提升专业人才信息学素养建立、完善中医药信息学理论体系框架,包括基础理论和应用理论。基础理论包括中医药信息学的定义、内涵及外延;中医药信息学的方法论;中医药信息、知识特点。应用理论包括中医药信息获取、处理、存储和转换的技术和方法的基本原理等。框架构建过程中,首先应确定中医药信息学的基础、技术和应用各领域应该涵盖的研究内容;其次应明确定义中医药信息学特有的基本概念,深入诠释其内涵和外延,对其基本原理等也应细致的阐释。还应综述最新的中医药信息学研究成果,指导实践应用。最后,明确各部分理论的逻辑关系,深化理论体系内在结构的认识和表述,形成明晰的理论体系框架结构[9]。而对于中医药专业人才,也应对其开展继续教育,大力提升中医药信息学素养,培养一批具备中医药学、信息学知识的复合型人才,不断巩固和扩大中医药信息化高素质专业队伍[10]。参考文献[1]张湘菊,魏丹蕾.具有中医特色的整体化电子病历系统构建[J].医学信息学杂志,2011,32(4):22-24.[2]孟凡红,万芳.我国中医药信息化建设与发展[J].中国中医药信息杂志,2010,17(11):3-6.[3]符永驰,李斌,郭敏华,等.中医古籍电子化系统的研究与实现[J].中国中医药信息杂志,2008,15(2):103-104.[4]李兵,符永驰,张伟娜.白芍治疗类风湿性关节炎配伍应用古代文献分析[J].辽宁中医药大学学报,2014,16(1):132-133.[5]尹爱宁,崔蒙,范为宇,等.中医药虚拟研究院[J].国际中医中药杂志,2006,28(3):141-143.[6]吴桂英.中医古籍文献数字化建设的实践与思考[J].医学信息学杂志,2010,31(4):54-56.[7]裴丽.中医古籍信息利用障碍与数字化信息平台构建[D].黑龙江:黑龙江中医药大学,2006.[8]赵丽娜,周吉顺.中医临床数据信息化过程中的标准化问题[J].世界科学技术-中医药现代化,2011,13(4): 719-722.[9]张华敏,裘俭.浅谈中医药信息学理论体系框架结构的建构[J].中医杂志,2011,52(18):1537-1538.[10]沈绍武,肖勇,陈伟.我国中医药信息化建设与发展的思考[J].医学信息学杂志,2010,31(7):1-4.(收稿日期:2014-03-04,编辑:魏民)

第9篇

关键词:中医医院;图书馆;特色数据库;建设

一、特色数据库建设内容

1.中医药古籍数据库

中医药古籍种类多,查阅起来非常不便,采用计算机技术可以将馆藏古籍进行扫描、分类,通过文字识别与转换技术可以使一些晦涩难懂的书籍更加容易理解,辅之相应软件可以提供多种查询手段,便于网络资源共享。一般而言,中医药古籍数据库有以下几种格式。

(1)文本格式。文本格式可以直观地呈现古籍内容,全面揭示古籍重点,借助全文检索软件可以实现不同方式的检索,如,关键词检索、内容检索、条目检索等,通过不同的检索方式,读者可以快速查阅到相关古籍内容。[1]

(2)图像格式。图像格式可最大限度地保持古籍原貌,制作过程也比较简便,但是不能进行全文检索。

(3)图文关联格式。图文关联格式就是在图像存储的基础上,将古籍中具有检索价值的内容进行数字化处理,这种格式结合了文本格式和图像格式的优点,既有多重检索功能,又便于查看古籍原貌。因此,图文关联格式应当作为中医药古籍数据库的首选格式。中医药古籍不论通过何种格式数字化,均可被无限制地检索、查阅、下载、打印,其查阅率也将大幅度提高。[2]

2.中医药标本数据库

中医药标本数据库的建设目的在于全面收集中药材标本信息。中医药标本数量众多,在建设数据库之前需要参考《中华人民共和国药典》《中国植物志》《中国药材学》中的相关内容,详细论述各味药材的学名、拉丁名、别名、资源分布、用药部位、性味归经、炮制方法、药典处方等,数据库建成之后要便于从上述任意一个字段上进行检索。此外,还要提供原植物的图像信息,从而多角度、全方位地展示标本形态及理化特性。还可以借助CALIS特色软件将中药材标本的文字信息、图像资料等以规范模式录入。提供查询、检索、援引、下载功能,借助本院的中药开发等途径补充药用植物资源,为用户建立一个图文并茂、资源丰富的数据库检索系统。通过互联网检索、查询,使宝贵的中药材信息能够得到传播和利用,从而实现重要标本信息的网络资源共享。

3.中医经验案例数据库

一些名老中医的经验,是其通过多年的科研、教学、实践活动不断积累的,是中医研究领域的宝贵财富,受到诸多因素限制,一些驰名海内外的老中医的经验和实践案例未能得到系统的整理和总结。因此,可利用这些中医的经验和案例建设数据库,可以将他们多年的学术思想和治疗经验永久保存下来,给后人参考。中医经验案例数据库应当包含各位中医的生平、人物肖像、主要成就、验方、偏方及对特殊案例的分析记录等,具体建设前,要广泛搜寻有关名老中医的资料,不仅是纸质文献资料,还包括光盘、录像等,这些资料可以来自于图书馆自身馆藏,也可以来自于家属亲友及师承弟子的口述,建库前要将资料搜集妥当,避免丢失重要信息。[3]中医经验案例数据库来源广泛,可以借助计算机技术将这些信息进行汇总,形成图文并茂、具有鲜明特色的文献集合数据库。

4.中医硕博学位论文数据库

中医硕博论文是一种重要的文献来源途径,虽然国内已编制有多个硕博论文数据库,但是在收集广度和深度上还有待提升,因此,需要建立一个更加全面、权威的硕博学位论文数据库。针对浩繁的硕博论文,可以采用激光扫描转化技术,将文本资料快速输入计算机,传输过程中需要重点揭示论文特征,包括作者姓名、导师姓名、摘要、关键词等,为了保证论文收集的连续性,应当建立相应的论文呈缴制度。

二、特色数据库建设方法

1.图书馆自建

自建图书馆数据库需要依靠强大的技术支持和先进设备,如,配备一批专业的编程人员、具备扫描仪和大容量存储设备等,这种建设方法成本较高,需要医院图书馆结合自身实际量力而行。

2.委托建设

图书馆可以将数据库建设任务委托给更加专业的数字化加工公司,在委托之前,需要将全部业务信息交付给加工公司,这种建设方法可以为图书馆节省软硬件购置、人员培训、组织协调等大量的业务工作,只需要与专业公司签订委托合同即可。[4]在专业公司交付标的时,图书馆需要进行严谨的质量审查,确保数据库满足图书馆实际需求。

3.联合共建

联合共建即由某些专业公司与图书馆合作共同建设数据库,图书馆的任务是提供各种馆藏资源和文献资料,而专业公司的任务则是根据汇总信息制作数据库。这种联合共建的方式可能会出现版权争议问题,因此,选用联合共建方式之前,需要与专业公司协调好,避免出现版权纠纷。

三、注意事项

数据库建设过程中,一个不容忽视的问题就是版权问题,一些公共领域的资源和中医古籍可能不会涉及版权侵犯问题,但是一些硕博论文和中医经验在制作的过程中可能会涉及侵权问题,虽然版权法赋予图书馆一定的信息资源使用权利,但是这种使用权只能在适当范围内应用,其前提是为了满足社会公众利益,而且不能以任何方式牟利,否则就会构成侵权。图书馆在合理范围内使用信息资源,可以不征求著作权人同意,也无需支付费用,但是需要保证使用目的具有公益性。图书馆应当充分利用版权法所赋予的权利,努力开发建设不以营利为目的的特色数据库,只有这样才能使宝贵的中医信息得到资源共享。

四、应用实例

某中医医院自2008年伊始坚持开展特色数据的建设,2012年版《医学总览》的生物医学类核心期刊所占比例与2008年版相比,提高了23个百分点,《医学总览》中还收录了多种国外医学系列期刊,涉及卫生学、免疫学、生物医学工程、脑血管疾病等。此外,除了在内容上愈加丰富外,《医学总览》还增加了下载量评价指标,评价体系也更加完善。2009年黑龙江某中医医院基于对本草古籍的专项信息需求,成立专门的建设小组,对国内中医古籍的数字化整体情况进行实际调研。项目建设小组对国内现有的、具有代表性的本草古籍进行了系统收集,收录典型的本草古籍作为数字化范本,结合学科用户的需求,设计开发出了一款B/S模式的结构化数字信息系统――本草古籍数字化信息平台。该平台集阅读、检索、维护于一体,并加入了辅助利用功能,用户既可以纵观体会本草古籍研究成果,又可以横向比较现有研究热点,因此,该平台的建设为有本草古籍需求的用户提供了更加便捷的数字化检索平台。

五、小结

为建成专业、规范、系统的特色数据库,图书馆首先需要明确数据库建设内容,其次是选择建设方式,不论是数据库内容还是建设方式,都需要图书馆结合本馆的实际情况,在综合分析的基础上做出权衡,确保数据库符合本馆使用和发展需求。中医医院图书馆的特色数据库建设是一项长期工程,建成后还要经常进行维护和更新,只有这样才能保持特色数据库特有的生命力。

参考文献:

[1]周 建.中医医院图书馆信息化建设和管理探讨[J].华章,2013,19(14).

[2]许敬丽.科技兴院背景下医院图书馆建设与服务[J].医学信息学杂志,2014,35(04):80―82.

[3]朱 蓉.医院图书馆特色化建设刍议[J].医学信息学杂志,2013,34(04):70―74.

第10篇

关键词:特藏资源的著录;特藏资源的获取;服务评估

本文系华中师范大学管理类项目《高校古籍与珍贵文献的保护与利用机制研究》课题(课题编号:CCNU16ZY0015)成果之一

特藏资源的传承与收集需要我们有一定的战略眼光。特藏资源是在学校办学过程中收集起来的具有一定历史价值、文学价值的特殊馆藏资料。包括教师或社会人士捐赠的珍贵文献资料。特藏资源的种类包括:珍本古籍、名人捐赠,名家手稿或题赠、特定年代的宣传册、字画、西文文献等形式的出版物,还包括相关的数字产品和音像资料。特藏资源的建设与推广是图书馆服务中重要组成部分,我们只有结合本馆馆藏资源特点,提炼选题,并持续完善主题收藏,才形成本馆特色。

特藏资源的描述决定着资源服务的广度与深度,目前对文献的著录一般是按中图法分类著录,检索项有题名、著者、分类号、出版年、出版者、捐赠者、尺寸,开本等,用户可通过OPAC按书名或主题查找到检索结果。此类目录描述虽然对文献的主题有所提示,但检索书目呈现出来的是特藏文献与普通文献混杂。检索目录上不能体现文献的分级,用户只有一一对应才能找到特藏资源。影响了特藏资源的利用。加大对特藏文献的著录描述及内容的挖掘有利于提高其辨识度,方便读者查询,提高文献的使用率。

1 特藏资源的描述

如何加大特藏资源的识别度呢,1.我们认为有条件的图书馆可以为特藏资源做专门的平台,将资源分级标识,并在目录里将特藏文献的背景知识做链接,即有目的地录入文献所涉及的相关背景文字或视频资料,以期引发用户的阅读兴趣。在检索界面允许用户互动、纠错、提供最新进展资料及与馆员互动交流。用户可与图书馆员共同完善特藏资源的建设,加大用户的参与力度。2.特藏资源中的珍本古籍在目录中应体现其相关出版状况。近年来国家图书馆重新结集出版发行了一批善本古籍,如中华再造善本等纸质影印图书。也许我们图书馆珍藏的善本古籍也在其中,这些古籍珍本更多地作为版本价值被我们收藏。对此类古籍的著录,我们可以引入大型古籍数据库中的版本信息,如瀚堂典藏古籍数据库,该数据库对同类文献的收录有的可达六七个版本。文献的不同版本及查找方式的显现,对用户的研究有极大的帮助。就各个图书馆来说,善本古籍数量有限,我们越详细的著录,越能方便用户查阅。3.可在本馆目录里嵌入高校联合目录、全国古籍普查平台等目录检索网站,有利于用户对古籍版本及借阅地点的了解。我们还可以在目录中注明馆际合作的方式及收费标准;对免费电子书,提供链接地址在线阅读。利用社交媒体让用户可及时联系馆员,实现一站式服务。

2 特藏资源的数字化

对特藏资源的数字化建设要做好相关调查,避免出现不必要的资源重复与资源浪费。了解国家出版计划及各院校的数字化进程就显得十分重要,力争做到人无我有,各图书馆或机构数字化资源的最终目的是方便用户使用,各类提供方将来都会在一个平台上供用户使用,所以我们应有以下几条数字化建设原则:国家有计划出版的资料可后置;珍本书中书品破损程度高的要先行扫描;与本校学科关联大的特藏资料要优先扫描。这些资料一般查阅量大,数字化后有利于在教师的帮助下建成相关学科主题的资料库。另外,对一些非书资料如字画、宣传册、题赠等要进行装裱,制作成图片,再进行数字化留存。总之,在数字化进程中,图书馆是资源与用户之间的协作者,不是服务的设计者,这就要求我们强化与教师课程设计者之间的联系,征询教师与用户意见,联合开发和管理数字资源,将图书馆的教学支持服务整合进课程。加大用户的体验度与参与度,他们才是数字化资源建设的设计者。我们要促成用户愿景的实现。在特藏资源的服务上坚持数据优先。

3 特藏资源的可获取性

目前阻止用户使用特藏资源的因素有:人为的规定对用户开放的身份限制,如校内外、社会读者,馆际互借等;为保护特藏资源不能提供的服务,如复制、扫描、拍照上传远程服务等。特藏资源的服务现在多还维持在传统的到馆借阅,图书馆馆际间的特藏资源仅限于代查复印,并有严格的篇幅限制,且收费政策及收费标准不一。用户往往为查找资料不得不周旋于各个图书馆之间,用户体验感差,急需简化获取途径。文献开放获取的进程与各自图书馆的价值观有着极大的关联。有的图书馆觉得特藏资源是宝贝,不能轻易示人,有的顾虑好不容易有点特色资源拿出来后会不会影响图书馆的地位。近年来图书馆阵地正在一天天减少,我们的传统业务部分地被人取代,在这个流行跨界的时代里,我们不做就有人会替代我们做。特藏资源的开放共享是全球发展的大趋势,我们要从本校从研究者的需求出发,统筹协调本馆特藏与地区资源建设的关系,力争促进特藏资源的开放获取。在特藏数据库的建设中最好能联合多家单位共建设,如我校有关文华公书林的资源建设,在历史进程中,有武汉图书馆,湖北教育学院资料室都接收过文华图书馆的资料,只有我们团结分工才能更好理清文华图书馆的历史脉络。我们可以向WORLD DIGITAL LIBRARY 学习,淡化学校突出主题,在文献的出处标明贡献者单位名称。文献资源是人类的文化遗产,越用越能体现其价值。

4 特藏资源的推广与评估

特藏资源每每养在深闺人未识,对文献揭示不够深刻是影响其传播的一大原因,宣传力度与宣传切入点不对也会影响特藏资源的传播效果。如何让图书馆特藏资源都具有意义?我们首先提倡文献分级管理,标注,第一时间吸引用户的眼球。再者与相关院校及社会机构合作,走出去,请进来,举办相关主题的展览。我馆有什么资源不重要,重要的是我们能提供怎样的服务,通过我们的精心组织将这些尘封的历史翻开,以期引起用户的关注及兴趣,提高特藏资源的利用。其次还可利用社交媒体,更新宣传手段,尊重用户阅读习惯,重视所有形式的特色馆藏,不定期地做好资源推介。每年针对不同资源轮流展开专题推介活动。

5 特藏资源利用评估

文献满足率的评估,每年对到馆用户与网上用户的借阅、咨询做详细的登记,对用户出版文献中的参考文献进行分类检索,通过对提供文献的分类统计及定性定量分析,调整我们下一步的收藏计划,科学分配各种类型资源的购置额度,防止资源的重复建设。而今用户服务的力度不再仅取决于馆藏,资源的组织更为重要。他馆收藏也能为我所用。分清哪些资源该购买,哪些可能通过订阅或其他许可协议的方式获得是馆员下一步的工作重点,电子资源的比重将越来越大。

读者体验度的评估,图书馆的核心服务是将人们联系在一起,首先要发挥图书馆SPACE的作用,保持对用户的相关性,用户看重图书馆作为资源收集者与采购角色,在图书馆的服务工作中要引进用户意见,拓展与用户的关系,让用户参与设计流程,与用户保持动态合作交流,重视用户的体验,定期以多种形式收集他们在使用图书馆特藏资源中的意见,他们的要求是我们工作的动力,不断改进我们的服务。

项目评估,图书馆每年应尝试推进一到二个因用户需求变化而产生的新服务项目,在用户服务方面做有益的探索,如编制研究指南、配合相关课目编制学习单元材料;在特藏资源的可发现性及获取性上做有益的尝试,促进特藏资料的开放获取。

图书馆收集历史中一些有特殊意义的馆藏资料,有的还埋没在普通文献中,未有人识。我们有责任建立相关平台,针对学校历史留存的资料进行有意识地收藏与推广。特藏资源的组织是图书馆员、用户及不同机构的全面合作,是联合共建。基于技术的资源获取成为当今图书馆的重要任务,我们对特藏资源的著录描述正是为将来按主题的地区资源建设做准备。在特藏资源的使用上,图书馆员要与教师和用户合作构想,开发特藏资源的教学支持服务,开发和管理数字及其他格式的特藏资料,促进特藏资源的开放获取。

参考文献

1.高校图书馆特藏资源建设流程的再思考 张楠 宋仁君 图书馆学刊 2015.11

第11篇

关键词:海淀;国学文化;对策

中图分类号:F061.5 文献标志码:A 文章编号:1673-291X(2013)14-0084-02

党的十对加快发展文化产业,推动文化产业成为国民经济支柱性产业提出了明确要求,北京市和海淀区也先后出台了一系列支持文化产业发展的政策制度。这为国学文化产业的发展提供了条件和机会,我们要紧紧抓住这一契机,大力推动国学文化产业的发展。

一、国学时代文化发展中存在的突出问题

国学文化产业在发展中不同于其他类型企业,其产品具有独创性、高技术性和专业性,产业对社会的贡献价值周期长,对人才素质要求高,尤其是随着数字化的发展,传统文化如何运用高科技手段,发挥其更大的使用价值,越来越受到国内外的广泛关注。北京国学时代文化传播股份有限公司通过10年来的发展,虽然取得了一些成功的经验,但是也不免存在一些问题亟待解决。具体体现在以下几个方面。

1.优惠政策难以落实到位

为鼓励文化企业发展,我国从中央到地方都出台了一系列的政策,但是关于国学文化产业的政策还不够具体,执行过程中也没有明确的措施,这样就使国学文化企业很难像高科技企业一样享受到优惠政策,也难以像中小型企业一样得到政策层面的关照,以至在产品定性、产业发展、技术开发等方面尚面临不少困境。

2.国学文化企业的权益难以保障

文化创意无疑是文化产业的灵魂,也是国学文化产业的核心利益。具体而言,文化产业的创意应包含两个层面:一是文化内涵的独特性,二是文化科技的创新性。欲求产业之持续发展,必须在这两方面锐意求新。当前,中国文化产业的发展迅猛,创意也十分丰富。但同时我们也应该看到,一些文化行业模仿痕迹严重,往往拿来主义者多,而本土主义者少,表面一片繁荣,实则潜伏着断裂的危机,亟须引水归流,正本清源。海淀相当一部分国学文化公司一直致力于中国传统文化的拓展和传播,坚持从基础做起,使国学具备了深厚的学术素养和文化底蕴,独立创新了多项古籍数字化尖端技术,形成了一整套大规模古籍文献资料的数字化加工体系和集成化解决方案,已逐渐成为中国古籍数字化的学术重镇。随着成果的日益增多,海淀投入了相当多的力量用于知识产权保护,对于一些新开发的技术积极申请了专利和软件著作权。但由于电子图书研发成本很高,复制成本却很低,盗版的威胁仍然无处不在。就以普及面最广的“国学经典文库系列”为例,其盗版在网上随处可见,仅《国学备览》一种的下载量就已逾100万次。如果文化企业通过诉讼维权,不仅难度很大、成本高,时间也不可掌控。侵权事件的不断出现,侵害了文化企业的权益,挫伤了文化企业发展的积极性。

3.资金投入严重不足

虽然以国学文化企业目前的规模还远不能与那些动辄产值上百亿的企业航母相比,但是论其对文化传承的贡献和在学术界的影响力,则绝无逊色,而且还有巨大的成长空间。当前,资金投入不足是制约国学文化企业发展的一个重要因素。显而易见,无论是前期的数据整理、技术研发,还是后期的系统维护、图书出版,古籍数字化都是一个需要巨大投入和长期运作的行业,亟盼国家在政策上和资金上予以扶持与资助。但据目前情况而言,国家对于国学文化产业的重视还不够、资金投入也不十分充足。

4.从事国学文化产业的专业人才匮乏

国学文化产业专业人才短缺,与当前国学文化产业发展需求之间的矛盾日益突出。目前,国学文化传播日益升温,迫切需要一大批创意文化人才、经营管理人才、技术开发人才、市场营销人才,尤其是既懂文化又懂经营的复合型高级人才。但在现实发展中,从事文化产业的相关人员的素质远远不够,专业人才数量严重不足,结构严重失衡,这将在一定程度上制约了国学文化产业的进一步发展。

二、促进海淀区国学文化产业发展的对策

海淀区国学文化企业发展至今,积累了丰富的经验和技术,拥有了深厚的学术背景,具有一些发展潜力。从我们调查了解的情况看,海淀区国学文化产业有以下几种类型:一是以教育培训为主的国学机构,如北京大学乾元国学、北京易和书院等;二是以学术研究和出版为主的国学机构,如北京大学儒学研究院等;三是以提供国学文化产品为主的国学机构,如北京国学时代文化传播股份有限公司等。目前,海淀区有数十家有一定规模的国学文化类产业机构,不仅有专门的教育培训机构,而且有一大批热心从事国学研究发展的科技人才。海淀区应积极采取相应的措施,及时加以引导,以促进国学文化产业的跨越式发展。

1.加快国学文化产业发展的机制创新和制度创新

机制创新是国学文化产业发展的最为重要的方面,必须坚持以改革为中心按照整体推进、分步实施、突出重点的原则,改进组织机构建设。一是创新组织机构。组织机构创新是当前海淀区国学文化产业发展中的关键所在,只有从机构改革入手,进一步加强组织领导,理顺职责,形成充满活力、富有效率、更加开放的组织机构和制度安排,才能有效提高执行和落实能力,为打造具有区域影响力的文化中心奠定基础。当前,要进一步梳理政府与市场的关系,推进国学文化教育产业组织机构的规范化,解决好权责不对等的问题,发挥好政府机构与非政府组织在国学文化产业发展中的应有作用。二是在决策部署上,要按照中央和北京市的要求,制定切合实际的具体制度和措施,注重培育和繁荣国学文化市场;要更加注重国学文化产业的理论研究、政策研究和产业规划,做到着眼长远、统筹安排、突出特色。

2.加大国学文化产业知识产权的保护力度

一是国学文化产业具有专业性强、技术含量高的特点,推进海淀区国学文化产业发展,必须注重保护海淀区国学文化科研和产业研究的成果。目前,我国关于文化产业知识产权保护的法律体系建设还不完善,打击非法盗版的力度还不够。更为窘迫的是,由于常见的古籍绝大多数都已被点校出版,版权掌握在传统出版社手里。为了避免纠纷,像国学公司这样的数字出版者们只好舍近求远,翻译古本为底本,重起整理之炉灶。这极大地浪费了学术资源,且依然会面临来自传统出版社的版权质疑。当务之急,应尽快建立专门的传统文化资源开发机构,着手制定相应的古籍数字化版权保护措施,明确古籍数字出版的合法权益和自主的版本价值,推动传统出版与数字出版的对接与合作,以保证整个产业的健康发展。

二是加大出版质量监管,提高出版物质量。近年来,国家对产品质量问题非常重视,工业产品和农业产品的质量标准越来越高,食品安全更是提到了相当的高度。相对而言,作为精神食粮的纸质图书和电子图书,其质量却存在诸多问题,古籍的出版情况更令人堪忧。新闻出版总署规定,图书出版质量标准为差错率不得超过万分之一。国学公司曾抽查了个别国家一级出版社长期销售的古典文献,差错率超过国家标准一倍以上,更遑论其他普通版本。至于电子出版物,标准不明,质量监督亦无从管起。建议新闻出版总署加大出版质量监管,尽快制定电子出版物的质量标准,并建立奖优罚劣机制,大力奖励对古籍质量有突出贡献的单位和个人,扶持优秀企业研发的优质产品,并处罚出版质量不合格的出版机构。

3.加大投入,加强对国学文化产业的政策引导

一是设立专项资金支持国学文化产业的发展。国学文化企业在发展过程中难免会遇到资金不足的发展瓶颈。企业在前期的数据整理、技术研发,后期的系统维护、图书出版、古籍数字化等方面都需要巨大的资金投入,这需要政府部门的广泛重视和大力扶持。政府部门可以通过建立多元化的投融资体制,拓宽资金来源渠道。要改变主要依靠财政投入和文化企业自身积累扩大再生产的方式,运用投资控股、金融信贷、资本市场融资等手段,加快建立和发展文化产业基金组织、文化投资公司和资本市场融资等多元投资主体,尤其是民间资本的参与。

二是及时推广国学文化的优秀成果。由于受出版管理政策的限制,海淀区像国学公司这样的文化企业至今尚无图书出版权,所拥有的数千种文献只能以电子出版的形式为社会提供服务。如果能将这些成果进一步转化为纸质出版物,则将使国学公司文化产品的社会价值和经济价值大幅提升,甚至会掀起一场古籍数字化出版的巨大革命,推动数字出版产业的迅速发展。政府有关部门要关注国学文化企业这方面发展的需要,加强对国学文化产业的政策扶持,不断推进已有成果的转化。

三是适时建立国学文化产业园区,推进国学文化产业形成规模发展。借鉴中关村科技园区和国内外其他产业园区发展的经验,对海淀区域内的国学文化产业和教育培训、研究机构进行整合,使之形成产、学、研相结合的具有海淀特色的经营模式,既能够节约资源、改善产业结构,又能够优化区域发展环境。

四是加强国学文化产业专业人才队伍建设。人力资源是企业发展重要的战略资源之一。国学公司一直采取外部引进和内部培养两方面的措施,加快人力资源建设。但由于从事古籍整理工作的专业人才本来就十分稀缺,特别是既具备国学功底,又能熟练应用现代信息技术的高层次人才更为匮乏,而古籍数字化作为新兴行业,还未被纳入国家人才引进政策之内,户口、职称、廉租房等一系列问题得不到落实,导致人才供求关系隐伏矛盾,人才流失现象严重。要改变这种现状,就要在人才引进政策上有所完善。例如,分配适量的进京指标,这对于优秀人才的延揽以及整个古籍数字化产业的稳定发展,无疑都是至关重要的;重视专业性人才的培养,把国学文化专业性人才培养纳入海淀区整体的人才培养计划之列,加强对专业性人才的教育和培训;建立国学文化专业人才资源库,注重加强专业人才间的交流,通过出国考察、学习论坛、学术研讨等形式,多为专业人才间的交流搭建平台。

第12篇

[关键词]馆藏陈旧版本乐谱;数字化;共建共享

在音乐艺术院校,音乐表演与音乐研究都离不开乐谱。天津音乐学院图书馆藏有一批珍贵的陈旧版本乐谱。这批乐谱数量庞大,曲目涵盖面广,版本权威性高的,是我馆的馆藏特色文献资料,对于我院教学与科研都有着不可估量的的促进作用。所以,把这部分珍贵乐谱数字化,是我馆义不容辞的责任。截止目前,我馆已经数字化了部分馆藏陈旧版本乐谱且这项工作还在进行当中。

1.情况概述

1.1定义

文献资料数字化就是利用现代信息技术将文献资料转化为电子媒体的形式,通过光盘、网络等介质予以保存和传播。文献资料数字化是为了进一步挖掘其利用价值,从而更充分地为教学科研服务的重要手段。

1.2馆藏陈旧版本乐谱的特点

馆藏原文陈旧版本乐谱是我馆特色文献,其珍贵性主要体现在以下四方面:

(1)出版年代久远,时间集中在上世纪40-80年代;

(2)大部分为俄文原版乐谱,以俄罗斯本土作曲家作品为主,具有很高的权威性;

(3)很多乐谱在国内具有唯一性,有些乐谱在国外也很珍贵;

(4)谱曲目涵盖面广:对器乐作品、声乐作品及交响乐总谱均有涉及。

1.3数字化的重要性

当前进入数字化时代,数字化特色馆藏文献是各级图书馆的一大趋势,这也是我馆本职的工作之一。除此之外,我馆数字化这批馆藏陈旧版本乐谱还基于以下几点:

(1)我馆的这批陈旧版本乐谱存在老化、破损及散落现象很严重,如果不争取时间将其做成电子版,那么多年以后这些纸质的文献就有变成一堆纸屑的可能,现实不容乐观。

(2)由于历史原因,导致其分类方法与本馆现用分类法不统一,没有进入流通系统。

(3)由于本部分乐谱在全国来说也是相当珍贵,出于对其保护的考虑,基本不外借,使得这批乐谱大多时候深藏于书库之中,发挥不了其应用的作用。

因此,抢救这些具有珍贵价值的音乐文献是当务之急。数字化这批馆藏陈旧版本乐谱,可以有效地解决文献保存与使用之间的矛盾。

2.陈旧版本乐谱数字化的原则

陈旧版本乐谱在数字化的“整理”过程中应该贯彻什么样的原则?上世九十年代,国内有学者在总结我国古籍数字化实践经验的基础上,提出了“保真原则”和“整理原则”,这对我馆馆藏特色文献的数字化工作具有借鉴与指导意义。

“保真原则”是指数字化文献应该具有“文物存储性”,具备重现文献原貌的功能。首先,数字化后的文献要求版面齐全清晰,要反映文献每一页的真实原貌。其次,拍照/扫描的图片要完整,拍照/扫描完毕后要核对页数,不能有漏页现象。“保真原则”主要满足版本研究、书史研究、文字校勘、原件对照等特殊需要,可以认为是印刷版阶段“影印本”的数字化。

“整理原则”是指数字化的文献应该具有“资料应用性”,具有超文本浏览阅读、全文检索、研究支持等功能。

“保真原则”与“整理原则”是相辅相承的。作为数字化的陈旧版本乐谱,应在图形与文本之间建立紧密的联系,使文本显示和图形显示能够灵活切换,并且能够迅速准确地定位转换,以便于使用者做比勘对照。

3.实施策略

3.1统一的技术规范

目前,国内九大音乐院校图书馆都已经开始对本馆的特色乐谱进行数字化制作,其他综合类大学的图书馆也有数字化乐谱的的尝试。但是,各单位在数字化的工具选择、采样标准、保存格式等方面都存在不统一的情况;另外,在数据库平台的选择方面也不尽相同,无法实现共享。所以,有必要研究制定统一的建库标准,为读者提供可以共享的乐谱建设和应用平台。

3.2可靠的技术支持

陈旧版本乐谱数字化的传统步骤是:先用照相机或扫描仪把原始纸质乐谱转换为图像版,再把同一乐谱的每一个图像合成一本电子书。这种利用影像技术以图像方式存储的乐谱可以充分的保存其原貌。我国大部分图书馆对本管馆藏特色文献进行的数字化制作多采取这种方法。

计算机光学乐谱识别技术(OMR)是乐谱数字化领域的新发展。这种技术将纸质乐谱由扫描仪输入到计算机,利用图像处理、模式识别、文档图像分析等手段,把乐谱图像自动转化成通用的数字音乐格式。OMR为纸质乐谱数字化提供了一个智能、高效的新途径,在计算机音乐、数字音乐图书馆等众多领域有着广泛的应用前景。

我馆将采用传统方法与现代技术相结合的方式来数字化这批珍贵乐谱。

3.3注重资源的共建共享

信息资源的有效开发和充分利用,已经成为社会与经济发展的重要推动力和重要生产要素,正在改变着人们的生产和生活方式。我馆将利用互联网的诸多功能将陈旧版本乐谱进行数字化处理,基本步骤是:文献甄别筛选、数字化转换、数据库平台搭建、电子图书生成、文献标引、书目数据著录、资源库信息与书目信息的挂接等,制成一个比较完整的乐谱资源库。

数字化的这批乐谱资源可以被无限制的使用,不受时间和空间的限制,真正成为读者学习研究的宝贵资源,其读者群也将会进一步扩大。随着以计算机技术为核心的现代技术的发展及与图书馆工作配套的应用软件的开发,陈旧版本乐谱数据库的共建共享已经近在咫尺。

总之,馆藏陈旧版本乐谱的数字化是一项长期的、不断完善的过程,一定要在保留乐谱原貌、边制作边开放的基础上,逐步实现全文数字化。只有这样,才能将大大提高其利用效率,在保存珍贵馆藏文献与辅助音乐院校教学科研方面都起到积极的意义。

参考文献:

相关文章