时间:2022-04-24 07:58:53
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇信息计量学论文,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
〔关键词〕信息技术;文献计量学;科学计量学;信息计量学;网络计量学;替代计量学
DOI:10.3969/j.issn.1008-0821.2016.02.006
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2016)02-0032-06
〔Abstract〕Bibliometrics is finding wider and wider application and development because of information technology progress.This article explained the impacts of information technology on methods and contents of bibliometrics.The conclusions were that as being outcomes of modern information technology advances,scientometrics,informetrics,webometrics and altmetrics inherit theoretical foundations and methods and enrich the subject system of bibliometrics,and form their own unique branch characteristics.Bibliometrics in China was also deeply influenced by information technology,especially in measuring methods,studying objects,research contents and applications which have followed the international trend.However,theoretical studying was still needed to be improved and quantitative analysis in the network environment remains to be strengthened.
〔Key words〕information technology;bibliometrics;scientometrics;informetrics;webometrics;altmetrics
由于人为因素,很多文献难以定量化,特别是文献系统高度的复杂性和不稳定性,使得有效信息难以得到足够获取,也就无法揭示文献的宏观规律。信息技术的发展与进步,推动了数学计算工具和统计学的应用与发展,依赖数学工具和统计学技术的文献计量学顺势得到更快的发展与应用。因此,信息技术进步是文献计量学发展的保障。本研究以信息技术发展脉络为序,对文献计量学在不同时期和技术条件下的发展进行文献梳理和观点总结,以期理清两者的关系,并为相关研究者提供参考。
1 文献计量学的提出
1911年,俄国化学家、院士瓦尔金使用引文分析研究化学家对化学的贡献[1],被认为是文献计量学的开端。1917年文献学家科尔(Cole F.T.)和伊尔斯(Eales N.B.)使用“比较解剖学的历史――对文献的统计分析”,介绍了目前仍在沿用的书目计量技术――对出版物按出版国家和学科进行计量与分类[2]。1923年英国图书馆学家霍姆(Hulme E.W.)在科尔等人的研究基础上提出“书目统计学”[3]。1926年美国洛特卡(Lotka A.J.)论述了科学生产率的经验规律,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展的贡献[4],称为“洛特卡定律”。1934年英国著名文献学家布拉德福(Bradford B.C.)率先提出描述文献分散规律的经验定律[5]。1949年,美国哈佛大学教授齐普夫(Zipf G.K.)提出词频分布定律[6];1955年,加菲尔德(Gaifield E.)系统提出引文索引和引文技术的概念,以及检索科技文献的方法,打破分类法和主题法在检索中的垄断地位[7]。
直到1969年,英国情报学家阿伦・普里查德(Alan Britchard)才正式提出“文献计量学”(Bibliometrics)这一术语[8],标志着文献计量学的正式诞生,开始从学科角度来研究文献计量问题,并将其定义为“把数学和统计学用于图书和其他文字通讯载体的科学”[9]。随着信息技术在文献检索中的应用,以及1963年《科学引文索引》(Science Citation Index,SCI)创刊,以及《社会科学引文索引》(SSCI)和《艺术和人文科学引文索引》(A&HCI)相继在1973年和1978年出版,为文献计量研究在图书馆和情报界奠定了坚实的基础。
在此阶段,由于技术条件的限制,文献计量学的大部分工作为人工统计,研究者无法同时处理过多的数据,文献计量学的应用不太普遍。文献计量学的发展基本围绕以上几个著名的定律展开,一方面是检验、修正这些经验规律并使之完善和更加具有普遍性(即理论发展方向);另一方面是将这些规律应用于图书馆、情报机构文献管理的具体工作(即实践发展方向)。为了加速文献计量学的普及进程,1980年,国际文献联合会(FID)设立情报计量学委员会并制定近期计划,1982年,在捷克斯洛伐克召开会议研究文献计量学的课程设置。
2 现代信息技术是文献计量学赖以存在和发展的基础 文献计量学是用数学和统计学方法来定量分析一切知识载体的交叉学科。计算机的发展促进了统计方法的普遍有效应用,也使数学计算方法和手段取得突破性进展。实践证明,信息技术的飞速发展直接推动了文献计量学的发展,许多有用的技术手段和方法成为文献计量学创新的核心动力。信息技术进步对文献计量学的影响主要表现在文献计量学研究基础支撑的变化、研究方法的改进,以及文献计量学科体系的完善上。
2.1 现代信息技术的应用促进文献计量研究基础支撑的变化 随着信息技术的不断发展,文献计量学已经突破对篇、册、本为单位的文献计量,深入到文献内部知识单元和相关信息上,基础数据和技术支撑越来越丰富和多样:
2.1.1 文献资源建设
信息技术的应用,促进文献载体和传播渠道的多样化。文献资源建设促进了文献信息的收集整理以及文献数据的开发利用。在现代信息技术面前,文献资源的地域分布和院校机构的馆藏多少不是问题的关键,文献数据资源的存取利用与服务能力才是至关重要的。
2.1.2 检索语言与检索系统
文献计量的检索语言从文献分类发展到主题法、引文索引、内容分析等,检索效率和效果的提高得益于计算机技术在机器语言上的应用。从信息技术出发,网络搜索引擎提高了检索的时效性;人工语言与机器语言的结合,提高了查全率和查准率[10]。
2.1.3 软件工具与技术实现
随着计算机性能的不断改进,从数据的收集、整理到统计分析,计算机辅助文献计量分析软件与工具的出现,包括MATLAB、SAS、SPSS、EViews、Incites、JCR、DA等,使得文献计量分析的内容越来越广泛。
2.2 现代信息技术促进文献计量研究方法的改进
从最初的资料收集到数据的分析处理,现代信息技术为文献计量研究的每一阶段都提供了研究方法上完善改进的机会:从最初的文献统计扩展到数学模型分析、链接分析、系统分析、矩阵分析、网络分析等。现代信息技术使得文献计量学与计算机科学、系统学、广义信息科学等紧密联系,使得文献计量学向个性化、集成化、模型化和智能化方向发展。其应用也从原来的核心期刊评价、信息收藏管理与利用,扩大到研究科学发展特点、评价学科竞争力、预测学科发展等方面,从而迅速发展成为一门重要的应用学科。
2.3 现代信息技术促进文献计量学科体系的完善
在现代信息技术影响下,文献信息呈现多种状态与存在形式,其计量分析的研究领域和途径也发生了巨大的变化,文献计量学的传统研究领域发生重心的转移,一些新领域、新分支开始出现:科学文献评价的出现,催生了科学计量学;依托信息测度和信息论,信息计量学应时而生;网络信息资源的即时利用,产生了网络计量学;在线科研环境的出现,促进了替代计量学的出现。科学计量学、信息计量学、网络计量学和替代计量学等分支学科的出现,丰富和完善了文献计量学的学科体系(如图1所示)。
3 信息技术催生文献计量学出现众多新分支
由于文献计量学家来自情报学、图书馆学、科学学、社会学、化学、心理学、物理学、经济学等学科,信息技术进步促使“文献”概念不断扩展,国际文献计量分析迅速发展并成为图书情报领域最活跃的分支学科。“引文关系”既是文献、科学,又是情报,对引文关系的计量分析,使得利用相似信息技术的文献计量学、科学计量学和情报计量学等成为具有“相同血缘关系”的近亲,在许多方面具有相似、相近甚至完全重合的地方。作为文献计量学的新发展,它们在研究对象、研究目的等方面各有特色[11]。为此,本研究对信息技术发展催生的文献计量学各分支进行了阐释。
3.1 科学计量学
科学文献的迅速增长,使得研究者对科学进行定量研究,开创了科学计量学。1968年,苏联学者纳利莫夫和穆利钦科首次提出科学计量学(Scientometrics)术语。1978年匈牙利学者布劳温(Braun T.)创办《科学计量学》杂志,主要发表有关科学学、科学交流和科学政策的定量研究成果,探讨科学计量学的各种方法,并为科学计量学研究者提供学术交流平台。2001年温克勒(Vinkler P.)给出基础的科学计量及其学术领域的专业术语[12]。
科学计量学主要用于学术期刊影响研究、学科或机构的论文与引文分析、国家和地区研究与发展状况计量及科技政策研究、各种定律与分布的揭示等,以及对新数据库建构和数据处理方法的创新、新描述性和解释性模型建立、科研绩效评估等方面[13]。一般来说,它与文献计量学的方法非常相似,有时完全一致,但在研究对象和目的上仍有所区别。文献计量学把图书、期刊等视为正规的有形文献,主要目的是定量分析图书馆等藏书和文献服务活动,增进科学文献、科学情报和科学交流的影响力;科学计量学则分析科学情报(信息)产生、传播和利用的量的规律性,以更好地理解科学研究(作为一项社会活动)的机制[14]。科学计量学不仅可用于学科评价,也可用于经济和社会等方面的评价研究[15]。
随着信息技术的迅速发展,Internet和Intranet上的超文本链接和应用链接产生了知识地图,突破了以往只是对地理分布的知识地图界限的描述,逐渐演化为知识图谱。知识图谱理论与方法是近年来科学计量学最前沿,将应用数学、图形学、信息可视化技术及计算机科学等学科理论方法与传统科学计量学引文分析方法结合起来,用可视化图谱形象展示科学学科的结构与发展。因此,科学知识图谱是在信息技术推动下,新近发展出来的科学计量学新领域。主要用途是学术共同体及其网络研究,学科领域发展研究,研究课题的衍生、渗透与扩散,作者、机构、出版物与期刊等之间的关系等[16]。
3.2 信息计量学
随着信息技术的快速发展和信息领域研究的不断深入,信息论研究出现了回归为信息的量和质、语法和语义、传输和使用相统一的变化趋势,不仅克服了申农信息论(即狭义信息论)的局限,而且推动广义信息论的形成与发展,这为信息计量学发展提供了重要的理论支持和详尽的计量方法。信息计量学最早由德国学者昂托・纳克(Otto Nacke)在1979年提出,他呼吁将数学方法用于测度信息现象,提出信息计量学是与信息科学有关的信息测度科学,并不断宣传术语Informetrics。同时,信息科学家说服国际文献联合会设立“信息计量学委员会”,拟定一个长期的信息计量学教学与研究工作计划。1988年布鲁克斯提出用信息计量学(Informetrics)代替文献计量学(Bibliometrics),原因是文献计量学仅拘泥于“数目的计量”,已不适用于现代电子化载体文献的计量。我国最初在1981年将Informetrics译为情报计量学,1992年才将其改译为“信息计量学”。
信息计量学有广义和狭义之分,“广义信息计量学”主要探讨以广义信息论为基础的广义信息的计量问题,“狭义信息计量学”主要研究情报信息或文献情报的计量问题,即应用数学、统计学等定量方法来分析和处理信息过程中的矛盾,从定量角度分析和研究信息的动态特性并找出内在规模[17]。但目前对信息计量学的研究主要侧重于“狭义信息计量学”,还带有较浓厚的基于文献情报的文献计量学色彩。在未来的发展中,信息计量学将更加依赖现代计算技术和更深层次的数学分析,探索信息的本质以及信息计量的基本模式、方法技术、模拟验证等方面[18]。
3.3 网络计量学
随着计算机与信息科学技术如数据挖掘、信息可视化、Web2.0、云计算等发展,网络学术信息传播体系得到快速发展与完善,国内外学术期刊和专著以网络为媒介的信息传递已经成为信息交流的重要形式,使得文献计量学的测度方法、研究对象和研究内容又发生了巨大变化。1997年阿尔明(Almind T.C.)和英沃森(Ingwersen P.)描述了一系列进行Web信息分析的方法和参数,以丹麦和其他北欧国家为案例,提出信息计量方法完全可用于万维网,只不过将万维网看作引文网络,传统引文由Web页面取代,首次使用“Webometrics”并将其定义为包括所有使用信息计量和其他计量方法对网络通信有关问题的研究[19]。1998年英沃森(Ingwersen P.)提出将期刊影响因子用于网页评价,为文献计量学的经典概念和研究方法成功用于网络信息分析开创了新的研究思路[20]。2004年本杰伯恩(Bjrneborn L.)和英沃森(Ingwersen P.)构建了一个较为全面的网络计量学概念体系,标志着网络计量学开始进入发展的成熟阶段[21]。2004年,《美国信息科学技术学会学报》专门出版网络计量学专刊,2005年,《信息科学技术年评》出版了“Webometrics”专题。英国、比利时、加拿大、新西兰、荷兰等国的学者分别从不同的角度和方面推动了网络计量学的发展[22]。
从某种意义上说,网络计量学是信息计量学在网络上应用的一门学科,信息计量学构成了网络计量学的学科基础。网络计量学研究的理论问题主要是网络信息分布的集中与离散规律、著者规律、词频规律、增长和老化规律、引证规律、多媒体信息规律,以及这些规律的理论解释和数学模型研究等。其研究对象不仅包括网上信息本身,还包括网上文献、文献信息及其相关特征信息,以及网络结构单元的信息计量问题,应用范围越来越广泛。网络计量学已经引起了足够重视,且与文献计量学传统领域的联系很强,未来具有巨大的发展空间[23]。
3.4 替代计量学
随着学术出版数量和方式的增加,发现和选择最相关资源的难度越来越大。基于文献计量学的传统同行评议和引文检索,已经无法满足现代研究者的需要。利用社会媒体、追踪学术产出的在线科研环境,促进替代计量学的产生。2010年,北卡罗来纳州大学教堂山分校图书情报博士生普里姆(Priem J.)首次在Twitter上使用Altmetrics,随后在网站上发表宣言[24],正式提出“Altmetrics”术语。2011年起不仅召开研讨会,而且在社交网站上建立讨论组和发表博文,充分讨论替代计量学的理论与实践意义,以及论文层面计量、科研成果计量、科研发现计量等相关研究内容。2013年,皮沃瓦(Piwowar H.)认为替代计量学会给科研影响力带来全新的变化[25],Elsevier等机构也对替代计量学表示公开支持。到目前为止,不仅理论上对众多指标进行了有效性及关系分析,而且对Mendeley、PLOS、Peer Evaluation、CiteULike、Twitter等网站数据进行实证检验,同时,开发了ImpactFactory、TotalImpact、Altmetrics等应用平台用于搜集和分析网上各大社交网站和开放存取平台的数据,提供替代计量学指标。
替代计量学研究处在良好的开放存取和开放科学的大环境中,通过建立“研究对象”、“科学发现”等新的计量单元,采用复用率、解答问题程度、使用频率、CoRank-LinkCount、基于点击流数据知识图谱等新型计量指标,充分利用Twitter等在线科研交流网站来收集数据和分析,为替代计量提供坚实的数据源和基础,因此,替代计量的数据并不缺乏。但是,要从政策、过程、技术整体来控制数据质量仍有很大的难度。同时,尽管替代计量学有着很好的前景,仍然会受到学者遵循小数定律和注意力空间限制规律的影响,增加同行评议的复杂性[26]。替代计量的研究和发展框架已初步形成,随着新一代学者在网络环境下的成长,在线科研交流将超越线下科研交流成为主体,替代计量学的地位将日益凸显,在图书馆文献服务中的作用也会越来越强大[27]。
4 信息技术进步与中国文献计量学的发展
中国文献计量学发展相对较晚,20世纪60年代开始出现介绍国外文献计量学的论文。1964年,《综合科技动态・第二分册?"情报工作》的两篇文章翻译介绍了美国的“科学引文索引”[28-29],这是国内最早介绍文献计量学研究[30]。1979年,沈中和再次介绍了“科学引文索引”,大力提倡使用的种种好处[31];赵红州提出科学家最佳年龄定律和科学劳动智力常数,其著作《科学能力学引论》为我国科学计量学的杰出代表作品[32]。
20世纪80年代出现了介绍性和应用性论文,如刘植惠1980年撰文向国人介绍了文献计量学的研究对象(即社会实践中不断产生和利用的各种文献)和具体应用(即估测某一学科或知识领域的发展动向及其前景;探索文献资料的增长率;确定核心期刊等)[33];王崇德将文献计量与情报预测结合起来进行研究[34]。1983年胡昌平和邱均平对科技文献的分析和研究方法进行了探讨[35],并以化学文献为例进行了分析与推断[36]。邱均平对文献计量学的理论方法及应用、发展过程及术语界定[37]给出了自己的认识,并编辑了武汉大学图书情报学院教材《文献计量学》。
同时,为推动学科建设发展,《情报科学》和《情报学刊》在1980年创刊,1982年《情报学报》问世,1983年以专门介绍国外情报科学动态的《国外情报科学》编辑出版,带动了国内文献计量学的发展。总之,这一时期主要是相关专家学者向国内介绍文献计量学的相关知识和学科内容,论文数量比较少(1979-1989年有关文献计量学研究的文章仅有547篇),研究基础相当薄弱,缺乏自主性系统研究和综合性研究。
20世纪90年代以来,国内学者紧跟国外研究前沿与发展趋势,开始了相关基础理论的研究。王崇德等人在《情报理论与实践》上连续发文,对文献计量学的演变和发展进行了深入的探讨。邱均平等人对文献计量学、科学计量学、情报计量学的发展进行了介绍[38]。1995年梁立明的《科学计量学――指标・模型・应用》,1999年庞景安的《科学计量研究方法论》、罗式胜的《科学技术指标与评价方法――科学计量学应用》和娄策群的《社会科学评价的文献计量理论与方法》,以及2000年蒋国华的《科研指标与指标》是科学计量学的重要理论研究成果。1999年,徐久龄等最早向国内介绍网络计量学[39],2000年邱均平对网络计量学进行了系统、全面的研究。同时,对分析方法和应用领域的研究越来越侧重,邱均平等2008年对文献计量内容分析法进行了探讨[40],2013年蒋颖对人文社科领域的文献计量学发展进行了解读[41]。
随着信息技术主要是计算机利用及其广泛普及,我国自主开发的计算机应用系统及软硬件产品的商品化程度不断提高,计算机辅助的文献计量分析发展加速,文献计量学处于快速发展阶段。计算机辅助文献计量学研究在理论分析的基础上,着重进行计算机辅助文献计量软件的设计与开发,特别是大批数据库数字化的研究与出版,也为文献信息的自动化统计和分析提供了必要的工具和条件。目前在国内的应用与发展,主要是期刊评价、数据库的建设等。北京大学图书馆第一版《中文核心期刊要目总览》在1992年启动编制,是期刊定量评价在国内全面推进的重要标志,全面拉开国内大规模期刊定量统计与评价工作的序幕。此后,中国科学院文献情报中心推出“中国科学引文数据库(CSCD)来源期刊”,中国科学技术信息研究所出版“中国科技论文统计源期刊”,南京大学中国社会科学研究评价中心“中文社会科学引文索引(CSSCI)来源期刊”,中国社会科学院文献信息中心推出“中国人文社会科学核心期刊”,清华大学图书馆和中国学术期刊(光盘版)电子杂志社出版“中国引文数据库”等等。期刊评价是信息“膨胀”的结果和必然,随着文献计量学的发展,期刊评价更加具有国际化、信息化、网络化和自动化等特点[42]。另一重要方向是将文献计量学指标用于评价科学生产率,评价科技人才、成果质量、科研机构乃至整个国家的科技水平与影响力等,使得决策者能够进行有效的定量管理和分析[43]。
伴随着数据挖掘、可视化等信息技术的快速发展,国内文献计量学学者更加重视可视化研究与应用。陈定权、李运景等人对可视化技术与工具进行介绍[44-45],周萍等人利用国外软件和国内数据进行深入分析,使用可视化方法揭示深层内容[46]。科学知识图谱是显示科学知识的发展过程与结构关系的图形,大连理工大学对知识图谱与可视化方法进行系统研究,并出版《科学计量学知识图谱》、《科学学知识图谱》、《管理学知识图谱》、《隐性知识计量与管理》和《专利计量与专利制度》等专著。CiteSpace、Pajek等免费开放的可视化软件的广泛应用,使得文献计量分析应用越来越普遍。在高校,为了定量衡量学校教师、学生和科研人员的学术成果影响,机构知识库也在不断改进计量方法,借助替代计量学等指标进行更广范围的影响力评价。
从对1991-2000年我国文献计量学的研究论文(共2 069篇)分析来看,研究论文主要是文献或引文的统计与分析等应用领域,对于基础理论、经典定律的讨论相对较少。尽管文献计量学研究出现了新领域,如网络计量学、科学计量学等,但大量研究是对已有理论、方法的检验或简单套用,创新较少[47]。从2001-2014年的期刊论文来看,使用“篇名”或“关键词”检索出含有“文献计量”或“计量分析”的论文共1 713篇,发文量较上世纪90年代有所减少。但其新的研究领域,如科学计量学、网络计量学、信息计量学、替代计量学的文章则呈现大幅增长的趋势。
5 结 语
随着计算机与网络等信息技术水平的提高,文献统计逐渐摒弃枯燥、繁琐、低效的人工统计方法,开始实现自动化和智能化,文献计量学得以快速发展,并在信息服务中发挥越来越重要的作用。科学计量学、信息计量学、网络计量学和替代计量学是在特定信息环境和技术条件下,由文献计量学逐步演进而来,它们继承了文献计量学的理论基础和基本方法,丰富了文献计量学的学科体系,又形成了自己独特的分支学科特征。
在网络信息技术环境下,我国的文献计量学发展在短短50年时间里取得了突飞猛进的发展,文献计量学的测度方法、研究对象、研究内容以及应用范围已经发生了重大变化,但理论研究仍有待深化,对网络环境下的计量分析有待加强。可以预见,信息化和网络化是文献计量学未来发展的新趋势。随着网络信息技术的发展与进步,全球视野下的学术合作与资源共享,必将推动我国文献计量学的新发展。
参考文献
[1]王崇德.文献计量学教程[M].天津:南开大学出版社,1990:8.
[2]Cole F.J.and Eales N.B..The history of comparative anatomy.Part I-A statistical analysis of the literature[J].Science Progress,1917,11(44):578-596.
[3]Glenn R.Wittig.Statistical bibliography――A historical footnote[J].Journal of Documentation,1978,24(3):240-241.
[4]Lotka A.J..The frequency distribution of scientific productivity[J].Journal of the Washington Academy of Science,1926,16(12):317-323.
[5]Bradford S.C..Sources of information on specific subjects[J].Journal of Information Science,1985,10(4):176-180.
[6]Zipf G.K..Human behavior and the principal of least effort――An introduction to Human Ecology[M].Cambridge,Mass:Addisson Wesley,1949.
[7]Garfield E..Citation indexes for science:A new dimension in documentation through association of ideas[J].Science,1955,122(3159):108-111.
[8]Pritchard A.Statistical bibliography or bibliometrics?[J].Documentation,1969,25(4):348-349.
[9]罗式胜.文献计量学概论[M].广州:中山大学出版社,1994.
[10]李伟超.信息技术对情报学的影响与推动[J].情报科学,2007,25(2):208-232.
[11]刘廷元.文献计量学、科学计量学和信息计量学的联系与区别[J].图书与情报,1994,(1):19-24.
[12]Vinkler P..An attempt for defining some basic categories of scientometrics and classifying the indicators of evaluative scientometrics[J].Scientometrics,2001,50(3):539-544.
[13]刘国栋,罗长坤,吴培红.科学计量学的研究现状及发展趋势[J].中华医学科研管理杂志,2005,18(3):137-140.
[14]Braun T.et al.Scientometric Indicators[M].Singapore:World Scientific Publishing Co.,1985:4-6.
[15]Jochen Glser,Grit Laudel.Integrating scientometric indicators into sociological studies:methodical and methodological problems[J].Scientometrics,2001,52(3):411-434.
[16]侯海燕.基于知识图谱的科学计量学进展研究[D].大连:大连理工大学.
[17]邱均平.信息计量学(一)[J].情报理论与实践,2000,23(1):75-80.
[18]郭强,刘俊友.信息计量学导论[M].合肥:合肥工业大学出版社,2007:5-7.
[19]Almind T.C.,Ingwersen P..Informetrics analyses on the world wide web:Methodological approaches to webometrics[J].Journal of Documentation,1997,53(4):404-426.
[20]Ingwersen P..The calculation of web impact[J].Journal of Documentation,1998,54(2):236-243.
[21]Bjrneborn L.,Ingwersen P..Toward a basic framework for webometrics[J].Journal of the American Society for Information Science and Technology,2004,55(14):1216-1227.
[22]邱均平.网络计量学[M].北京:科学出版社,2010:4-13.
[23]蒋颖.1995-2004年文献计量学研究的共词分析[J].情报学报,2006,25(4):504-512.
[24]Priem J.,Taraborelli D.,Groth P.,Neylon C..Altmetrics:A manifesto[EB/OL].http:∥/manifesto,2010-10-26.
[25]Piwowar H..Altmetrics: Value all research products[J].Nature,2013,493(1):159.
[26]邱均平,余厚强.替代计量学的提出过程与研究进展[J].图书情报工作,2013,57(19):5-12.
[27]余厚强,邱均平.论替代计量学在图书馆文献服务中的应用[J].情报杂志,2014,33(9):163-167.
[28]Garfield E.科学引文索引[J].王恩光,译.综合科技动态・情报工作,1964,(5):8-13.
[29]Kpbijioba H.B..美国出版的《科学引文索引》[J].张琪玉,译.综合科技动态・情报工作,1964,(5):14-15.
[30]梁国强.国内文献计量学综述[J].科学文献信息管理,2013,(4):58-60.
[31]沈中和.新颖的《科学引文索引》[J].自然杂志,1979,2(5):322-323.
[32]赵红州.科学能力学引论[M].北京:科学出版社,1984.
[33]刘植惠.文献的定量分析研究[J].情报科学,1980,(4):7-13.
[34]王崇德.计量文献与预测情报[J].情报科学,1980,(3):43-45.
[35]胡昌平,邱均平.科技文献分析研究初探[J].情报学刊,1983,(4):104.
[36]邱均平,胡昌平.化学文献的历史发展及其趋势[J].图书情报知识,1983,(4):28-32.
[37]邱均平.关于“文献计量学”术语及其定义[J].图书情报知识,1985,(3):22-25.
[38]邱均平.文献计量学科学计量学情报计量学的发展[J].情报理论与实践,1999,22(3):217-219.
[39]徐久龄,刘春茂,刘亚轩.网络计量学的研究:情报学进展(第三卷)[M].北京:航空工业出版社,1999:78-107.
[40]邱均平,王曰芬,等.文献计量内容分析法[M].北京:国家图书馆出版社,2008:1-69.
[41]蒋颖.人文社会科学领域的文献计量学研究[M].北京:社会科学文献出版社,2013:1-20.
[42]林树文,曾润平.期刊评价的产生与我国期刊评价的发展[J].情报探索,2013,(5):43-47.
[43]曹学艳,胡文静.我国文献计量学的发展[J].图书情报工作,2004,48(2):106-111.
[44]陈定权.同引分析与可视化技术[J].情报科学,2005,23(4):532-537.
[45]李运景,侯汉清.引文分析可视化研究[J].情报学报,2007,26(2):301-308.
【摘 要 题】理论纵横
【 正 文】
20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics or Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。
1 网络信息计量学
网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。
2 链接分析法研究现状
2.1 链接分析法的内容
链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。
2.1.1 链接分析法在网络信息组织方面的作用
网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。
2.1.2 链接分析法在网络信息检索方面的作用
链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。
关键词:情报科学;载文分析;引文分析; 文献计量学
《情报科学》是教育部主管、中国科技情报学会与吉林大学共同主办,是集理论性、实践性和知识性于一体的学术性刊物,是我国情报学研究领域较具影响的专业核心期刊。先后被评为全国中文核心期刊、中国社会科学引文索引来源期刊、吉林省科技类一级期刊,并被中国学术期刊(光盘版)、中国人民大学书报资料中心等著名数据库收录。他所刊载的论文基本反映了我国情报学领域的学术水平和研究动态。本文运用文献计量学的方法,选取《情报科学》2012年(1-12)期所刊载的387(书评除外)篇学术论文为研究对象,从载文及引文两个方面进行全面细致的统计分析,并从中总结一些规律和特点,为促进图书情报学科研工作者学术交流提供参考数据。
1 载文统计分析
1.1 载文量
载文量就是某种期刊在一定时期所刊载论文数量的多少,是衡量一种学术期刊吸收和传递情报能力的主要指标[1]。一般来说,反映期刊信息含量的主要指标是期刊的载文篇数、平均每期的载文量、平均每篇文章所占篇幅页数及篇密度等。统计结果见表1。
从表1可以看出,2012年《情报科学》总页数1907页,载文量为387篇,期均发文量为32.25篇,篇均页数为4.93,篇密度为0.20。以上数据表明该刊文献数量较多,文章篇幅适中,读者获取信息量相对较高,是图书情报学科研工作者学术交流的重要学术性期刊平台。
1.2 基金论文统计
基金论文的生产力是衡量一个学科科研实力的水平、科研组织能力及学科社会地位的重要标志[2]。基金论文率,即某一刊物所载的基金论文在刊载论文总量中所占的比例。基金论文率数值的大小,可直接反映刊物吸纳基金论文的能力,同时也可从侧面间接反映刊物报道本专业领域最新研究动态的能力。期刊刊载的基金论文率高,说明期刊学术水平较高,这是评价期刊和论文质量与学术水平的重要而客观的指标之一[3]。统计结果见表2。
从表2可以看出,2012年《情报科学》所载基金论文192篇,占论文总数的49.61%,在同类期刊中处于领先地位,其中国家基金论文77篇,占论文总数的19.90%,有效地保证了《情报科学》明显的创造性和较高的学术水平。
1.3 关键词
关键词是文章检索点的入口,同时也是论文论述的核心及重点,它为研究该领域的科研工作者提供检索此文献的最便捷的路径。统计结果表明该刊2012年全年标引关键词为1468个,篇均关键词3.79个。说明该刊比较注重提示论文的主题和标引深度,为用户检索利用和文献的的开发与利用提供了重要的依据。表3列出的是使用频次前十名的关键词,从表3可以看出关键词词频最高的是图书馆和数字图书馆,这充分表明《情报科学》发表的学术论文,是以图书情报学为主的刊物。
2 引文统计分析
引文是论文的重要组成部分,它既能表明论文的科学依据和历史背景,又能显示一个学科的发展历程以及多个学科之间在内容上的联系与区别;另外,引文也能表明作者对前人成果的尊重以及在前人的研究成果之上的提高、发展与创新[4]。由此可见,引文是衡量学术期刊信息吸收能力和相互渗透能力的重要指标。本文从引文数量、引文类型、引文语种、引文年代、引文期刊和引文专著分布等方面进行统计分析。
2.1 引文量统计分析
引文量的多少,在一定程度上反映了论文作者对本学科和相关学科文献情报的了解和吸收能力。一般情况下,引文量越大,说明作者吸收文献信息的能力越强。从表4可以看出2012年《情报科学》篇均引文量13.46条,远高于我国科技期刊论文的平均引文量8.86篇[5]。这说明《情报科学》作者掌握的相关资料全面,注重科学知识的继承和发扬。
2.2 引文类型统计分析
引文类型把引文分为期刊、图书、网络、论文集、学位论文及其他(包括报纸、报告等),统计结果见表5
从表5可以看出,《情报科学》的引文主要来自期刊,占总数的68.46%,略高于联合国教科文组织的数据:学者利用信息的40%一60%来源于期刊,期刊之所以成为引文中的主要情报来源,是与其出版周期短、信息量大、内容新颖、传递速度快、出版连续和检索方便等特点分不开的,今后期刊仍将是我国图书情报学研究人员获取信息的首选情报源。随着各种文献资源开放存取的不断扩大及人们对网络资源的认可,网络信息资源的重要性日益凸现,占总数的12.00%,略高于图书。这也是图书情报学科研工作者利用和接受新事物的能力逐步增强的具体体现。
2.3 引文语种统计分析
引文语种的分布是测试期刊发文作者利用国内外文献和情报吸收能力的指标。从表6可以看出,2012年《情报科学》全年引文外文文献达35.73%,说明该刊作者注重和善于吸收国外的最新研究信息,载文具有较高的信息容量。但引文语种较单一,获取英文以外的外文专业信息不足。
2.4 引文年代统计分析
对引文年代分析可反映出文献的传播利用及老化规律,从表7可以看出,2012年《情报科学》引文高峰区在09-11年,这与国际公认的科技期刊的有效利用率的高峰期是三年的观点吻合。同时普莱斯指数在50%以上,比科技期刊各学科普赖斯指数的平均值50%高[6]。说明我国图书情报学研究人员始终站在学科发展的前沿,善于吸收和消化新知识,保证了本刊知识更新的速度,同时也说明本刊是图书情报界具有较高学术水平的代表性刊物。
2.5 引文期刊统计分析
从表8可以看出,2012年《情报科学》引用21次以上的期刊有19种,引用次数合计达1255次,占总的期刊被引次数的35.19%(1255/3566),被引最多的期刊是《情报科学》,为174次,其次是《图书情报工作》、《情报理论与实践》、《情报杂志》、《中国图书馆学报》和《情报学报》,被引次数分别为165、119、105、102和94次,这六种期刊的被引次数远高于其他图书情报学刊物,说明这六种期刊是目前我国图书情报学研究人员利用的主要情报源。他们代表着我国图书情报学的研究水平和今后的发展方向,尤其是《情报科学》,被引次数最多,这肯定了其核心期刊的核心地位,同时也说明了该刊办刊比较有连续性,有自己的学术风格和专业特点。
参考文献
[1]董小燕.2003年《情报科学》载文、作者与引文的统计分析[J].情报科学,2004,22,(5):551-553.
[2]高 凡,王慧翔.我国图书馆学情报学基金论文产出力调查研究与定量分析[J].图书情报工作,2004,(10):12-16
[3]夏 旭.《图书馆论坛》基金论文产出力的定量分析[J].图书馆论坛,2006,(4):40-44
[4]董文鸳,袁顺波.2002-2004年《情报科学》载文、作者与引文统计分析[J]. 情报科学,2005,(9):1348-1352
[5]赵阳.《图书情报工作》1989-1996年载文、作者和引文的统计分析与评价[J]. 图书情报工作,1998,(9):29-36
[6]王崇德.文献计量学引论[M]. 桂林:广西师范大学出版社,1997:371.
[关键词]书评 引文分析 科研评价 亨克・莫德
[分类号]G31
科研评价是科学技术活动的重要环节之一,也是推进科学技术事业发展的必要保证。如何科学、合理、公正地对不同类型的评价对象实施鉴别、判断、排序,是一个长期困扰科学学理论与科技管理实践的难题。引文分析作为近年来蓬勃发展的科学计量学方法之一,逐渐进入到科研评价的视阈中。SCI、引文量、期刊影响因子等术语成为学术界耳熟能详的“硬通货”。但由此衍生的困惑乃至置疑之声也越发使引文分析方法处于风口浪尖之中。著名科学计量学家,1999年度科学计量学最高奖――普赖斯奖获得者,原荷兰莱顿大学EWTS教授,现受聘于爱思唯尔(Elsevier)出版集团高级学术顾问的亨克・莫德(Henk F.Moed)撰写的Citation Analysis in Research Evaluation《科研评价中的引文分析》一书,2005年由出版界巨头施普林格(springer)公司出版,2010年由中国科学技术信息研究所引入版权,并由科学技术文献出版社翻译出版。该书对于国内学术界全面了解引文分析的本质、引文指标的构建,以及引文分析在科研评价中的优缺点展开了系统深入的阐述,对于厘清当前我国学术界和科技管理实践中的某些误区,指导科学理性使用引文分析方法,具有重要的参考价值。
全书共分2大部分27章。第一部分介绍了全书的基本观点和一般结论,第二部分是关于引文分析的基本观点和结论的一些理论分析、案例举要和实证研究。全书的研究对象具有覆盖面广的特点,既关注自然科学领域的评价问题,还讨论人文科学和社会科学的引文特征;既涉及了单篇论文、期刊的评价,又探索了学科、团队等中观评价,还剖析了国家层面的科研产出及其科研合作等宏观问题。此外,秉持确定性和商讨性的态度也是本书作者的主要研究和写作风格。
作者指出,引文应用于科研评价的前提是,必须做到正式、公开、学术性。正式就是在进行引文分析之前,使被评价者和决策者明确引文分析所运用的各种指标的内涵;公开是指评价者使用的各类数据务必准确,并接收被评价者的核检;学术性是指任何评价必须要有明确的理论假设、研究路线以及对结果意义和局限性的讨论。学术质量是科研评价的中心话题之一。作者认为,“引文主义”所确立的研究质量和同行专家们所认定的学术质量都具有片面性。在引文分析与科技政策领域的关系上,引文分析毕竟属于纯学术领域,需要在理论框架下寻求适合的研究方法,而政策领域更关注的是可行性和政策相关性。作者认为,评价性的引文分析利用方式最好排除在政策领域之外。因为数据采集过程很容易出现错误,简单的统计指标容易受到较强偏态分布数据的影响。对于广为使用的期刊影响因子,作者认为,不存在一个衡量期刊绩效的完美的单一指标。某个特殊指标的有效性随使用的场合不同而变化。学科差异、引用时间窗口、期刊类型、标准化处理等都是利用影响因子必须考虑的因素。他强调,尽管影响因子存在某些局限性,但仍不失为一个较为可靠的指标。ISI收录文献的充分性越来越引起人们的关注。对来源期刊的统计发现,分子生物学、与人类相关的生物科学、化学等学科收录的期刊十分全面,数学、地球科学、工程学等相对全面,而人文与艺术、社会科学的期刊覆盖面较欠缺。对于前者,使用引文分析方法通常是恰当的,对于次者,作者建议应将非ISI来源期刊的引文补充进来,对于后者,应扩展引用文献范围,增加书籍和国际会议论文集的引文。尤其对于被分割为不同学派思想的学科领域,或者受民族和语言所阻碍的领域,不以引文分析数据为分析和评价依据可能效果更好。因此,在人文社会科学领域的绩效评价中,尤其是在定性研究主导的子学科中,尤其应慎用ISI引文索引。关于引文数据的准确性问题,如作者姓名、机构名称和子领域划分的模糊性,都会影响到结论的可靠性,作者认为,有必要运用更高级的引文数据处理。
以往在科研评价中我们有一个预设,即引文数量等同于质量。但果真如此吗?莫德大胆提出了这样一个问题:引文数量究竟测度了什么?这是一个与“科研绩效”、“学术质量”、“影响力”相关联的重要理论问题。作者在全面梳理了加菲尔德(Garfield)、斯莫尔(small)、朱克曼(Zuckerman)等人的观点基础上,认为尽管对引文的测度功能有不同的理解,但并不等于说引文分析就是缺乏理论基础的。当然,“引文主义者”的观点对探寻引文分析的学术理论基础将产生负面影响,这一点是毫无疑问的。在科研评价中运用引文分析,其目的不是要捕捉个人动机,而是要研究个体引用者共同表达其对学术活动结构和绩效的社会观点。当引文分析用于微观和中观层面评价时,可能会歪曲真实结果。即使扩大样本也不一定排除所有偏差。原则上,用学术影响来解释引用情况是行得通的,但是引用影响和学术影响的概念有时并不一致。笔者同意作者的谨慎态度,认为科研绩效是与投入产出密切相关的概念,学术质量反映学术研究成果内在的创新性,而影响力则反应了学术成果的传播和使用程度。引文数量对上述三个概念均有一定的测度功能,但更倾向于影响力测度。
尽管同行评议作为传统的被认为是有效的一种评价方法而广为使用,但是仍然受到学术权威、政治压力、思维模式的影响,使同行间达成一致意见的程度偏低。作者通过大量案例研究指出,文献计量指标应该被用作监测和研究同行评议过程的工具,并且在大多场合,同行评议和引文分析结果具有较强的统计相关性。笔者认为,在同行专家道德水准值得信赖的前提下,发挥专家主导作用并将引文分析作为辅助工具是值得尝试的。而在学术规范尚未成熟之前,将文献计量指标引入评价过程,发挥“镜子”的映射职能非常必要。
此外,在引文分析的宏观研究方面,作者也得出了一些相当有趣的结论。自20世纪八、九十年代以来,全球科技论文数量由于科学合作(共同署名)逐渐上升。这可能是受到科研评价中的“毛”数指标激励使然,当然在医学和生物学领域也可能由于受到强调在高影响因子顶级期刊发文导向发文数有所下降。通过国际科学合作,使得合作国都提高了本国的引用影响。但在双边国际合作中,强国与弱国合作从短期看可能会削弱强国的被引率。关于国家自引,作者研究发现,几乎所有国家都过度引用本国论文,因此,所谓美国学者更倾向于引用本国论文的结论缺乏实证依据。至于其他国家更多引用美国论文,可能是一种引用偏见的影响,但不必强制取缔。笔者认为,在
我国,通过与强国科研合作,可以提升我国的科研国际影响力,亦可以形成创新力强的科研团队。但是在科研评价的成果数量导向下,可能会催生大量“伪合作”,这必然会曲解科研合作的初衷。
再者,作者对发展新的引文指标提出一些设想。如探索处理合作问题、测度知识库的广度、一致性及深度指标,有意与新生科学家锻炼成长的指标,“定性的”引文分析指标等。此外,新的电子出版形式、数据库和搜索引擎,在引文分析中作为来源文献的作用将越来越重要。尽管如此,仍应注意,来源文献的多样化并不支持学者对知识进步所做的贡献越大这一结论。
最后,本书再次强调,政策制定者和公众对学术质量信息的需求是合理的,但叙述学术质量不像其他社会领域的绩效那样可以直接测度,单靠文献和引文排名,并不足以反映各评价对象间的关系,以及这些关系是如何影响个体对象的绩效。
总结本书得出的基本观点主要有:学术研究质量有一定的客观性,但是引文测度的并不完全是实际的质量;引文评价和科技政策的价值取向不同;引文分析应用于科研评价时,数据的透明性和文献计量学者的中立性是必要的;引文分析方法更适合宏观层次评价,与同行评议方法各有利弊。
总之,这部著作为我们提供了使用引文分析方法应用于科研评价的富有启发性的思路。对于解决我国科研评价中引文分析方法使用的越位和缺位问题,将给予极为有益的指导。
通过本书对引文分析与科研评价诸多复杂关系的系统阐述,笔者认为,引文分析在科研评价理论研究与实践应用巾的作用是毋庸置疑的。尽管已有的引文分析手段仍存在某些缺陷,但是它毕竟拓展了科研评价的视野,一定程度上克服了同行评议方法固有的封闭性和主观性带来的评价偏差,使科研评价建立在客观、公开、定量、可操作的基础上。任何一个没有偏见的学者必须承认,SCI对我国科技创新和科技事业发展的巨大推动作用。SCI本身没有错,关键是如何理解SCI及其引文分析的内涵和功能,并智慧地而不是绝对使用这些工具和方法。尤其在我国人文社会科学评价领域,反对SSCI、A&HCl的不在少数。与中国经济社会快速发展相适应,中国人文社会科学学者理应承载向国际学术界展示我国经济、社会、历史文化成果和争取对国际问题研究的话语权的责任和使命。在特定阶段,从科研管理角度适当给予激励,至少是不坏的选择。
引文分析仍有大量的理论和实证问题需要探索。从国际科学计量学界近年的研究现状以及本书观点看,引文分析要想在科研评价中有更大的作为,未来的工作主要体现在如下几方面:第一,进一步拓展引文数据库源,如Google scholar、Scopus、ScienceDirect、开放获(存)取等数据库,并检验同一指标在不同引文库的表现。对中文人文社会科学文献,建议尽快建立中国学术著作数据库。毕竟书籍是人文社会科学成果的重要载体之一,目前书籍中的引文数据尚不能准确获得。这对于全面反映评价对象科研绩效是个缺憾。第二,进一步开发和设计新的评价指标,如类H指数、特征影响因子等,并检验新指标与经典引文指标的一致性和差异性。第三,进一步探讨引文分析等科学计量方法与同行评议在科研评价中结合的机理,并提供可操作性的现实路径。第四,科学计量学者有必要向政策制定者、科研管理者、学科研究者乃至公众普及基本的引文分析理论和方法。当前实践中出现的评价争议和评价失误与使用引文数据的简单化、绝对化、过度化无不关系。欧洲科学计量学夏季学院即是一个很好的范例。
1网络信息资源老化的原因及特征
1.1网络信息资源老化的原因
网络信息资源的老化是指网络信息资源中情报的有效价值随着时间的流逝逐渐衰减,利用率逐步降低。这与传统文献的老化一样,是一种普遍存在的现象。造成网络信息资源老化的因素很多,我们大致可以将其归纳为以下几个方面:
(1)网络信息资源的增长。情报学家M.劳恩曾说过:“文献增长得越快,文献的半衰期就越短。”信息资源的增长和老化是同一事物的两个方面,它们从不同的角度反映信息资源的动态变化。众所周知,网络信息资源的增长速度极其惊人。以我国为例,据中国互联网络信息中心的统计,2002年12月31日,全国网页总数为157,091,220个,字节总数为2,877,754,095KB[1];2003年12月31日,全国网页总数为311,864,590个,字节总数为6,059,431,526KB[2];到2004年12月31日,全国网页总数就达到了650,682,300个,字节总数增长到20,537,214,718KB,与2003年相比,增幅分别为108.6%和238%[3]。
(2)网络信息资源的更新。网络信息资源的更新是指网络信息资源在载体形态、数据组织方式、网址等外在特征不变的情况下,所含知识和情报在内容上的变化。1998和1999年,Bar-Ilan和Peritz对信息计量学领域网络信息的生命周期研究表明,在6个月内近50%的网页发生了变化[4];而WallaceKoehler的观察结果更为显著,他发现97%的网站6个月内会发生变化,如观察时间为1年,则比例上升为99%。对于网页而言,这组数据分别为98.3%和99.1%[5]。应该指出的是,网络信息资源更新并没有引起网络信息资源总量的增长。
(3)网络信息资源的消失。网络信息资源的消失是指网络信息资源无论出于何种原因,被从系统中删除,不能再被访问和利用。文献[4]表明,68%的网页1年内将被从网上移除;而文献[5]发现,有12.2%的网站和20.5%的网页6个月后不能再被访问到。1年后,分别上升到17.7%和31.8%。并且,每周有0.5%的网页和网站消失。与网络信息资源的更新不同,网络信息资源的消失意味着网络信息资源总量的减少。
(4)替代性网络信息资源的出现。随着人类对客观事物和社会运动规律认识水平的提高,原有的知识不断被完善和突破。同时,由于技术的进步和社会信息需求的共同推动,网上信息的加工深度越来越大,原有的知识和情报被包含在新的知识和情报之中,因而,原来不完善、不全面的陈旧信息资源逐渐不再被利用。替代性网络信息资源的出现并不意味着原有信息资源的更新和消失,而表现为网络信息资源中,蕴含新知识和情报的信息的出现和信息总量的增长。
(5)网络信息资源的吸引力。网络信息资源的吸引力主要来自两个方面:一是网络信息资源所揭示和反映的对象所处的发展阶段。处于诞生和发展初期的事物,相关网络信息资源的数量往往呈指数增长,老化遵循负指数函数关系。进入成熟期后,信息的增长速率变小,老化曲线也变得平缓,半衰期加长。当对该事物的认识积累到一定程度,将出现质的飞跃,相关信息的增长进入新一轮的指数增长阶段,相应的,老化曲线也恢复成负指数曲线。二是网络信息资源的受关注程度。对于网络信息资源所揭示和反映的对象而言,受关注程度越高,往往意味着知识更新越快,半衰期越短,反之则越长。对于网络信息资源自身而言,其受关注程度遵循“Winnertakesall”法则,受关注程度越高的网络信息资源半衰期越短,也就是说信息更新越快,质量和数量也稳步提升。
1.2网络信息资源老化的特征
网络信息资源老化与传统文献资源老化既有相同之处,又有显著的差异,其独特之处主要表现在:
(1)非累积性。传统文献资源的重要特征之一就是其存在的永续性,即使这些载体上的知识和情报完全失去了使用价值,它也不会消失。原有信息的修正与更新、替代信息的生产以及新信息的产生必须依靠新的载体。因此,传统文献资源从数量上来说,总是不断增长的。而网络信息资源则不然。网络环境中的信息是介于产生后永续存在与即刻消失两种状态之间的第三类信息,它的更新和消亡是其存在和运动的常态。在网络环境下,新信息的出现并不一定意味着信息总量的增长,而且,相当一部分信息在丧失其使用价值之后会彻底消失,引起信息总量的减少,呈现负增长状态。所以,我们认为网络信息资源具有非累积性,这表明网络信息资源的老化研究往往只能基于特定时间点或时间段,难以系统地回溯其历史状态。
(2)动态性。动态性与非累积性是内在统一的。任何信息都是外在形态与所含内容的统一体。记录信息的载体和信息的组织方式是信息资源的外在形态,而内容,即其所蕴含的知识和情报才是核心。传统文献资源的外部形态和内容是不可分割的,因而必然具有累积性。而网络信息资源的外部形态和内容可以是相互独立的,因此,在网络信息资源载体的形态、信息组织方式、网址等保持不变的情况下,内容可以不断更新,甚至删除,这就体现为它的非累积性。众所周知,半衰期、普赖斯指数的测定都是依据特定领域文献资源的被利用情况,而网络信息资源的动态性使其老化规律的研究增加了新的内容,即对网络信息资源自身生命周期的研究。
(3)不完全性。传统文献,的生产和传播是受控的,由相关机构统一审核和管理。因此,在传统文献资源老化研究中,研究对象的范围一般相当清晰,在数量上也是可数的。而在网络信息资源的老化研究中,研究对象的不完全性却是无法回避的问题。导致该问题出现的原因主要来自两个方面:一是网络的开放性决定了网上信息的基本上处于不受控制的状态,因此,任何研究者都无法确知网络信息资源的精确构成和分布状况,在研究特定领域的网络信息资源时,也就不可能准确地划定研究对象的范围和数量。二是网络信息资源的非累积性和动态性造成了研究对象在时间维度上的缺失,因此,在研究中也就难以系统地回溯研究对象的历史状态。
2衡量网络信息资源老化状况的指标
根据网络信息资源老化的原因及其特征,我们从网络信息资源自身的生命周期和网络信息资源被利用情况两个方面,建立衡量网络信息资源老化状况的指标。
2.1网络信息资源的生命周期
网络信息资源的生命周期反映的是网络信息资源自身的老化状况,可以采用半衰期和生存期两项指标衡量。
2.1.1半衰期
半衰期源于物理学领域,原指放射性元素的原子核有半数发生衰变所需的时间。我们借用这一概念,将网络信息资源的半衰期定义为网络信息资源的基本构成元素有半数发生变化所需的时间。根据是否考虑网络信息资源的增量部分,网络信息资源的半衰期又可以分为静态半衰期和动态半衰期。
(1)静态半衰期。静态半衰期是指在不考虑增长的情况下,网络信息资源的基本构成元素有半数发生变化(含消失)的时间。例如,以网页为基本构成元素,考察网站A的静态半衰期。假设网站A有10000个网页,每个月有1000个不同的网页发生变化,并且有100个网页消失。根据上述定义,网站A的静态半衰期为10000÷2÷(1000+100)=4.55(月)或0.38(年)。
(2)动态半衰期。动态半衰期是在考虑增长的情况下,网络信息资源的基本构成元素中较新的一半产生于多长时间内。例如,在上例的基础上,假设网站A每个月新增500个网页。根据动态半衰期的定义,网站A的动态半衰期为10000÷[2×(1000+500)-(500-100)]=3.85(月)或0.32(年)。
当然,半衰期的计算在实际研究中情况会复杂得多。首先,网页不会匀速地发生变化、消失和增长;其次,一个网页可能连续多次发生变化,由于我们考察的基本元素是网页,因此只能将其计为一次;第三,在计算动态半衰期时必须认识到,新增网页也会发生变化;最后,出于研究的需要,我们可能会选择在信息组织上比网页粒度更细的单元作为基本构成元素,譬如知识单元、网络链接、单词等。
2.1.2生存期
网络信息资源的生存期是指特定网络信息资源的URL存续时间。如同人的遗传密码一样,URL是区分不同网络信息资源的唯一标识,因此,我们认为URL是判定网络信息资源生存期最理想的依据。根据该定义,只要URL保持不变,无论内容如何变化,都视为同一个网络信息资源。在极端情况下,特定URL所对应的网络信息资源内容甚至可以为空反之,即使内容没有发生任何变化,只要URL被改动,我们就视为原信息资源“生命”的终结和新网络信息资源的诞生。当然,如果特定网络信息资源及其URL同时被删除,同样也意味着该网络信息资源生存期的终止。
2.2网络信息资源的价值周期
网络信息资源的价值周期的计量依据是其被利用的状况,这与传统文献资源老化规律的研究思路基本相同。文献半衰期的研究可以分为学科文献的半衰期和论文的半衰期。学科文献的半衰期是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的;论文半衰期是指引用这篇论文的全部其他论文的二分之一是在这篇后的多长时间内发表的。需要强调的是,学科文献的半衰期是相对于被引文献而言,而论文的半衰期是相对于引用文献而言的[6]。与此相对应,我们仍然以“半衰期”为指标衡量网络信息资源的价值周期,并按研究对象分为宏观网络信息资源半衰期和微观网络信息资源半衰期。
(1)宏观网络信息资源半衰期。根据学科文献半衰期的概念,我们将宏观网络信息资源半衰期定义为某主题领域网络信息资源所含链接的链宿所指资源中较新的一半是在多长时间内产生的。例如,如果我们说网络信息计量学的网络信息资源半衰期是1.2年,就表明在我们进行统计研究的那一年里,在网上的网络信息计量学文献中的链接所指资源的50%是在最近1.2年内发表的。
宏观网络信息资源半衰期的研究是基于网络信息资源中的链接。由于网络信息资源中的链接与文献的被引文献是性质完全不同的两类事物,因此,在借鉴其研究思路的同时,我们应该注意自身的特殊性。笔者认为,最重要的几个需要解决的问题是:第一,必须明确链接的目的,也就是链源与链宿之间的关系;第二,当链宿的时间晚于链源所在网络信息资源的时间时应当如何计算;第三,是应该采用网络信息资源中所有的链接,还是只考察出链;第四,从理论上来说,我们需要获得该主题领域的所有网络信息资源,并提取其所含有的链接。由于网络信息资源的不完全性,研究结果可能与客观实际存在相当程度的差异。
(2)微观网络信息资源半衰期。参照论文半衰期的概念,微观网络信息资源半衰期是指指向该网络信息资源的全部其他网络信息资源的二分之一是在其后的多长时间内出现的。例如,网上某文档的半衰期是1.5年,就意味着该文档所获得入链的链源所在网络信息资源的50%出现于其后的1.5年内。
与宏观网络信息资源半衰期的研究相比,微观网络信息资源半衰期研究所面临的问题相对较少。根据上述定义,微观网络信息资源半衰期的研究不涉及自链,并且基本不会出现入链的链源所在资源的时间早于研究对象出现时间这样的情况。因此,需要考虑的问题中最主要的就是解决或尽量缩小网络信息资源的不完全性。尽管有研究表明,网络链接的使用动机与文献引用动机存在巨大差异,但笔者认为,无论处于何种动机,网络信息资源获得入链就意味着其使用价值的实现,我们在计量其半衰期时不必做过多的区分[7]。
3网络信息资源老化研究展望
网络信息资源的老化研究与网络信息资源的增长、分布与利用研究共同构成了网络信息计量学研究的基本框架,对丰富与完善网络信息计量学的学科体系具有极高的理论价值。同时,网络信息资源老化研究的成果也是网络信息资源建设、管理和利用的依据,具有重要的现实意义。
目前,国内对网络信息资源的老化研究才刚刚起步,所见文献仅有2004年王宏鑫和邱均平在《情报理论与实践》第4期所发表的《关于网络信息老化研究的若干问题》一文[8]。因此,在现阶段应该借鉴文献计量学的研究成果,在充分认识网络信息资源与传统文献资源所存在差异的基础上,建立网络信息资源老化研究的理论与方法体系,为探索网络信息资源老化规律和实践应用奠定基础。
【参考文献】
12002年中国互联网络信息资源数量调查报告./html/Dir/2003/11/22/1393.htm
22003年中国互联网络信息资源数量调查报告./download/manual/report20030330.pdf
32004年中国互联网络信息资源数量调查报告./download/2005/2005041401.pdf
4Bar-Ilan,PeritzB.C.ThelifespanofaspecifictopicontheWeb:thecaseof"informatrics"aquantitativeanalysis.Scientometrics.1999,46(3):371-382
5WallaceKoehler.AnAnalysisofWebPageandWebSiteConstancyandPermanence.JournaloftheAmericanSocietyforInformationScience.1999,50(2).
6邱均平编著.文献计量学.北京:科学技术文献出版社,1988.
【关键词】数字城市;文献计量分析;研究热点
【中图分类号】G255 文献标识码:A 文章编号:
引言
数字城市(Digital City,DC)有广义与狭义之分,广义上指城市信息化;狭义上是指综合运用地理信息系统(GIS)、全球卫星定位系统(GPS)、遥感系统(RS)、网络等关键技术,建设服务于城市规划、建设、管理,服务于政府、企业、公众,服务于人口、资源环境、经济社会的可持续发展的信息基础设施和信息系统[1]。数字城市的提出成为我国城市信息化建设过程中的亮点,随着数字城市领域研究的不断深入和社会信息化的高度发展,我国数字城市的建设也呈现出新的特点。
1 研究方法、数据处理
1.1 研究方法
1.1.1内容分析法。通过对文献特定主题内容进行定性定量剖析,提示该主题内容的实质,系统、客观地把握其研究动态和趋势[2]。
1.1.2文献信息统计分析法。利用统计学方法对文献信息进行统计分析,以数据来描述或揭示文献的数量特征和变化规律,从而达到一定研究目的的一种分析研究方法。它是在统计学原理的指导下,在长期文献信息统计实践中逐步形成和发展起来的[3]。
1.2 统计来源
本文选取中国学术期刊网全文数据库为数据来源,以“关键词”为检索项,“数字城市”为检索词,时间跨度选取2006-2011年共6年的数据,即检索条件:关键词=数字城市*全部期刊*年=2006-2011。检索出符合条件的论文共计1704篇,剔除通知、会议、纪要、讲话等,共获得有效论文1117篇。
2 数字城市研究文献计量分析
2.1数字城市研究发文量分析
在cnki学术趋势搜索中以数字城市为主题检索,数据整合分析后得到该领域论文数量在1997-2011年的变化趋势,经分析得:
1998-2003年我国数字城市领域的研究一直呈现增长态势, 2000年国民经济“十五”规划将信息化列为专项之后,论文数量明显增长,2003年达到顶峰;2004-2006年间研究呈现下降趋势且发文量相对平稳,该阶段论文对数字城市发展中的瓶颈及对策进行了分析;2006年之后该领域的研究总体呈现增长态势,2011年达到历史高峰。
2.2论文作者分析
通过对2006-2011年间数字城市领域论文作者进行统计,获得有效论文作者1771位,其中,李琦发表文献9篇,排在第2、3位的分别是邹逸江、黎林峰,这些作者均为数字城市研究领域的积极型研究者,丰富和发展了数字城市理论。
2.3论文期刊分布分析
著名的布拉德福定律揭示了文献信息集中离散分布规律,该规律有助于选择和确定核心期刊。所谓核心期刊,实质刊载与某一学科领域有关的信息较多,且水平较高,能够反映该学科最新成果和前沿动态[4]。
载文量排名前10的期刊中《中国建设信息》、《测绘与空间地理信息》与《地理空间信息》载文量最多,载文数量189篇,占论文总量的16.92%,《中国建设信息》刊载量连续3年处于领先地位,为研究者快速查找数字城市领域的研究热点提供参考。
2.4关键词分析
通过采用内容分析法和词频分析法相结合的方法对当前的研究热点进行分析。近6年数字城市文献中出现的关键词共计1380个,列举出现次数较多词并对相近的词进行归类,结果如表1所示。
表1:关键词统计结果表
序号 关键词 出现次数 所占比例 序号 关键词出现次数 出现频率
1 数字城市 48234.93% 6数据库503.62%
2 地理信息系统 17512.68% 7应用302.17%
3 虚拟现实 977.02% 8 地理空间框架 221.59%
4 城市规划 63 4.57% 9 数字化 211.52%
5 信息化 594.28% 10电子政务 201.44%
3 数字城市未来研究热点
3.1智慧城市的研究是数字城市未来发展的方向
数字城市领域中核心作者李琦认为:数字城市是智能城市的初级阶段,随着科学技术的进步,数字城市也将向智能城市发展。通过一些核心作者的研究可以看出,作为数字城市发展高级阶段的智慧城市将成为未来研究热点。
3.2地理空间框架的研究作为数字城市建设的重要技术支持仍是研究热点
通过对数字城市刊载量较多的期刊特点进行分析,可以得出与地理空间信息相关的研究日益增多。数字城市地理空间框架作为数字城市的一部分,为整个数字化城市管理搭建了一个地理信息公共平台,可以有效的促进地理信息共享应用,数字城市领域的地理空间框架研究仍是未来研究热点。
3.3数字城市的应用研究将日益增多。
从国家测绘地理信息局了解到,截止2012年5月23日,全国已有260余个地级以上城市开展数字城市建设。数字城市建设的最终目的在于服务政府在城市建设领域的决策,提高百姓生活质量。因此,在数字城市建设过程中存在的问题及改进研究方面,建成后如何依托数字城市地理信息公共平台提高城市管理效率和水平,以及如何使数字城市建设更好的服务民生方面的研究将日益增多。
4 结语
回顾国内近六年来的研究文献,可以发现数字城市研究文献的数量呈逐年增长态势,研究主题涉及数字城市的理论、支撑技术和应用等多方面,未来也将逐步向较高层次的智慧城市领域研究,更好的促进城市建设,提升人民生活质量。
【参考文献】
[1] .数字城市信息共享的几个问题[J].《北京测绘》,2007(4):1-5
[2]王知津,闫永君.网络计量法与内容分析法比较研究[J].《图书馆学研究》,2006.(6):2-5
关键词 化学计量学 发展 中国
化学计量学(Chemometrics)在我国发展已有20多年的历史,是一门化学与统计学、数学、计算机科学交叉所产生的新兴的化学学科分支。它运用数学、统计学、计算机科学以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地提取有用的化学信息[1]。它与基于量子化学的计算化学(Computational Chemistry)的不同之点只在于化学计量学是以化学量测量为其基点,实质上是化学量测的基础理论与方法学[2]。
由于“”的影响,使我国在化学计量学的发展方面略迟于欧美,但在化学界前辈的积极倡导和国家自然科学基金委的支持下,80年代以来,我国的化学计量学研究得到了飞速发展,到现在已发展成为一门在国际上有一定影响的独立的化学学科分支,已出版了多本化学计量学方面的专著和相应的教材[3],并在中国科学院的多个研究所和国内多个知名大专院校建立了队伍稳定的化学计量学研究小组,取得了一批具有国际先进水平的成果。8年前,我们曾在第二届斯堪的那维亚国际化学计量学大会上对我国的化学计量学发展主要成果进行过一次综论[4],在此,仅就近10年来化学计量学在我国的发展情况作出简要介绍。
化学计量学为化学量测提供理论和方法,为各类波谱及化学量测数据的解析,为化学化工过程的机理研究和优化提供新途径,它涵盖了化学量测的全过程,包括采样理论与方法、试验设计与化学化工过程优化控制、化学信号处理、分析信号的校正与分辨、化学模式识别、化学过程和化学量测过程的计算机模拟、化学定量构效关系、化学数据库、人工智能与化学专家系统等,是一门内涵相当丰富的化学学科分支。化学计量学的发展为化学各分支学科、其别是分析化学、环境化学、药物化学、有机化学、化学工程等,提供了不少解决问题的新思路、新途径和新方法。
化学计量学发展成为化学与分析化学学科的一个独特分支。两个重要的条件与因素推动了这方面的发展。首先,化学与分析化学中大量涌现的现代化学量测仪器,使化学与分析化学家比以往任何时侯都更容易获得大量化学量测数据。这种情况,在过去是难以想象的。到20世纪80年代,在分析测试或化学量测中,人们第一次发现,取得数据甚至大量数据已不是最困难的一步。最难解决的瓶颈问题是这些数据的解析及如何从中提取所需的有用化学信息。化学家与分析化学家首次遇到类似行为科学家或经济学家所遇到的大量数据如何处理的问题。化学家与分析化学家比较幸运。因为大量现代分析测试仪器出现带来“数据爆炸时代”,也正是计算机普及的时代。这就构成了化学计量学发展的第二个条件。为了对极为复杂的化学量测数据(其中负载着在分子水平上表征物质世界的信息)进行解析,化学家、分析化学家利用可在计算机上实现的许多强有力的数学方法,包括一些相关学科发展的数据与信号处理新方法,从多维化学量测数据中提取有用的相关化学信息。如果说经典分析化学是得首先依赖费时而麻烦的化学或物理的方法来对很多复杂化学体系进行纯组分分离,即采用单变量校正方法进行定性定量分析的话,那么,现代分析化学家面对的则是各种将分析分离技术集于一体的高维仪器所产生的巨量分析信号,藉化学计量学发展的新型分析信号的多元校正与分辨方法[5]来进行复杂多组分体系的定性定量解析,高维数据解析的化学计量学方法现已进入可用来解决分析化学中实际难题的程度,将这些方法用于复杂环境样本、中草药中单位药及复方分析等[6],取得了很多令人振奋的结果。继续进行高维数据、特别是针对可产生三维数据的新型仪器的化学计量学算法的研究现仍是一个研究的热点,我国的化学计量学研究在此方面取得了居于国际先进水平的成果[7]。多元校正与分辨一直就是分析化学计量学研究的主要内容,在此方面,中国科技大学、清华大学、石油化工科学研究院、沈阳药科大学、中国药科大学、同济大学、天津大学、厦门大学、兰州大学、江西大学、西北大学、华中理工大学、湖南大学等单位做了大量的研究工作[8]。将化学计量学方法固化于新设计的分析仪器之中,以构建新型智能分析仪器,是一个值得继续研究的方向。另一方面,由于近年来计算机科学及信息科学的长足发展,它们的发展也为化学计量学注入了新鲜血液,我国在分析信号处理新方法,其别是小波分析(wavelet analysis)的引入,为分析信号的压缩、去噪、分辨及背景消除等带来新思路和新方法,从对近年来在此方面的综述来看,可以说,我国在小波分析用于分析信号处理研究的方面是处于国际先进水平的,中国科技大学、中山大学、香港理工大学等单位的化学计量学研究小组在此方面作出了大量有水平的研究[9]。另外,有关人工神经网络(artificial neural networks,ANN)[10]新技术、基于自然计算的全局最优算法如模拟退火(simulated annealing, SA)和遗传算法(genetic algorithm, GA)[11],信息科学中的图象分析(image analysis, IA)方法,统计学中研究热烈的稳健方法(robust methods, RM)[12]等新型化学计量学方法的引入也取得很多可喜的成果。采样理论这一重要的化学计量学研究分支,过去未引起必要的重视,近期有关研究小组如南开大学等单位倡导开展了这方面研究[13]。
化学模式识别的研究提供的是对决策和过程优化很有实用价值的信息,为我国石油化工、材料化学等带来了解决研究难题的新思路,人工神经网络的新方法,为化学模式识别提供了研究的新机遇。无论在化学模式识别的方法和应用方面,我国都取得了不少优秀成果,中国科学院上海冶金研究所的化学计量学研究小组先后用化学模式识别的方法成功地解决了50多个石油化工过程优化、材料设计等方面中的实际难题。化学模式识别方法用于分析化学、物理化学、无机化学、药物化学、食品化学、农业化学、医药化学和环境化学等学科的研究在我国也取得了不少成果,浙江大学、中国科技大学、沈阳药科大学、中国药科大学、同济大学、中国科学院长春应用化学研究所、湖南大学等单位在此方面做了大量工作[14]。
转贴于
化学定量构效关系(QSAR)的研究,是一个涉及到化学学科的一个带根本性的问题,即如何从物质的化学成分与结构来定量预测其化学特性,也可以说是理论化学研究中的一个最重要目标。目前,由于药学发展的需要,将基于量子化学计算的分子模拟与QSAR研究结合起来,为寻求有生物和药理活性的先导化合物提供了一个新途径,我国在这方面也已取得引人注目的成就[15]。将全局最优算法如模拟退火和遗传算法的引入分子力学的寻优,以指导最佳先导化合物的寻找,是化学计量学家的贡献,现已在QSAR的研究中得到了广泛的应用。QSAR通过直接研究可量测化学量及某些量化参数与化合物的某些已知化学特性之间的已知数据,采用统计回归(多元校正)和模式识别的方法来建立一种模式,从而达到预测化合物特性的目的, 建立起某些化学结构与性能的关系来指导进一步的实验研究。目前,用ANN来进行QSAR研究颇引人注目,在模式分类与定量构效关系研究中展现了很好的应用前景。在QSAR的研究中,南开大学、北京大学、中国科学院上海药物研究所、中国科学院化工冶金研究所、中国科学院长春应用化学研究所的化学计量学研究小组将分子模拟与QSAR研究相结合,并直接用于指导实际的药物合成,取得了很好的研究成果[16]。在QSAR研究中,化合物结构的拓朴表征是另一个重要的课题,如何采用图论和数值方法来表征各种化合物分子,并将所得数值结果与实际量测的化合物的物理、化学和生物学特性连接起来,也是目前化学计量学研究的一个重要问题。我国的化学计量学研究工作者在此方面也做了不少有意义的工作[17]。
波谱化学是分析化学与有机化学家都十分关注的一个领域,怎样利用现存波谱数据库,如质谱、红外光谱、核磁共振谱、色谱的保留时间库以及吸收与发射光谱等为复杂分析体系进行快速定性定量分析,一直是分析化学家们努力的目标;而如何利用上述各种波谱为新合成的有机化合物定结构,则是有机化学家们手中必不可少的解析手段。计算机技术,其别是智能数据库与化学专家系统技术为此提供了进行上述解析的新途径。我国的化学计量学工作者在此方面也做了大量富有成果的工作。中国科学院上海有机化学研究所、中国科学院大连化学物理研究所、中国科学院长春应用化学研究所、中国科学院化工冶金研究所,南开大学、南京大学、东北师范大学、厦门大学、湖南大学等单位都先后建立了多种波谱的数据库和专家系统[18],如13C NMR谱图数据库和结构解析专家系统(ESESOC)、高效液相色谱专家系统、红外、质谱数据库与专家系统、ICP发射光谱专家系统等,他们用计算机进行各类波谱(包括核磁共振谱、质谱、红外光谱等)模拟,并用联合波谱库和专家系统进行结构自动解析与推导,选择各类仪器(色谱与光谱)的最佳量测和分离条件、进行各类波谱数据库的知识开发,并在各类数据库的网络化上也做了大量工作[19]。
1997年,在国家自然科学基金委的全力支持下,由湖南大学与挪威Bergen大学合作,在张家界举行了我国的第一次国际化学计量学会议,与会代表120多人,其中来自欧美及亚洲各地14个国家的境外代表60多人,会议的议题几乎覆盖了前述化学计量学研究的各个领域,还特别为化学计量学在工业中的应用开辟了一个专门议题。该会议已在国际化学计量学刊物“Chemometrics and Intelligent Laboratory Systems”出版了会议论文专辑[20],收集了44篇会议,其中我国作者占了28篇,第一次较系统地向国际化学计量学界展示了我国的化学计量学研究的实力,说明我国的化学计量学研究已与国际接轨。
化学计量学诞生至今,已有近30年历史,其发展前景亦是一个令人关注的问题。从分析化学与化学计量学的关系可以看出,化学计量学的发展将对分析化学产生深刻影响,已构成分析化学第二层次基础理论和方法学的重要组成部分,特别值得提出的是,化学计量学的发展还将为分析仪器的智能化提供新理论和新方法,为新型高维联用仪器的构建提供新思路和新方法,是21世纪分析仪器软件主体化发展的新突破口。此外,随着微型计算机和网络技术的飞速发展,对于化学波谱库的建立与检索方法以及化学人工智能和专家系统的研究也将取得长足进步。在采用计算机网络技术将多种波谱仪器连接的基础上,将数值化计算技术(近年来化学计量学方法学发展的主体)与传统的基于经验的逻辑推理方法的有机结合,可望解决化合物结构自动解析的难题,并使得长期困扰分析化学家的混合物波谱同时定性定量解析成为可能。在分析化学领域中,化学计量学的发展前景十分诱人。另外,化学计量学与其他化学学科分支,如环境化学、食品化学、农业化学、医药化学、化学工程等学科,将产生更密切的联系,得到更广泛的应用。随着各化学分支学科的发展,可以预期,化学计量学也将继续得到更蓬勃的发展。
参考文献
[1] S Wold. Chemometrics: what do we mean with it, and what do we want from it? Paper of InCINC'94. emsl.pnl.gov:2080/docs/incinc/homepage.html
[2] 俞汝勤.化学计量学导论.长沙:湖南教育出版社,1991.
[3] 罗旭.化学统计学基础.沈阳:辽宁出版社,1985;俞汝勤.现代分析化学的信息理论基础.长沙:湖南大学出版社,1987;陈念贻,许志宏,刘洪霖,徐桦,王乐栅.计算化学及其应用.上海:上海科技出版社,1987;相秉仁.计算药学.北京:中国医药出版社,1990;许禄,郭传杰.计算机化学方法及应用.北京:化学工业出版社,1990;卢佩章,张玉奎,梁鑫淼.高效液相色谱法及其专家系统.沈阳:辽宁科学技术出版社,1994;许禄.化学计量学方法.北京:科学出版社,1995;陆晓华.化学计量学.武汉:华中理工大学出版社,1997;梁逸曾.白灰黑复杂多组分分析体系及其化学计量学算法.长沙:湖南科技出版社,1997;周声劢,梁亮,梁逸曾.合成计量学与化学化工系统优化.长沙:湖南大学出版社,1996;刘洪霖,包宏.化工冶金过程人工智能优化.北京:冶金工业出版社,1999;梁逸曾,俞汝勤.分析化学手册(第十分册)化学计量学.北京:化工出版社,1999.
[4] Yu R Q(俞汝勤).Chemometrics in china. Chemom. and Intell. Lab. Sys., 1992, 14: 15.
[5] 袁洪福,陆婉珍.现代科学仪器,1998, (5):6~8;徐广通,袁洪福,陆婉珍.现代科学仪器,1997, (3): 9;Shen H L(沈海林), and Liang Y Z (梁逸曾). Chemom. and Intell. Lab. Sys., 1999, 45: 323~328;Wang hongyan (王洪艳). The Analyst, 1995, 120; 梅雨,朱仲良,李通化.计算机与应用化学, 2000, 17:116; 方慧生,吴玉田,黄春明.计算机与应用化学,2000,17:122;方慧生,吴玉田.分析化学,1999,17:14;Liang Y Z(梁逸曾), Kvalheim. O M et al. Anal. Chem., 1992, 64: 946~953; Liang Y Z(梁逸曾), Kvalheim O M. The Analyst, 1993, 118: 779~790; Liang Y Z(梁逸曾) et al. Anal. Chim. Acta, 1993, 276: 425~440; Xie Y L(谢玉珑), Liang Y Z(梁逸曾),Yu R Q (俞汝勤). Anal. Chim. Acta, 1993,272: 61~72. Xie Y L(谢玉珑), Liang Y Z(梁逸曾), Yu R Q(俞汝勤). Anal. Chim. Acta, 1993,281:207~218; Xie Y L(谢玉珑), Liang Y Z(梁逸曾),Yu R Q(俞汝勤). Anal. Chim. Acta, 1993,276: 273~282. 龚范,张林,梁逸曾,俞汝勤.化学学报,1998, 56: 500~506.
[6] 沈海林,梁逸曾,俞汝勤.中国科学,1997, 27: 556~563; 龚范, 彭源贵, 崔卉, 梁逸曾, Leung K M(梁开梅) and Chau F T(周福添). 高等学校化学学报, 1999, 20: 199~203; 龚范, 彭源贵, 崔卉, 梁逸曾, Leung K M(梁开梅) and Chau F T(周福添). 药学学报, 1999, 34 :214~217.
1.学术价值
体育科技论文参考文献是指为撰写体育科学研究学术论文而引用的有关文献信息资源。参考文献最主要的作用是它所具有的学术价值,从而起到提升体育科技论文学术质量的作用。
2.信息价值
体育科技论文引用参考文献可以让作者精炼文字,因为所需表达的内容凡已有文献所载者就不必详述,只需引用并标注、规范地加以著录即可。这样既节约篇幅,又提高了信息密度,增加了论文的信息量,具有很高的信息价值。
3.情报价值
体育科技论文参考文献是对所载期刊论文引文进行统计和分析的重要情报源,规范地引用参考文献和进行标准化著录,有利于通过引文分析对期刊及其所载论文的学术水平做出客观评价,有助于科学情报研究和文献计量学研究,从而促进体育科技期刊学术质量的提高,对整个学科的发展也起着不可或缺的推动作用。
二、引用方法
掌握参考文献的引用方法是体育科技论文规范化写作的重要内容。
体育科技论文参考文献的引用方法首先是规范化问题,是体育科技论文写作应遵循的基本规范,但同时它也是一种写作手法,运用得好尤其是用对地方可以充分发挥参考文献的作用。如在正文中通过引用最佳证据可以增加论证强度,尤其在分析与讨论部分,可以巧用知识背景(引文)材料,阐述作者的观点,使之言之有据,言之有理,最终达到感性认识的理性升华。
三、著录方法
体育科技论文引用参考文献,在文中出现的地方予以标注,并在文后按标注方法列出参考文献表,这项工作称为参考文献著录。
1.标注法
体育科技论文涉及已有成果的指出登载这个文献的出处,称为引用参考文献,简称引文;在引用处进行标注,称为参考文献标注;标注的方法称为标注法。我国科技期刊论文引用参考文献的标注方法主要采用顺序编码制。
2.顺序编码制
关键词:硕士学位论文;过程管理;论文质量
中图分类号:G647 文献标志码:A 文章编号:1674-9324(2015)12-0011-02
硕士学位论文是衡量硕士研究生培养质量的重要标志,是检验学业学术水平的重要依据和必要环节。硕士学位论文从选题到最后成文定稿一般需要1~2年的时间来进行思考、研究和撰写提炼,是一项系统的科研工作。为保证硕士学位论文质量,必须加强硕士学位论文过程管理。目前硕士学位论文过程管理一般包括开题报告、中期检查、论文撰写、评审和答辩等环节。本文对硕士论文过程管理中存在的问题进行了分析,结合中国计量学院硕士学位论文过程管理工作实践,提出了相应的改进措施。
一、硕士学位论文过程管理中存在的问题
1.选题匆忙,开题把关不严。开题报告是对学位论文质量管理和监控的首要环节,不仅关系到学位论文的质量,还关系到论文能否做得下去的问题。但目前很多研究生临近开题才与导师协商论文选题,导致开题报告时文献综述不全面,无具体的实施方案,出现选题过大,甚至个别选题偏离本学科范畴的现象。另外,开题报告无统一规范的评判标准,有的考核老师提问随意,缺乏实质内涵,未能切实起到发现问题、及时纠偏的作用,开题报告把关不严。
2.中期检查流于形式。中期检查是保证论文研究进度的一个重要措施,对硕士研究生和导师的一种潜在督促。中期检查时一般要求研究生填写中期检查报告,对前一阶段论文所做的工作及阶段性成果进行总结,对存在的问题进行分析,并明确后期的研究计划。在实际考核过程中,往往研究生填完中期报告导师审核签字就算通过,没有组织严格规范的考核,中期检查流于形式。
3.论文撰写研究生态度不端正。研究生是硕士学位论文的执行者,研究生的态度直接关系着硕士学位论文质量的好坏。但目前很多研究生只关心就业,从入学起就把主要精力放在与就业有关的资格考试或实习中,忽视自己的研究能力的锻炼,对自己的硕士论文要求低。平时很多研究生对科研研究或科研工作处于放松状态,对硕士学位论文的撰写不够重视,导致硕士学位论文整体结构不合理,工作量不足,实验数据缺乏,格式混乱。甚至有的研究生在撰写论文的过程中存在抄袭和剽窃他人成果的现象。在学位论文最后阶段,研究生往往对评审专家提出的意见置之不理,不再花精力对论文进一步修改,导致硕士学位论文质量不能提高。
4.导师指导力度不到位。硕士研究生导师是保证和提高研究生学位论文质量的关键因素,学位论文的质量在很大程度上取决于导师的指导作用。但目前高校研究生导师教学和科研压力都比较大,工作忙,经常疏于指导研究生学位论文工作。有的导师忙于自己的业务,把研究生当作劳动力使用,做一些对提高科研能力帮助不大的工作,使研究生投入学位论文工作的精力不足,导致研究生学位论文质量不合格。有的导师在论文送审前才开始审阅,对不成熟或存在问题的学位论文,不是阻止学生提交评审,而是想方设法让学生的学位论文能通过评审。
5.论文评审制度不完善。学位论文评审一般采用双盲评阅和公开评阅两种方式。双盲评阅一般由学校研究生部将论文送给校外同行专家或对口高校研究生学位管理部门,送审论文中不含研究生及导师的个人信息,评阅专家与论文作者和导师均不了解对方情况。公开评阅由学科或导师直接送给校内外同行专家,送审论文中包含研究生、导师的个人信息。2011年以前,我校一直采用一本双盲评审和两本公开评审相结合的论文评审制度。但是公开评审的评阅方式中,有些评审专家不能充分指出论文存在的问题,对论文总体评价成绩过高,使学位论文评审的公正性缺失。另外,由于学位论文评阅只是模糊的文字表述和论文整体的评价结果,一定程度上加大了评阅的难度,影响了客观性。由于公开评审有失公正性,同一论文的评阅成绩,会出现较大区别,使研究生和导师对评价结果产生异议。
二、硕士学位论文过程管理的改进措施
1.进行选题管理,分批开题,严把开题关。为避免研究生在开题报告之前匆忙选题的现象,研究生入学后就应与导师协商学位论文选题,并于第一学期末或第二学期初初步确定学位论文选题,第二学期开始进行文献综述的撰写和方案论证。为使师生重视开题,学校实行分批开题制度,第一批为第二学期末进行,第二批为第三学期初进行。为保证开题报告质量,首先,要求开题报告前,研究生先填写开题报告表,在导师组内进行开题论证,经论证通过后才能参加开题报告。其次,开题报告由各学科以研究所为单位分小组公开组织,考核小组至少五名以上具有高级专业技术职称的老师组成。再次,学校制定了开题报告评价体系,要求考核小组从选题和文献综述、研究方案、研究基础、开题报告撰写情况和答辩情况等五大方面进行考核,并对每方面的具体评价要素进行了细化,便于考核小组客观评判。另外,学校要求考核小组形成书面意见,对研究生论文研究和实施过程中可能遇到的困难进行估计,对不足之处提出意见。研究生需根据考核小组意见进行修改完善,并填写开题报告修改反馈意见情况,经导师审核通过后才能进入课题研究,不合格者需重新开题。以上措施,增加了研究生和导师对开题报告的重视,有效防止了开题报告把关不严。
2.建立中期检查反馈整改制度。硕士学位论文中期检查于第四学期进行,学校要求除研究生填写中期检查报告外,各学科需根据学科自身特点采取现场演示验收、材料评审、PPT汇报等不同形式组织检查。检查结束后,各考核小组需根据研究生的论文进展总结和分析情况做出成绩评定,并给出书面意见指出存在的问题和不足,提出指导性建议。书面意见由学院研究生教学秘书汇总后反馈给研究生和导师,导师需指导研究生根据考核小组意见在后续工作中采取改进和补救措施。对于问题比较多的研究生,需整改后重新中期检查。
3.建立严格的预答辩审查制度。为对硕士学位论文质量进行提前把关,学校建立了严格预答辩审查制度。参加预答辩的研究生除修满学分,通过学位论文中期检查外,还需达到以下三个条件:第一,研究生需取得学科规定的与学位论文相关的科研业绩;第二,硕士学位论文格式需通过学科组织的格式审查;第三,论文中涉及到的实验装置、软件和实验数据等需通过学科组织的实物现场验收。预答辩的组织各学科严格按照正式答辩的要求进行,并且通过预答辩者需根据预答辩考核的意见对论文进行修改,导师审核同意后才能进入下一环节。未通过预答辩者,延入下一批次毕业。经过实践,严格的预答辩审查制度促使研究生和导师对硕士学位论文增加投入,有效防止了论文送审前才临时包佛脚,促进了学位论文质量的提高。
4.引入学术不端检测系统。为有效防止硕士学位抄袭现象,学校自2009年开始在全校研究生学位论文中启用CNKI的“学术不端行为检测系统”。研究生硕士学位论文送审前都必须参与学术不端检测,文字复制比大于20%的论文延入下一批送审。经过实践,该措施对打击学术不端和学术抄袭行为效果非常显著。
5.规范和完善论文评审制度。为保证学位论文评审的客观公正性,学校不断改进论文评审制度。首先,对论文评审方式进行改进,为防止论文评审走过场,2011年我校将原来的1本双盲评审和2本公开评审相结合的方式转变为2本论文双盲评审的方式,论文送审工作全部由学校研究生部负责,并对有争议的论文进行加送,保证了论文评价的公正性;其次,对论文评审体系进行了优化,评价体系由以前单一的整体评价改为整体评价与分项评价相结合的方式,要求评审专家对论文选题、文献综述、知识与能力、工作量与创新性、写作能力等5方面进行评价,减少论文评价的客观性。再次,盲审意见返回后,要求研究生根据盲审意见对论文进行修改完善,并针对评审专家给出的修改意见逐条写明修改反馈情况,导师审核通过才能参与答辩。通过以上措施,减少了论文评审的主观性,保障了评审的公平性,增加了研究生和导师对评审的重视。
6.建立学位论文过程考核督导制度。为规范学位论文过程管理,学校将教学督导制度引入研究生学位论文过程管理的各个环节。研究生教学督导组成员由学校各学科领域有一定威望的专家组成。各二级学院组织各学科对研究生硕士学位论文进行过程考核前,需将考核安排报学校研究生部,研究生部安排督导组成员到考核现场随机抽查学位论文开题报告、中期检查、预答辩和正式答辩。经过几年的督导实践,我校各二级学院硕士学位论文过程考核基本规范,促进了硕士学位论文质量的提高。
7.建立合理的奖惩机制。为提高研究生对其学位论文的重视程度并加强对导师的监管力度,学校将学位论文过程考核结果作为研究生评奖、评优的参考条件,并且每年评选校级优秀学位论文,对获得优秀学位论文的学生颁发证书和奖励,同时对其指导教师给予相应奖励。为保证硕士学位论文质量,学校实行弹性学制,优秀的研究生可以提前毕业,不合格的研究生延期毕业。另外,每年进行校内学位论文抽检制度,抽检比例不少于当年毕业人数的20%。
三、结语
实践证明,学校硕士学位论文过程管理措施的不断改进取得了良好的成效,有效保障了硕士学位论文质量。近年来,中国计量学院参加浙江省硕士学位论文抽检中,抽检成绩均位于全省高校前列,其中2011年抽检平均成绩和优秀率均为全省高校第一。
参考文献:
关键词:资源环境科学;文献计量学;发展态势;
作者简介:王雪梅(1976-),女,重庆永川人,副研究员,主要从事科学计量学、GIS与文献计量学集成研究.
资源与环境科学以人类生存和发展所依赖的地球系统特别是地球表层系统的特征和变化规律为主要研究对象,研究内容涉及地球科学及其分支学科,以及生命科学、化学、工程与材料科学、信息科学及管理科学的诸多分支学科领域。经济快速发展对资源环境科学提出了巨大需求,中国科学院围绕我国经济社会发展的重大问题及其相关的资源环境与地球科学问题,在资源环境和地球科学领域取得了一系列研究成果[1~3]。利用WebofKnowledge平台SCI-E数据库,对2009—2014年中国科学院SCI论文及地球科学与资源环境科学领域论文产出进行统计,并与全球及中国论文产出相比较,了解中国科学院在地球科学与资源环境科学领域的研究产出及其发展状况。
1数据来源与分析方法
从WebofScience的251个学科分类中遴选出与地球科学、环境/生态学相关的学科,根据学科分类在ScienceCitationIndexExpanded(SCI-E)数据库检索资源环境科学领域的相关论文,应用美国汤森路透公司的ThomsonDataAnalyzer文本挖掘软件进行数据分析和制图,对全球和中国的资源环境科学领域产出进行统计分析。
地球科学(Geosicence)领域包括:能源与燃料(Energy&Fuels)、地质工程(Engineering,Geological)、石油工程(Engineering,Petroleum)、地球化学与地球物理学(Geochemistry&Geophysics)、地理学(Geography)、地质学(Geology)、地球科学多学科(Geosciences,Multidisciplinary)、湖泊学(Limnology)、气象与大气科学(Meteorology&AtmosphericSciences)、矿物学(Mineralogy)、矿产与矿物加工(Mining&MineralProcessing)、海洋学(Oceanography)、古生物学(Paleontology)、遥感(RemoteSensing)、水资源(WaterResources);环境/生态学(Environment/Ecology)领域包括:土壤科学(SoilScience)、生态学(Ecology)、海洋工程(Engineering,Marine)、环境科学(EnvironmentalSciences)。
2015年2~3月在SCI-E数据库对全球、中国、中国科学院的SCI论文产出进行检索和统计,中国科学院检索范围包括署名中有“中国科学院”的论文,包括中国科学院各研究所及中国科学院大学(中国科学院研究生院),不包括未署名“中国科学院”的中国科技大学论文。
2中国科学院论文产出总体态势
2009—2014年期间,SCI-E共收录论文955.6万篇,其中署名中国的论文有113万篇,署名中国科学院的论文有15万篇。图1反映了全球、中国、中国科学院2009—2014年年度论文产出量变化。全球、中国、中国科学院的SCI论文分别以年均2%,14%和10%的速度增长。2014年与2009年相比,全球SCI论文增长近11%,中国增长约为93%,而中国科学院增长了62%,由图2可见中国SCI论文增长速度远高于全球论文增长速度。
图3统计了中国SCI论文占全球百分比和中国科学院SCI论文占中国百分比,表明中国论文占全球的份额持续上升,而中国科学院论文占中国的份额则逐步有所下降,但中国科学院资源环境类研究所发表的SCI论文数量占中国科学院的份额稳中有升。从图2也可见,中国科学院资源环境类研究所2014年与2009年相比,SCI论文增长了约92%,与中国SCI论文的增速很接近,高于中国科学院整体的论文增长速度。
将2009—2014年环境/生态学和地球科学领域各年论文按照被引频次高低统计TOP1%,TOP10%,TOP20%和TOP50%论文的数量,以及中国和中国科学院相应级次TOP论文的数量,并统计中国占全球的比例和中国科学院占中国的比例(图4)。
根据论文全部著者统计的结果表明,中国在全球资源环境科学研究领域各级次TOP论文中的比例基本为15%~20%,中国地球科学领域TOP论文数占全球的比例高于环境生态学领域,并且地球科学领域TOP1%的高水平论文比例很高。中国科学院在中国资源环境科学研究领域各级次TOP论文中的比例为26%~32%,中国科学院环境/生态学领域TOP论文数占中国的比例高于地球科学领域。
3资源环境科学领域的重点研究方向
基于SCI学科分类,分别对2009—2014年全球SCI论文最多的20个学科领域的论文数占全球SCI论文总数的比例、中国SCI论文最多的20个学科领域的论文数占中国SCI论文总数的比例,以及中国科学院SCI论文最多的20个学科领域的论文数进行统计。结果显示,全球各学科领域中,生物学与生物化学发文最多,发文最多的20个学科领域主要侧重于医学和生命科学等,相比之下,中国产出偏重于材料科学以及化学、物理等相关学科领域,中国科学院在环境科学方面论文产出数量比例较高。
资源环境科学领域论文产出占全球自然科学领域论文产出的8%左右,中国该领域论文产出占中国SCI论文比例接近10%,中国科学院该领域论文产出占中国科学院SCI论文比例约为20%(图5)。
2009—2014年,中国SCI论文占全球比例约为12%,而资源环境科学领域中国SCI论文占全球份额超过14%。其中,环境科学是全球、中国和中国科学院资源环境科学领域论文产出的最主要的领域。此外,中国在能源与燃料、遥感、地质学等方面论文产出占全球比例相对较高,而在生态学、古生物学等方面所占比例较低。中国科学院关于古生物学方面的SCI论文在中国资源环境领域论文中的比例最高,达到54%;此外,在土壤科学、地理学、湖泊学、生态学、气象与大气科学等方面的论文占中国的比例也较高,但在石油工程、海洋工程等方面所占比例较低,不足10%(图6)。
图7中,气泡的大小表征资源环境各子领域占全球资源环境科学领域论文产出份额的大小,即点越大,该子领域论文数在全球资源环境领域中的比例越高;X轴表示资源环境子领域中国占全球论文的百分比,值越高表明该子领域中国占全球的比例越高;Y轴表示资源环境子领域中国科学院占中国论文的百分比,值越高表明该子领域中国科学院占中国的比例越高。气泡大的那些子领域(如环境科学等)是全球资源环境科学研究比较多的热点方向;右下角的那些子领域(如能源与燃料等)是中国资源环境科学相对比较有优势的研究方向;左上角那些子领域(如古生物学等)是中国科学院资源环境科学相对比较有优势的研究方向。
中国科学院资源环境类研究所2009—2014年发表的SCI论文主要涉及的学科领域包括:环境科学、生态学、地质学、工程学、气象与大气科学、农学、地球化学与地球物理学、化学、水资源、科学与技术、海洋与淡水生物学、地理学、植物学、海洋学等。
4主要研究机构的科学贡献
中国科学院几乎所有的研究机构都在SCI资源环境科学领域期刊发表过论文,2009—2014年根据全部著者统计超过100篇的研究所有50多个,在资源环境科学领域发表SCI论文较多的前10个研究所见表1,这些较多的研究所都属于中国科学院资源环境类研究机构。
2009—2014年中国科学院27个资源环境类研究所以第一著者发表的SCI论文共有22032篇,其中,生态环境研究中心、地质与地球物理研究所、海洋研究所、地理科学与资源研究所、大气物理研究所、广州地球化学研究所、南海海洋研究所、寒区旱区环境与工程研究所等较多,第一著者的SCI论文数都在1000篇以上(表2)。
中国科学院资源环境类研究所论文的篇均被引次数为6.03次/篇,表2中的“表现不俗的论文篇数”统计的是这些研究所高于基准值的论文篇数,即当前总被引次数除以从年至2014年的累积年得到的年均被引6次及以上的论文[4]。生态环境研究中心、地质与地球物理研究所、广州地球化学研究所的表现不俗论文都在150~200篇。
中国科学院资源环境类研究所被引频次位于前10%的论文篇数,即研究所2009—2014年被引16次及以上的论文篇数,也是生态环境研究中心、地质与地球物理研究所、广州地球化学研究所最多,都在260篇以上。
参考中国科学院文献情报中心科学前沿分析中心设计科学贡献指数[5],定义:
式中:Ci为中国科学院资源环境类第i个研究所科学贡献指数,P10%i为第i个研究所被引前10%论文数量,Citedi为第i个研究所论文被引总频次,n为中国科学院资源环境类研究所的数量。结果显示,生态环境研究中心、地质与地球物理研究所、广州地球化学研究所、海洋研究所、大气物理研究所、地理科学与资源研究所的科学贡献指数较高,都在0.1以上。
5结论与建议
通过以上分析可以看出:
(1)2009—2014年,中国科学院SCI论文增长了62%,高于全球11%的增长率,低于中国93%的增长率,但中国科学院资源环境类研究所的SCI论文增长了约92%,与中国论文增速相接近。
(2)中国在全球资源环境科学研究领域各级次TOP论文中的比例基本为15%~20%,中国科学院在中国资源环境科学研究领域各级次TOP论文中的比例为26%~32%,中国科学院环境/生态学领域TOP论文数占中国的比例高于地球科学领域。
(3)中国SCI论文占全球比例约为12%,在资源环境科学领域中国SCI论文占全球份额超过14%。中国科学院关于古生物学、土壤科学、地理学、湖泊学、生态学、气象与大气科学等方面的SCI论文在中国资源环境领域论文中的比例较高。
关键词:农经专业;数据分析;教学改革
2019年12月,农业农村部、中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知,部署了用数字化引领驱动农业农村现代化,加快农业农村生产经营、管理服务的数字化改造的发展战略,将全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平作为农业农村发展的目标[1]。农业农村的数字化建设离不开专业人才的培养。农林经济管理专业毕业生的就业方向主要有农业经营单位、面向农业农村的政府管理部门、事业单位、科研院所等。随着农业农村数字化发展战略的推进,给传统的农经人才培养带来了一系列的挑战[2]。在数字经济和智慧农业的时展背景下,数据分析能力是农经专业学生重要的核心竞争力。如何提升农经专业学生数据分析能力,是农经专业人才培养中面临的重要课题[3]。
1农业农村数字化发展战略给农经人才培养带来的挑战
1.1对农经人才的数据思维的更高要求
在大数据时代,无论是农业生产经营活动,还是农村的行政管理中都有大量的数据资源。农业企业、农业合作经营组织、农产品产销数据、农产品溯源数据为农业经营者提供了生产、物流、销售环节大量的数据资源。经营者需要认识到数据是一种新的生产要素,要调动数据作为生产要素的属性,让数据分析为管理决策服务[4]。在数字中国的建设进程中,各级政府部门工作人员通过各级各部门的行政管理智能,收集了大量省、市、区、县级的区域经济社会发展数据。社区网格化管理下收集了微观层面的农业经营单位数据、农村常住人口数据、医保数据、扶贫数据、农村小额信贷数据。这些数据资源是政府提高行政效率、提高政务服务质量的宝贵资源。
1.2对农经人才的数据分析能力的更高要求
在大数据时代,每天都有海量数据生成,如何能更好地利用这些数据,让数据能发挥其为管理决策服务的功能,与数据使用者的数据分析能力是密切相关的。例如,农业经营单位在农业生产环节的农业投入数据、农产品销售数据、电商平台的客户反馈评论、农产品库存的动态数据,如何整合分析这些数据,要求农业经营者系统掌握数据分析、数据挖掘、文本分析等多元化的数据分析方法。政府管理部门掌握的农业人口的迁移数据、农村常住人口网格管理数据、农村居民医保数据、扶贫数据等,数据类型丰富,数据量庞杂,如何实现数据库的整合,要求政府部门工作人员掌握数据库管理、大数据分析技术。
2农经专业数据分析课程群建设中存在的问题
2.1课程之间连贯性不足
以笔者所在的高校为例,为农经专业本科生开设的数据分析类课程,见表1。数据分析课程群包括了通识教育、专业教育和实践教育。从目前的课程设置来看,涵盖了数据库、统计学、经济计量学、多元统计、大数据分析等领域,内容丰富。数据库应用由计算机学院开设,是一门通识教育课程,在授课时教师往往将其视为一门计算机类的入门课程,在教学中没有针对农经专业学生的特质,将数据库的教学与其在农经领域的应用结合起来。学生在学习中往往会觉得该课程与专业联系不够紧密,教学内容枯燥,缺乏学习兴趣。
2.2学生学习的软件种类繁多,但不够深入
在统计学和多元统计课程中,学生将学习EXCEL、SPSS或者R语言的应用,在经济计量学课程中学生将学习Eviews或STATA的应用,在数据挖掘与大数据分析课程中学生将学习Python语言的应用。在每一门课程中学习的软件都不同,对于软件的学习缺乏连贯性和延续性,虽然学生接触的软件种类多,但是由于学时所限,每一种软件都只是入门级的介绍,无法进入到深度学习。
2.3与专业课学习联系不够紧密,缺乏应用机会
学生缺乏在专业课学习中运用数据分析类课程所学知识的机会。数据分析类课程主要介绍数据分析方法和软件的应用,但大部分都安排在第5学期和第6学期。学生在学习了数据分析方法后,缺少在专业学习领域里运用这些方法的机会。例如学生若要完成产业经济学、农业技术经济学、农产品国际贸易学的专题研究、课程论文,需要用到统计学、经济计量学、大数据分析的方法,但在第2-4学期开设大量专业课的学期,数据分析类课程还没有开设。若能将数据分析类课程尽量靠前安排,学生可以在后续的专业学习、课题研究中运用所学的方法,一方面夯实数据分析技能,另一方面也可以增加学生对专业课的学习兴趣。
2.4排课不够科学
在大三阶段,学生可以选修多元统计、数据挖掘与大数据分析、Python语言三门选修课。但到了大三,学生专业课的学习任务重,选修课种类考虑繁多,学生选课可能出于兴趣、学分安排或者准备考研保研考虑,并不是每一位同学都会选修上述课程。尤其是计算机能力不太强、对数学类课程感到困难的同学,会倾向于选择难度小的课程。
3基于项目驱动式教学理念的数据分析课程群改革
3.1开展项目驱动式教学的意义
项目驱动教学法是基于行动导向的探究式教学方法,是将真实的或模拟的项目转化为教学项目,结合课程内容将项目分解为若干工作任务,创设工作情境,引导学生完成任务,进而实现项目教学目标的教学活动[4-5]。项目驱动式教学法最显著的特点是“以项目为主线、教师为主导、学生为主体”,改变了以往“教师讲,学生听”被动的教学模式,完善了学生主动参与、自主协作、探索创新的新型教学模式。与传统教学方法相比,教学实施过程中,学生的目标更清晰明确,可避免传统课堂教学的被动性,进而提高学生学习知识的兴趣和主动性[6]。在数据分析课程群中引入项目驱动教学,一方面能让学生运用所学的数据分析方法分析现实问题,创设数据分析情境,加深对所学方法的理解和运用,激发学习兴趣,培养自主学习能力;另一方面也可以有针对性地创设围绕“三农”问题的数据分析项目,让学生从数据分析中加深对“三农”问题的感性认识,培养对农经专业学习的兴趣,提升对农经专业的认同度。具体来讲,可以从以下方面开展对数据分析课程群的改革[7]。
3.2统筹规划教学内容,加强课程间的连贯和递进
农经专业数据分析课程群目前主要包括必修课数据库应用、统计学和经济计量学,选修课多元统计、数据挖掘与大数据分析,以及实践课R语言与统计应用、Python语言。统计学教学的重点在于对基础性的统计方法的运用,经济计量学教学的重点在于让学生掌握经济计量分析的范式,如何利用经济计量模型开展实证分析。多元统计强调对复杂多维数据信息的提炼。数据挖掘与大数据分析教学的重点在于大数据时代数据挖掘方法的应用。此外,针对于目前学生所学的软件门类过多,软件操作不够熟练,建议在统计学、多元统计、数据挖掘大数据分析中统一采用R语言进行教学,让学生通过几门课程的学习,能够熟练掌握一种统计分析软件。
3.3基于项目驱动对教学内容进行整合及优化,调动学生主动参与
例如统计学课程介绍了基础性的统计分析方法,在后续课程经济计量学、多元统计、数据挖掘与大数据分析中引导学生运用基础性统计分析方法,对数据进行初步的统计分析和整理,为经济计量分析、多元统计、数据挖掘做好数据处理上的准备,让学生体会到关联课程中所学知识的联结。鼓励学生积极参与“三下乡”活动,开展田野调查实践,围绕“三农”开展调研,运用统计和计量方法对调研数据进行分析,鼓励学生参与到教学中来,培养学生的学习兴趣,学以致用。
3.4建设“项目驱动”实践教学模块
结合农经专业课程体系,建设数据分析课程群“项目驱动”实践教学模块。在农经专业的课程体系中开设的农业经济学、农产品贸易、农村社会学等专业性课程对大量的“三农”问题进行了探讨,这类课程中涉及的城乡差异问题、收入和消费问题、农产品价格波动、农产品贸易等现实问题的研究,都离不开基于现实数据的定量分析。因此,在农经专业的数据分析课程群中可以结合教学内容引导学生对专业课学习中热点问题的研究,围绕课程教学大纲,建设“项目驱动”实践教学模块,理论联系实际,让学生在研究项目中运用所学的数据分析方法,加深对专业知识的理解。
4农经专业数据分析课程群优化方案
在大数据时代,数据分析能力是学生的核心竞争力之一。数据分析类课程在建设中要强调理论与实践的结合,不能只是将教学停留在课堂上,引入体现专业特色的实践教学环节。可以从以下几方面开展数据分析课程群的优化:第一,数据分析基础类必修课安排在大一学年。在第1学期,可以安排R入门、Python入门、数据可视化课程,让学生尽早接触当前主流的数据分析软件,激发学生对R或Python的学习兴趣,让学生自我拓展学习空间。R入门、Python入门、或者数据可视化课程都属于数据分析的基础课程,无需其他先修课程。在这一时期,让学生开始接触数据分析软件,学习数据可视化的分析工具,有利于培养学生的数据思维、数据意识和软件实操能力。第二,将与农经专业课有关的专业必修课统计学、经济计量学安排在第3-4学期学习。统计学课程需要学生先行修读高等数学和概率论课程,经济计量学需要学生先行修读微观经济学、宏观经济学,因此可安排在第3-4学期。让学生在掌握了一定经济管理专业知识后,可以更好地体会统计学、经济计量学方法论学科的应用价值。第三,将数据分析进阶类选修课多元统计、大数据分析、数据挖掘、机器学习等课程安排在第5-6学期。为高年学生提供丰富的数据分析类选修课,让学生结合自己的兴趣、未来的发展规划学习更加多元化的数据分析技术。鼓励学生能在专业论文习作、学科竞赛中有更多的机会运用自己所学的数据分析方法,增加学生的收获感和成就感,挖掘学生的学习潜力。第四,改革课程考核评价体系,采用项目式管理和评估的思路,由学生自主开展一个数据分析项目,从收集数据、提出问题、分析数据到提炼研究结论,开展小组团队成员互评。教师跟踪学生的项目开展过程,从学生的学习态度、投入程度、数据分析质量等综合评价学生的学习效果。
5结束语
将项目驱动教学引入到农经专业数据分析课程群的建设,让学生参与到教学中去,突破传统教学中“教师教学生学”的局面,让学生通过参与项目,运用数据分析方法解决项目中的实际问题,激发学生的学习兴趣和潜能,让学生体会到所学知识的应用价值,让学生不再对数据分析类课程望而生畏。本文的研究对于农经专业学生数据分析能力的培养有重要的意义,强调理论与实践的结合,提高学生数据分析的高阶能力,也能为同类课程开展项目驱动教学提供借鉴。
参考文献:
[1]农业农村部中央网络安全和信息化委员会办公室关于印发《数字农业农村发展规划(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].
[2]李虹贤.农业经济管理专业人才培养模式创新研究与实践[J].智慧农业导刊,2022,2(7):110-112.
[3]冯开文,陶冶.农业经济管理专业实践教学改革———以中国农业大学经济管理学院为例[J].教育现代化,2017,4(23):54-56+63.
[4]杜洪燕,陈俊红.乡村振兴背景下中国数字农业高质量发展路径研究[J].南方农业,2021,15(21):213-214.
[5]金娥.基于项目式学习的《现代教育技术应用》课程学习框架的设计与实践研究[D].武汉:华中师范大学,2021.
[6]胡静,王昌凤.基于应用型本科人才培养目标的项目式教学模式构建[J].教书育人(高教论坛),2022(9):59-64.
关键词期刊评价 引用质量 影响因子 H指数 IF(sub)wh(/sub)指数
1 引言
学术期刊评价是优化学术期刊使用,提高学术期刊内在质量的重要环节,也是学术影响力与科技评价的重要手段。学术期刊评价方法主要有专家主观评价与利用引文分析的定量评价,引文分析法比较客观,是当前评价学术期刊的主流方法。文献计量学家从不同角度提出了许多期刊评价引文计量指标,如传统的文献计量指标:被引频次、影响因子、即年指标、他引率、引用半衰期、被引半衰期等;现代最新发展的文献计量指标:H指数、SJR指数与Eigen-factor等。其中E.Garfield提出的期刊影响因子(Impact Factor,简称IF)影响最广,现已成为国际上通行的期刊评价指标。但随着文献计量学、计算机与期刊数据库的深入发展,影响因子越来越暴露出其不合理一面,如引用质量、自引、跨学科比较、统计源期刊等问题。
鉴于IF与H指数不能反映引用质量以及SJR指数与Eigenfactor计算复杂,笔者(201:1)曾经提出使用熵值法将IF与H指数结合起来构建HIP指数评价科技期刊,该方法仍然没有弥补IF与H指数将期刊之间的引用同等对待的缺点。本文构建一种新的学术期刊评价指标:加权影响因子(IF(sub)wh(/sub)指数),该指数既能反映IF与H指数计算简便、设计巧妙的优点,又体现SJR指数与Eigenfactor计算中考虑引用质量的思想,实现IF、H指数、SJR指数与Eigenfactor的优势互补,得出更为简便、合理的评价结果。本文余下部分结构安排如下:第二部分是对期刊评价计量方法研究进展进行综述;第三部分介绍IF(sub)wh(/sub)指数设计思想及其计算方法;第四部分以20种CSSCI收录图书情报学期刊为例,计算它们的IF(sub)wh(/sub)指数值,在此基础上研究IF(sub)wh(/sub)指数评价与IF、H指数评价以及CSSCI评价的关系;第五部分是对本文及其未来发展方向的总结,以期为IF(sub)wh(/sub)计量指标的研究和利用提供科学依据。
2 期刊评价文献计量指标研究综述
进入21世纪以来,期刊评价取得了一些突破性进展,在文献计量学界影响最大的首先是美国物理学家Hirsch(2005)创造性地提出H指数来测评科学家的成就,H指数兼顾了论著数量和质量。随后,Braun等将H指数引入并应用于期刊评价,即期刊的H指数是该期刊所发表的全部论文中最多有h篇论文至少被引用了h次。短短几年,H指数就已成为文献计量学中评价期刊的重要指标之一。然而,H指数与IF一样,未考虑引证期刊的质量差异,也即对于不同质量的期刊引用某一被引文献是同等对待的,这显然与不同期刊得到的认可度差异较大的现实相背离。因而,随后诞生了考虑引用行为质量的SCImagc Journal Rank(SJR指数,又称期刊声望指数)与Eigen-factor(特征因子)。SJR指数是借鉴Google网页排名的PageRank算法结合Elsevier的Scopus数据库的数据应用而提出的一种新型的期刊评价指标,该算法赋予高声望期刊的引用以较高的权重,并以此规则迭代计算直到收敛。SJR指数同时衡量了期刊被引数量和质量,如果一种期刊越多地被高声望期刊所引用,则此期刊的声望也越高,该指标2008年得到了Nature的报道并被认为是对International StatisticalInstitute(ISI)的期刊影响因子的强有力的挑战。因此,Thomson Reuters科技集团于2009年推出了增强功能的2007版Journal Citation Reports(简称JCR),并新增了重要的文献计量指标――EigenfaetorTMMetrics(特征因子,简称Eigenfactor,包括EigenfactorScore和Article Influence Score)。Eigenfactor是Thomson Reuters与华盛顿大学、加州大学圣塔芭芭拉分校的研究团队构建和完善的,其计算原理与SJR指数设计思想类似,同样依据Google网页排名的PageRank算法。Eigenfaetor基于社会网络理论,并借助完整的JCR引文数据库,通过文献之间的引用关系反映期刊问的关系网络,进而综合评价期刊的权威性和引文影响力。
SJR指数与Eigenfactor同时考察了引用期刊的数量与质量,但sJR指数与EigenfactQr计算较为复杂,而且必须有成熟规范的期刊数据库,目前SJR指数与Eigenfactor分别通过各自数据库(Scopus数据库与JCR的引文期刊数据)计算得到,因而根据SJR指数与Eigenfactor这两个更为科学的评价指标对国内核心期刊进行综合评价尚未普及。国内学者研究多数是对SJR指数与Eigenactor及其算法的理论特性进行研究。赵星、高小强等(2009)较早在国内期刊上引入SJR指数及其计算方法,并探讨了SJR指数与IF、H指数的关系;杨康、刘明政等(2009)将SJR指数与IF各方面的特征进行了详细比较;王一华(2010)对S3R、IF和H指数三种指标之间关系进行比较研究后认为SJR同时兼顾期刊被引数量与质量,从而更优。马丽、赵星(2010)认为H指数和SJR指数区分度弱于中心度和特征因子指标。刘艳华、华薇娜(2009)、任胜利(2009)、窦曦骞、祁延莉(2009)、赵星(2009)与朱兵(2010)从不同视角研究了Eigenfactor评价期刊的特征、优势与不足;米佳、濮德敏(2009)用软件实现了Eigenfaetor算法,并以我国CSSCI收录的图书情报学期刊为样本尝试性地对其进行评价,评价结果表明Eigenfactor与期刊综合指数、H指数、IF存在较强的皮尔逊相关性。苏成、潘云涛等(2009)构建了适用于期刊引用网络的Hypertext Induced TopicSearch(HITS)算法与PageRank算法,并探讨了这
些算法用于期刊评价的优缺点以及适用范围。
正是由于学术期刊评价问题的复杂性,不同文献计量指标评价都有其科学合理的一面,也有其不足的缺憾,为了进行客观、公正、科学的学术期刊评价,国内外众多学者始终坚持探寻新的文献计量指标以获得更为科学合理的评价结果,如近年来国际上出现的一些基于引文的文献计量指标:相对影响因子、论文计数影响因子、期刊使用因子、趋势指数、欧洲因子、权威因子、期刊排名计划(JRS)等。本文借鉴IF与H指数设计巧妙的优点以及SJR指数与Eigenfaetor算法中考虑引用质量的思想,构建一种加权影响因子:IF(sub)wh(/sub)指数,通过对不同引用质量的期刊给予不同的权重,试图进一步改进IF,从而完善学术期刊评价体系。
3 IF(sub)wh(/sub)指数设计
IF(sub)wh(/sub)指数构建的核心思想是,在计算两年影响因子时赋予不同期刊引用大小不同的权重,引证期刊的权重用其H指数大小反映,利用影响因子计算公式计算加权的影响因子即为该期刊的IF(sub)wh(/sub)指数。同理,剔除自引后的IF(sub)wh(/sub)指数记为IF(sub)wh(/sub)。
IF(sub)wh(/sub)指数计算的基本思路是,首先,收集被评价期刊的被引数据;其次,统计引证期刊的引用次数并计算其H指数,对所有引证期刊的H指数除以所有引证期刊H指数的均值,进而得到均值为1的期刊相对H指数(H(sub)r(/sub));再次,用H(sub)v(/sub)代替单独的每条引用(次数),以反映不同权重期刊的引用;最后,利用两年影响因子计算原理,用汇总的H(sub)r(/sub)值代替原计算公式中被引用的总次数进行计算即为该期刊的IF(sub)wh(/sub)指数。即
由IF(sub)wh(/sub)指数计算的基本思路可以看出,IF(sub)wh(/sub)与影响因子具有相同的性质,IF(sub)wh(/sub)指数越大说明该期刊的论文平均影响力和学术作用也越大。IFwh指数具有以下三个方面特征。第一,IF(sub)wh(/sub)指数继承了影响因子设计巧妙的优势;第二,IF(sub)wh(/sub)指数考虑了不同期刊引用质量的差异,以H指数作为期刊引用的权重同样考虑了H指数计算简便以及H指数反映期刊质与量的统一的优势;第三,IF(sub)wh(/sub)指数与SJR指数、Eigenfactor相比,不仅考查了引证期刊的声望,而且计算较为简便。
4 IF(sub)wh(/sub)指数评价期刊实践与分析
4.1 数据来源
本文基础数据来源于中国社会科学研究评价中心的中文社会科学引文索引(CSSCI)数据库与中国科学技术信息研究所中国期刊引证报告(扩刊版)。选择CSSCI(2010-2011年)收录的20种图书情报学期刊作为评价对象,运用IFwh指数对其进行评价实证分析。被评价期刊的被引数据来自CSSCI被引数据库,即在该数据库中查询这20种期刊2008与2009年论文被2010年CSSCI收录期刊引用数据(检索日期2011年6月10日,由于CSSCI被引记录录入时间滞后问题,被引数据可能存在向下偏误)。CSSCI是教育部在全国推广的官方人文社科评价体系,以其收录期刊影响大、编辑出版规范,得到学术界广泛认同,因而以CSSCI引用数据来评价被引期刊质量科学可靠,可以真实地反映期刊质量。评价期刊发文数以及引证期刊H指数等文献计量指标数据来自2010年版中国科学技术信息研究所的《中国期刊引证报告(扩刊版)》,该报告是依托中国科学技术信息研究所国家工程技术数字图书馆“知识服务”系统,在“万方数据――数字化期刊群”基础上,结合中国科技论文与引文数据库(CSTPCD)进行统计分析而编制完成的,规范科学,具有权威性与公信力。被评价期刊发文及其引用指标统计如表1所示。
表1中IF(2010年)是依据两年IF定义计算得到的,即等于各期刊2008、2009年载文在2010年被CSSCI源期刊引用的总次数除以这两年发文数,由此可以看出,两年IF的计算并没有考虑不同期刊引用质量差异的影响。表1中H,指数是指相对H指数,是将各期刊H指数除以这20种期刊在2010年所有102种引证期刊的2009年H指数平均数7.84,以减少H指数的方差,也即相对H指数的平均数为1。表1同时统计了剔除自引后的被引次数,为计算剔除自引后的IF(sub)wh(/sub)指数(简称IF(sub)wh(/sub)指数)提供数据基础。
4.2 图书情报学核心期刊IF(sub)wh(/sub)指数
依据IFwh指数构建思想与步骤,计算得到2010年我国20种图书情报类CSSCI期刊的IF(sub)wh(/sub)指数值与IF(sub)wh(/sub)排名,如表2所示。根据IF(sub)wh(/sub)指数评价,《中国图书馆学报》、《大学图书馆学报》、《图书情报知识》、《图书情报工作》与《情报学报》位居图书情报类核心期刊前5名,这些期刊的IF与H指数也都排名靠前。《情报科学》、《图书馆》、《图书馆理论与实践》、《档案学通讯》与《档案学研究》则位列图书情报类核心期刊最后5名。
表2中IF(sub)wh(/sub)指数是根据剔除自引后的被引数据计算的各期刊IF(sub)wh(/sub)指数。在20种评价期刊中有6种期刊的IF(sub)wh(/sub)指数与IF(sub)wh(/sub)指数评价结果相同,分别是《中国图书馆学报》、《大学图书馆学报》、《图书情报知识》、《图书馆建设》、《情报资料工作》与《图书馆工作与研究》,这些期刊自引量较小,自引对期刊排名影响极小;考虑自引情况,排名差异最大的是《情报科学》,IF(sub)wh(/sub)指数排名16,而IF(sub)wh(/sub)指数排名12,上升4个名次;剔除自引后,排名上升的期刊还有《图书馆理论与实践》上升3个名次,《国家图书馆学刊》与《图书与情报》上升2个名次,《图书馆杂志》与《档案学研究》名次上升1位;其余期刊在剔除自引后,排名均有所下降,其中下降幅度最大的是《图书情报工作》与《现代图书情报技术》,各自下降3个名次,这与期刊的分工细化与定位密切相关,如《现代图书情报技术》是以跟踪技术的研究、应用、交流为主体的专业期刊,从而特色鲜明、方向单一,无可避免地常常引用自己期刊的论文;此外,《情报学报》、《情报理论与实践》、《图书馆》、《图书馆论坛》、《情报杂志》与《档案学通讯》剔除自引后的IF(sub)wh(/sub)指数均有所下降。
4.3 IF(sub)wh(/sub)指数评价与CSSCI评价比较
CSSCI评价依据的是定量(引文文献计量指标)评价与定性(学科专家)评价相结合,CSSCI期刊
评价实质上是主客观相结合的评价方法,具有一定的科学合理性;但利用IF衡量的引文文献计量指标仍然没有考虑引证期刊质量差异的影响,同时专家主观评价也易受到人为因素的干扰。表2中的序号同样是CSSCI对期刊的评价结果,由此可以看出,IF(sub)wh(/sub)指数评价结果与CSSCI排名多数一致,少数期刊略有差异,个别期刊评价结果差异较大,二者名次的Kendall Tau-b相关系数为0.611,统计检验P值接近0.000,在0.01显著性水平下检验显著。
有7种期刊的IFwh指数评价排名与CSSCI评价排名相同,分别是《中国图书馆学报》、《图书情报工作》、《图书馆工作与研究》、《情报杂志》、《图书馆理论与实践》、《档案学通讯》、《档案学研究》;两种评价结果差异最大的是《图书与情报》,CSSCI排名第17名,而IFWh指数排名第7名,IF(sub)wh(/sub)指数排名第5名,分别相差10与12个名次;依据IF(sub)wh(/sub)指数评价而使得名次上升的还有:《图书馆杂志》名次上升7位,《情报资料工作》上升3位,《图书情报知识》上升2位,《大学图书馆学报》与《国家图书馆学刊》名次上升1位。其余7种期刊IF(sub)wh(/sub)指数评价排名比CSSCI评价排名有所下降,其中差异最大的是《图书馆》与《情报科学》,分别相差8与6个名次;《情报学报》与《图书馆建设》均相差3个名次,《情报理论与实践》相差2个名次,《图书馆论坛》与《现代图书情报技术》则仅相差1个名次。
IF(sub)wh(/sub)指数评价与CSSCI评价结果的比较进一步说明了IFwh指数的可靠、合理性。Kendall Tau-b相关系数说明这二种期刊评价方法显著相关,而且IF(sub)wh(/sub)指数还具有避免人为因素干扰、反映引证期刊质量差异、计算使用简便等优点。
4.4 IF(sub)wh(/sub)指数与IF、H(sub)r(/sub)指数相关性分析
IF与H指数作为当前最为流行的两种文献计量学指标,它们将来自所有刊物的引用都平等看待,并没有考虑引证期刊自身的影响力。IF(sub)wh(/sub)指数的制定就是考虑到了不同质量期刊的引用权重,为深入了解IF(sub)wh(/sub)指数的特性,需进一步研究IF(sub)wh(/sub)指数与IF、IF(sub)wh(/sub)、H(sub)r(/sub)指数的相关关系。借助SPSS19.0软件计算,IF(sub)wh(/sub)与IF的Pearson相关系数是0.998,而IF(sub)wh(/sub)与IF(sub)wh(/sub)。是0.989,IF(sub)wh(/sub)指数与H(sub)r(/sub)指数是0.661,统计检验在0.01显著性水平下均显著。图1用散点图的方式揭示了IFWh指数与IF、H(sub)r(/sub)指数、IF(sub)wh(/sub)的相关关系。从图1也可以直观看出,IF(sub)wh(/sub)指数与IF的相关性比IF(sub)wh(/sub)指数与H(sub)r(/sub)指数的相关性更为紧密。这说明,与H指数相比,IF与IF(sub)wh(/sub)指数的相关性更强,这是因为IF(sub)wh(/sub)指数完美继承了IF设计巧妙计算简单的特点,而且还考虑了期刊引用质量的影响。同时,IF(sub)wh(/sub)指数与IF(sub)wh(/sub)指数的相关系数要小于与IF与IF(sub)wh(/sub)指数的相关系数(0.989<0.998),图1中的直线对散点图的拟合情况也验证了这点,表明IF(sub)wh(/sub)指数与IF和IF(sub)wh(/sub)指数的相关性均十分显著,但与IF的相关性更强;而且,IF(sub)wh(/sub)指数不将自引纳入统计范畴,消除了过度自引带来的引文数据偏差。
5 结语
IF与H指数作为当前主流的期刊评价指标,其设计巧妙、计算简便又利于理解,但是它们在计算时都将重要期刊的一次引用与次要期刊的一次引用赋予相同的权重,显然不科学不合理,它们只能部分地反映期刊的影响程度,不能全面地反映期刊的影响力大小。IF(sub)wh(/sub)指数综合考虑了引用次数和引用质量,而且使用H指数反映期刊引用质量并作为引用次数的权重,从而计算加权影响因子,可以弥补IF评价的弊端,又能体现IF与H指数计算简便的思想,更能客观科学地反映期刊的影响力。同时,IF(sub)wh(/sub)指数剔除了自引数据,从而可以揭示更为真实的引用情况和研究对象的学术影响力。本文研究思路同样适用于学科专业和科教人员等层面的科研论文评价。