时间:2022-11-15 01:11:30
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇挖掘技术论文,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
数据挖掘技术是一种新型的技术,在现代数据存储以及测量技术的迅猛发展过程中,人们可以进行信息的大量测量并进行存储。但是,在大量的信息背后却没有一种有效的手段和技术进行直观的表达和分析。而数据挖掘技术的出现,是对目前大数据时代的一种应急手段,使得有关计算机数据处理技术得到加快发展。数据挖掘技术最早是从机器学习的概念中而产生的,在对机器的学习过程中,一般不采用归纳或者较少使用这种方法,这是一种非常机械的操作办法。而没有指导性学习的办法一般不从这些环境得出反馈,而是通过没有干预的情况下进行归纳和学习,并建立一种理论模型。数据挖掘技术是属于例子归纳学习的一种方式,这种从例子中进行归纳学习的方式是介于上述无指导性学习以及较少使用归纳学习这两种方式之间的一种方式。因此,可以说,数据挖掘技术的特征在出自于机器学习的背景下,与其相比机器主要关心的是如何才能有效提高机器的学习能力,但数据挖掘技术主要关心如何才能找到有用、有价值的信息。其第二个特征是,与机器学习特点相比较而言,机器关心的是小数据,而数据挖掘技术所面临的对象则是现实中海量规模的数据库,其作用主要是用来处理一些异常现象,特别是处理残缺的、有噪音以及维数很高的数据项,甚至是一些不同类型数据。以往的数据处理方法和现代的数据挖掘技术相比较而言,其不同点是以往的传统数据处理方法前提是把理论作为一种指导数据来进行处理,在现代数据挖掘技术的出发角度不同,主要运用启发式的归纳学习进行理论以及假设来处理的。
2、数据挖掘技术主要步骤
数据挖掘技术首先要建立数据仓库,要根据实际情况而定,在易出现问题的有关领域建立有效的数据库。主要是用来把数据库中的所有的存储数据进行分析,而目前的一些数据库虽然可以进行大量的存储数据,同时也进行了一系列的技术发展。比如,系统中的在线分析处理,主要是为用户查询,但是却没有查询结果的分析能力,而查询的结果仍旧由人工进行操作,依赖于对手工方式进行数据测试并建模。其次,在数据库中存储的数据选一数据集,作为对数据挖掘算法原始输入。此数据集所涉及到数据的时变性以及统一性等情况。然后,再进行数据的预处理,在处理中主要对一些缺损数据进行补齐,并消除噪声,此外还应对数据进行标准化的处理。随后,再对数据进行降维和变换。如果数据的维数比较高,还应找出维分量高的数据,对高维数数据空间能够容易转化为检点的低维数数据空间进行处理。下一步骤就是确定任务,要根据现实的需要,对数据挖掘目标进行确定,并建立预测性的模型、数据的摘要等。随后再决定数据挖掘的算法,这一步骤中,主要是对当前的数据类型选择有效的处理方法,此过程非常重要,在所有数据挖掘技术中起到较大作用。随后再对数据挖掘进行具体的处理和结果检验,在处理过程中,要按照不同的目的,选择不同的算法,是运用决策树还是分类等的算法,是运用聚类算法还是使用回归算法,都要认真处理,得出科学的结论。在数据挖掘结果检验时,要注意几个问题,要充分利用结论对照其他的信息进行校核,可对图表等一些直观的信息和手段进行辅助分析,使结论能够更加科学合理。需要注意的是要根据用户来决定结论有用的程度。最后一项步骤是把所得出的结论进行应用到实际,要对数据挖掘的结果进行仔细的校验,重点是解决好以前的观点和看法有无差错,使目前的结论和原先看法的矛盾有效解除。
3、数据挖掘技术的方法以及在电力营销系统中的应用和发展
数控挖掘技术得到了非常广泛的应用,按照技术本身的发展出现了较多方法。例如,建立预测性建模方法,也就是对历史数据进行分析并归纳总结,从而建立成预测性模型。根据此模型以及当前的其他数据进行推断相关联的数据。如果推断的对象属于连续型的变量,那么此类的推断问题可属回归问题。根据历史数据来进行分析和检测,再做出科学的架设和推定。在常用的回归算法以及非线性变换进行有效的结合,能够使许多问题得到解决。电力营销系统中的数据挖掘技术应用中关联规则是最为关键的技术应用之一。这种应用可以有效地帮助决策人员进行当前有关数据以及历史数据的规律分析,最后预测出未来情况。把关联规则成功引入电力营销分析,通过FP-Growth算法对电力营销的有关数据进行关联规则分析,从中得出各种电量销售的影响因素以及外部因素、手电水平等的关联信息,以便更好地为电力的市场营销策略提供参谋和决策。对电力营销系统的应用中,时间序列挖掘以及序列挖掘非常经典、系统,是应用最为广泛的一种预测方法。这种方法的应用中,对神经网络的研究非常之多。因此,在现实中应用主要把时间序列挖掘以及神经网络两者进行有效地结合,然后再分析有关电力营销数据。此外,有关专家还提出应用一种时间窗的序列挖掘算法,这种方式可以进行有效地报警处理,使电力系统中的故障能够准确的定位并诊断事故。此算法对电力系统的分析和挖掘能力的提高非常有效,还可判定电力系统的运行是否稳定,对错误模型的分析精度达到一定的精确度。
4、结语
目前,对数据挖掘技术在整个电力营销系统中的应用还处于较低水平上,其挖掘算法的单一并不能有效地满足实际决策需要。但是,由于数据挖掘技术对一些潜在的问题预测能力较强,特别是对电力营销系统中较大规模的非线性问题,具有较强的处理能力,在未来的发展中会成为营销领域中重要的应用工具。
作者:许敏 单位:国网福建省电力有限公司电力科学研究院客户服务中心
1数据挖掘技术
常见数据挖掘技术包括:分类树技术、关联发现技术、聚类技术、人工神经网络、最优集合规约技术以及可视数据挖掘技术等。软件度量数据往往具有多维度、高耦合性,软件工程数据挖掘中会采用一些特殊处理技术,包括统计分析、回归建模、分类树以及神经网络等。在具体软件工程实践中,选择何种挖掘技术,其决定性因素为想要达成的目标。
2数据挖掘实现过程
通常,数据挖掘过程包括4个步骤,即选择数据、预处理、实施挖掘以及吸收数据。数据挖掘整个过程具有交互性,有时数据需要重新选择,有时也要对数据预处理进行改进,也可能出现算法反复被调整现象,基于这种特征,数据挖掘时要设置反馈环。挖掘数据第1步是将管理和目标反映到1个(或多个)挖掘任务中,整个过程可主要划分成为六种:1)评估、预测。评估包括对软件产品、过程以及资源的属性进行相应检查就是整个评估过程,同时也需要根据这些属性,赋值给未知属性,当然这些未知属性需要进行量化。评估工作完成后,要对属性值进行预测。2)分类。检查1个特定实体属性,根据结果将其划分到另1个类别或范畴(事先定义好)中。3)关联发现。关联发现能够识别出特定内容中互相存在关联某些属性。如,可将找出在软件开发属性和产品属性相互关联的内容找出来。4)聚类。将1个结构不相同的群体划分到另1个具有相同结构的子群集合中,这个过程叫做聚类,它的划分依据是成员之间具有高度相似性。5)数据可视化。数据可视化是利用可视化描述方法来定义复杂信息。6)可视数据探察。可视化数据探察是对描述工作的相应拓展,可利用数据可视化交互控制来分析和检视海量数据[3]。它应用具有可视化功能和数据挖掘技术来对数据进行处理。
3挖掘技术在软件工程中应用
上文提及到软件工程度量,部分可利用信息已在海量数据中被提取出来,但普遍认为更为有效且数量众多的数据依然在软件工程相关数据库中隐藏,而没有被发现。实际上,数据挖掘就是1种被公认为提升软件工程度量的技术。图1为数据挖掘在软件工程中的应用。
3.1数据挖掘繁荣原因1)计算机硬件系统和软件系统的基础设施建立具备发现驱动、分析数据等功能;2)每种技术都在实际应用中不断得到改进,其使用能力不断提升。如,模式识别、神经网络等有明显进步趋势;3)数据存储、贮藏、集成成本不高,海量数据可轻松获得。数据挖掘技术被人们认识,并在实践中逐渐被重视,同时也给研究和进一步提高数据挖掘技术提供了便利条件。
3.2面临挑战软件工程自身存在很多数据上的特殊性,给数据挖掘领域研究工作带来制约和影响,主要表现在以下三个方面:1)数据复杂。软件工程数据主要分为两个组成部分,即结构化数据、非结构化数据。结构化数据主要包括缺陷报告、版本信息等内容,而非结构化数据则包含数据代码、相应注释以及文档等内容。结构化数据、非结构化数据并不能同时适用一种算法,而且两种数据间还存在对应联系。如,1个缺陷报告中往往包括缺陷代码段。而结构化数据里常常涵盖部分非结构化信息,非结构化数据中亦是如此,这也是今后工作中需要重点解决的问题之一。2)非传统分析存在局限。数据挖掘最终想实现的目标就是将转化而来的信息传达给用户,实现信息共享。传统数据挖掘技术在使用过程中,信息手段比较单一,如文字、图表等表达形式。其实,软件开发商对信息的要求很高,1个统计结果根本不能满足其工作需求。为促进软件开发不断向上发展,开发人员需要相关信息作为参考依据,包括开发实际案例、编程所需模板、系统缺陷定位以及软件结构设计等。研究数据挖掘技术,提升其实际使用功能,需要不断提交新信息、新知识,并改进相应手方法。3)挖掘结果评价标准不够具体。软件工程数据挖掘尚未形成完善的结果表示体系,其评价体系也有待加强。人员在软件开发过程中需要大量信心,这些信息非常具体且复杂,表示方法不尽相同,互相之间难以做出对比,也很难用定量方法去分析挖掘结果。
4结束语
“数据挖掘”是在发展过程中被人们定义的,但软件工程中对此类数据的研究早就存在。数据挖掘技术能够为研究软件工程数据提供方便,具有重要应用价值。因此,笔者认为将两者充分结合是计算机信息技术发展的必然趋势。若以过程角度来看,软件工程涉及到数据挖掘各个周期、阶段,甚至是具体实施步骤;以技术角度看,数据挖掘在软件工程中应用广泛。数据挖掘技术虽然在实践中取得一定应用效果,但还有更广阔的空间没有内充分挖掘出来,为广大从业人员提供创新空间。
作者:贺玮单位:同济大学软件学院
参考文献的格式是有国际标准和国家标准的,参考文献应该参照GB/T7714--2005著录,我们在精选相关的著名的文献资料,按顺序编码标注,依次列在论文的末尾。关注学术参考网查看更多优秀的参考文献,下面是小编整理的关于数据库论文国外参考文献,给大家阅读欣赏。
数据库论文国外参考文献:
[1]艾孜海尔江·艾合买提.基于Web数据库的数据库挖掘技术分析[J].科技致富向导,2012,24(27):217——219.
[2]刘霞,赵鑫,吕翠丽.数据库挖掘技术在网络安全防范中的应用[J].动画世界,2012,20(06).
[3]尚世菊,董祥军.多数据库中的副关联规则挖掘技术及发展趋势[J].计算机工程,2009(05).
[4]吕安民,林宗坚,李成明.数据库挖掘和知识发现的技术方法[J].测绘科学,2010(04):123——130.
[5]曾霖.基于Web数据库的数据库挖掘技术探究[J].软件,2013,27(02):174——176.
数据库论文国外参考文献:
[1]宋安,习勇,魏急波.基于μCLinux的NAT设备的设计与开发[J].电子工程师,2005-05-15.
[2]徐叶,袁敏,李国军.嵌入式Web服务器远程监控系统的设计与实现[J].计算机与现代化,2013-02-27.
[3]王俊,郭书军.嵌入式Web服务器的实现及其CGI应用[J].电子设计工程,2011-11-05.
[4]高建国,崔业勤.ARTs-EDB的内存数据存储管理[J].微计算机信息,2010-01-25.
[5]陈嘉.嵌入式主存数据库索引机制的研究与改进[D].湖南师范大学,2006:278-282.
[6]刘志东.基于嵌入式Web技术的远程射频识别系统的设计与实现[D].西北民族大学硕士论文,2012-04-01.
[7]贺永恒.基于IAIDL的信息家电体系结构研究[J].中国科技信息,2009(04):154-156.
[8]陈一明.嵌入式数据库的智能家居网关设计[J].微计算机信息,2009-04-15.
数据库论文国外参考文献:
[1]余明辉,胡耀民.基于SQLServer2008决策支持系统模型的研究和应用[J].微计算机信息,2010,26(2-3):178-180+192.
[2]张克友.基于SQLServer财务数据库安全技术的探讨[J].信阳师范学院学报(自然科学版),2008,21(4):587-590.
[3]胡家汉,李景峰.对SQLServer数据库的安全和管理策略探讨[J].计算机光盘软件与应用,2012,(2):101-102.
[4]胡登卫.高校实验室信息化管理系统SQLServer数据库安全策略研究与实施[J].商丘师范学院学报,2009,25(3):96-99+106.
[5]吴可嘉,姜莉莉,刘昌祺.Delphi下利用ADO技术实现对MSSQLServer数据库存取[J].西北轻工业学院学报,2002,20(1):75-78.
关键词: 科研成果管理; 决策支持; 数据仓库; 联机分析处理; 数据挖掘
中图分类号: TN911?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)07?0120?04
Abstract: The traditional scientific research achievement management uses the database to store the result data. The multiple data types of the scientific research achievement and unified storage way become the obstacle to obtain the valid result data in decision?making analysis, simultaneously the traditional scientific research achievement system can only extract the result information. In view of the above problems, the scientific research achievement management and decision support system based on data warehouse is proposed, in which the data warehouse, on?line analysis processing (OLAP) and association rule mining algorithm are integrated. The system supports that the management personnel can discover the potential achievement, evaluate the scientific research projects, and reasonably allocate the human resources. The association rules of the data were mined in college paper database. It is found that paper quantity and time dimension have some relationship, which conforms with the practical training situation. The effectiveness of using Apriori in this system was verified.
Keywords: scientific research achievement management; decision support; data warehouse; OLAP; data mining
0 引 言
传统的科研项目管理过程费时费力,且浪费了大量的人力资源。科研过程中产生的有价值的信息,也被这样死板的管理方法给淹没了,人们不能也不愿意从纸质的资料文献中去发现价值。科研管理方式效率低会严重影响到科研项目开发的进度。随着科学技术的快速发展,科研单位虽然对传统方法进行了改进,开始建立管理系统,但是还远远不能满足要求[1]。
近年来,国内研究机构也开始重视科研项目管理方面的研究,目的多是为了提高项目管理的水平,对优秀的科研成果进行公示,共同分享研究信息[2]。科研成果管理决策支持系统的目的是为了解决传统科研管理系统对成果资源的浪费情况,加强对科研成果信息中潜在知识的利用,提高科研项目管理中对成果管理的有效性,利用数据挖掘充分发挥成果数据的潜力,为管理层提供决策支持依据[3]。
1 SRAM?DSS的需求分析
1.1 功能需求
科研成果管理决策支持系统主要面向科研项目的成果进行管理,这些成果包括学术论文、著作、期刊、专利等。数据仓库的应用可以对成果数据采取智能的分析,将成果数据进行归类和按照成果数据的分析要求进行整理,从中发现成果与项目、人员之间的联系和潜在的规律,帮助决策者调整科研定位,做出科学的决策。
基本管理功能要求用户可以利用本系统完成对成果的基本管理,包括成果提交、 审核、审批等流程的规范管理,还有对保密项目成果的加密处理,不仅要系统能够保存使用过程中存入的成果,还可以导入外部数据库的成果数据,为数据挖掘功能提供数据基础,对数据的集成程度要求很高,因此需要利用数据仓库存放成果数据[4]。
1.2 用户需求
系统的主要角色包括科研员,科研管理员,决策员,数据管理员,系统管理员。
2 总体设计
2.1 科研成果数据仓库的设计
对于科研成果数据仓库从概念模型、逻辑模型、物理模型三方面进行建模。需要根据不同的主题把数据仓库中的数据划分好具体的维度[5]。以成果主题为例,成果数据包括成果名称,成果类型,成果来源,成果性质,成果作者,成果审核结果,所属项目,成果完成时间,成果数量等,以此作为分析的依据。因为数据仓库是多维的,OLAP要在多维数据集之上才能进行,成果数据要满足分析的要求可以根据维层次继续划分,成果类型包括论文,专利,专著,软件成果等;成果性质包括科技,医药,航天等[6]。
(1) 逻辑模型
系统主要用户利用成果信息进行分析,以此来评估科研项目,并为决策者提供决策支持。分析成果事实表中的数据信息有用户维、成果维、时间维。在OLAP分析时可以按照不同的层次进行分析,如图2所示。
(2) 物理模型
在设计数据仓库的物理模型时,定义成果数据的数据标准是需要注意的重点,目的是使成果数据在数据仓库中都有一个统一的格式,定义表示成果的相关属性来描述成果逻辑关系,得到对成果数据仓库的特征进行完整描述。系统采用SQLServer2008建立数据库[7]。利用AnalysisServices获得后台数据库里面的信息,这样建立的数据仓库可以满足需求。
2.2 SRAM?DSS功能的设计
为实现科研成果管理科学,全方位管理,设计成果管理,决策支持,用户管理,系统管理四个模块的内容,并且用户在登陆系统之前要进行身份验证。
(1) 成果管理模块
成果管理主要包括成果查询,添加成果,申报成果,成果审核,成果加密以及成果导出等功能,系统采用分组加密方式进行加密。
(2) 决策支持模块
数据仓库是决策支持功能的数据基础,有了数据就需要更多的操作来完成决策支持。对于系统中不同的数据来源,包括外部导入数据利用ETL过程,实现规范化。然后将符合标准的数据装入数据仓库中。然后针对用户的要求进行联机分析处理和关联规则挖掘。
(3) 用户管理模块
用户在Web地址栏输入URL进入登录,用户名文本框内输入用户姓名,在密码框内输入密码。系统认证平台会判断用户身份,若是新用户要完成注册才能登陆,注册时要填写用户真实的信息,才能获得登陆权利,若用户输入的用户信息正确,登录成功。用户可以在用户管理中进行创建,添加到用户数据表中,也能获得系统的使用权限[8]。
(4) 系统管理模块
系统管理模块主要是针对系统的权限分配,系统维护以及一些常用工具的设计。不同的用户进行的操作不同,能够看到的信息不同,就要求系统控制权限,建立权限分配制度,有利于对用户权限进行合理的分配也保证了系统的安全运行。系统维护是管理系统中必不可少的关键功能,包括对系统用户数据,成果信息数据等的备份工作,实现数据库的安全管理,管理相应功能结构规范性,为系统的更新与升级提供支持。
3 系统实现
3.1 基于数据仓库的OLAP模型
联机分析处理技术能够高效的分析数据,发现事物发展规律,捕获异常和细节。OLAP支持数据分析,而数据仓库里的数据是经过ETL处理后集成到一起,保证了分析在一个快速的时间内给予响应。所以本阶段就是基于数据仓库建立OLAP模型,从而得到更为可靠的数据立方体,既降低了刷新代价又提高了响应速度。
OLAP包括了维和度量,在前面建立数据仓库时已经完成。利用SQL Server中的Analysis Services项目模板建立多维数据集,定义数据源以及建立事实表与维表之间的关系。
OLAP模型对数据仓库中的数据利用MDX进行多维查找,可以有效分析多维数据集。MDX是OLAP的查询语句,语法与结构化查询语言SQL很类似。在成果管理系统中,通过MDX语言把科研员和决策者需要的成果数据查询出来,展现在前台界面里。
利用OLAP模型进行分析,决策者可以依据分析要求,选择更多角度去分析数据,能得到的分析也更多,如下:
(1) 由科研成果的类型分布来看整体项目的侧重重点,以及在成果突出领域的发展机会和潜力;
(2) 由科研成果参与者和第一申请单位作者与项目之间的关系,可以看到参与者职称水平,技术支持水平对成果完成数量与质量的关系,并不是参与者越多的成果越完善,可以以此作为合理分配人才资源参与项目开发的依据,也可以以此评估参与人员的水平,作为考核参考;
(3) 以科研成果在一定时间内的增长,作为项目进度和发展的一个参考标准。也可以看到成果的趋势和项目完成单位的能力和业务的提升;
(4) 可以利用数据库,对以往成果信息进行分析,由于在传统的数据库中不具备OLAP的功能。
3.2 基于数据仓库的关联规则挖掘
基于数据仓库的关联规则挖掘,Apriori算法的核心是提高关联规则产生的效率。利用Apriori算法对科研成果数据进行分析的时候要明确成果的特征,根据成果特征描述来看,适合利用Apriori算法进行关联规则的挖掘。科研成果数据的特征如下:成果数据是按照项目进程时间节点进行录入的,存储在成果库中;成果评估方式不统一,对成果的评估应采取统一的标准;科研成果的数据存储在数据库中,每一个成果都对应一条记录,每一个记录的属性都一样。
以本校论文库的数据为实验数据,在论文管理系统中可导出相关TXT文档数据,利用系统成果导入功能,添加到系统中,对数据进行统一的处理。选取2012―2015年间,数学、物理、计算机、兵器学科的论文成果数据。论文所属学科层次划分到一级子学科,时间层次按照年学年,继续划分下去。
(1) 数据预处理
数据经过清洗,转换,去掉无效的数据,采用统一的数据编码规则,用离散字母代替时间层次,同时将学科按照统一的编码规则,重新编码。进一步按照论文数量划分等级,五份为一级,等级越高代表论文数量越多。
(2) 算法实现
设置最小支持度 min_sup=4,支持度=40%,置信度=80%,通过Apriori算法计算出的关联规则信任度见表2。
(3) 结果分析
采用的实验数据来自于论文数据库,由于学校毕业论文按照培养计划有周期性,学术性硕士的培养周期为2.5学年,所以硕士毕业多集中于第一学年3月份左右,工程硕士的培养周期为第二学年9月份,所以对数据的分析结果多集中于上半年。
规则1表示,在2012年第一学年在5篇以内且2013年第一学年毕业论文在5篇以内的学科专业,则在2013年第二学年在5篇左右的支持度为40%,信任度为80%。
规则2表示,在2013年第一学年在5篇以内且2013年第二学年毕业论文在5篇以内的学科专业,则在2012年第一学年在5篇左右的支持度为40%,信任度为80%。
规则3表示,在2012年第一学年在5篇以内且2013年第一学年毕业论文在5篇以内的学科专业,则在2014年第二学年在5篇左右的支持度为40%,信任度为80%。
3.3 关联规则说明
由于系统中的测试数据多来自网络和本校的数据库,对关联规则的挖掘也许存在偏差,但是整体提供的关联规则数据信息还是符合实际的。简要介绍以下几点:
(1) 选取成果完成人的职称级别和所提交的成果类型与数量作为关联规则挖掘的维度,发现成果完成人职称较低的数量较多,存在关联规则;
(2) 选取固定时间内论文数量和专利数量进行关联规则挖掘,发现时间维度与论文数量多,关联较高;
(3) 对不同高校的成果数量进行关联分析,985与211高校的科研论文,期刊发表数量多具有关联规则。
4 界面展示
用户登陆界面:输入正确的用户名和密码登陆系统,用户可以选择“记住我”,在下次进入系统时可以免登陆,若是新用户第一次登陆系统,需要注册,完成注册后即获得登陆权限。
登陆后看到的首页,左侧导航栏显示了主要的功能,成果展示系统中的成果数量以及系统中的成果列表。
5 结 论
本文在调研了解科研成果管理的决策分析需求的基础上,认真研究了数据仓库的有关技术知识,联机分析处理技术的应用以及数据挖掘关联规则算法的原理。提出了基于数据仓库的科研成果管理决策支持系统。
开发系统应用的主要技术包括OLAP和Apriori算法,将OLAP和Apriori算法结合运用于实际的系统开发中,关联规则计算在OLAP物化了的多维数据集基础上进行,减少了重新计算的时间,使决策分析更加智能化,使数据挖掘的步骤更具目标化,全面提升辅助决策在科研成果管理中的实用价值。
参考文献
[1] 贺建英.大数据下MongoDB数据库档案文档存储去重研究[J].现代电子技术,2015,38(16):51?55.
[2] SUN Hongmei, JIA Ruisheng. Research on the analysis and design of general test database management system [J]. Procedia engineering, 2012, 29: 489?493.
[3] ESLAMIPOOR R, SEPEHRIAR A. Firm relocation as a potential solution for environment improvement using a SWOT?AHP hybrid method [J]. Process safety and environmental protection, 2014, 92(3): 269?276.
[4] KLAUS S R, NEUBAUER J, GOETZ?NEUNHOEFFER F. Hydration kinetics of CA2 and CA?investigations performed on a synthetic calcium aluminate cement [J]. Cement and concrete research, 2013, 43(1): 62?69.
[5] PENG G Y. Marketing decision and decision support system design based on Web [J]. Advanced materials research, 2013, 850: 1048?1051.
[6] 赵维宁.运用数据仓库技术构建电信企业经营分析系统[J].中文信息,2014(8):22?26.
1 医学论文的基本要求
1.1 创新性 医学论文的创新性是指文章要有新意,要发展医学成就,破解医学问题。医学论文有无创新,选题是关键。选题创新是医学论文写作的灵魂,是衡量医学论文价值的重要标准。可体现在:①理论方面的选题应有创新见解,既要反映作者在某些理论方面的独创见解,又要提出这些见解的依据;②应用方面的选题应有创新技术等,也就是要写出新发明、新技术、新产品、新设备的关键,或揭示原有技术移植到新的医学领域中的效果;③创新性还包括研究方法方面的改进或突破。
1.2 可行性 所谓选题的可行性,是指能够充分发挥作者的综合条件和可以胜任及如期完成医学论文写作的把握程度。选题切忌好高鹜远,脱离实际,但也不应过低,影响主客观的正常发挥,降低了医学论文的水平。影响选题的可行性因素有:①主观条件,包括作者知识素质结构、研究能力、技术水平及特长和兴趣等;②客观条件,包括经费、资料、时间、设备等。
1.3 实用性 撰写医学论文的目的是为了交流及应用。要从实际出发,选择够指导科研、指导临床、造福人类的主题,因此,选题的实用性尤为重要。
1.4 科学性 医学论文是临床和医学科学研究工作的客观反映,其写作的具体内容应该是取材客观真实、主题揭示本质、科研设计合理、论证科学严谨、表达逻辑性强、经过实践检验。所以,严格遵守选题的科学性原则,是医学论文写作的生命。
1.5 前瞻性 要选择有研究价值及发展前途的主题,应积极开发研究新领域、新学科和新理论。
2 选题的基本方法
2.1 根据课题研究的结论来确定主题 这是常用的方法,可分为:①以科研的结论或部分结论作为医学论文的主题;②科研结果与开题时预测不一致,待查出原因后,再寻找主题;③科研达不到预期结果,可总结经验,从反面挖掘主题。
2.2 在科研过程中选题 医学科研的过程中,有时会出现意外的现象或问题,作者如果能够细心观察、及时发现,可以在这些偶然中获得新的选题。
2.3 在临床实践中选题 临床工作是医学论文写作取之不尽的源泉,作者在临床中会经常遇到许多需要解决的实际应用问题或理论问题,对此,只要从本学科实际出发,用心思考,会从中产生很多好的主题。其包括:①探讨发病机制与预后情况;②分析临床症状与表现;③研究诊断方法和治疗方法;④疾病的多因素分析等。
2.4 从文献资料中选题 医学文献是人们长期积累的宝贵财富,是医学论文选题的重要来源。阅读最新文献资料,可以了解当前医学科学研究的进展情况,开拓思路、激发灵感,从而挖掘提炼出好的医学论文主题。
3 医学论文的一般体裁
3.1 实验研究 一般为病因、病理、生理、生化、药理、生物、寄生虫和流行病学等实验研究。主要包括:①对各种动物进行药理、毒理实验,外科手术实验;②对某种疾病的病原或病因的体外实验;③某些药物的抗癌、抗菌、抗寄生虫实验;④消毒、杀虫和灭菌的实验。
3.2 临床分析 对临床上某种疾病病例(百例以上为佳)的病因、临床表现、分型、治疗方法和疗效观察等进行分析、讨论,总结经验教训,并提出新建议、新见解,以提高临床疗效。
3.3 疗效观察 指使用某种新药、新疗法治疗某种疾病,对治疗的方法、效果、剂量、疗程及不良反应等进行观察、研究,或设立对照组对新旧药物或疗法的疗效进行比较,对比疗效的高低、疗法的优劣、不良反应的种类及程度,并对是否适于推广应用提出评价意见。
3.4 病例报告 主要报告罕见病及疑难重症;虽然曾有少数类似报道但尚有重复验证或加深认识的必要。
3.5 病例(理)讨论 临床病例讨论主要是对某些疑难、复杂、易于误诊误治的病例,在诊断和治疗方面进行集体讨论,以求得正确的诊断和有效的治疗。临床病理讨论则以对少见或疑难疾病的病理检查、诊断及相关讨论为主。
3.6 调查报告 在一定范围的人群里,不施加人工处理因素,对某一疾病(传染病、流行病、职业病、地方病等)的发病情况、发病因素、病理、防治方法及其效果进行流行病学调查研究,给予评价,并对防治方案等提出建议。
医学论文是医学科研工作的最后阶段,通过文字形式记录医学研究的最新结果。因此,撰写医学论文要把握医学论文的基本要求、选题方法及一般体裁,从而达到主题和形式的和谐统一。
1 医学论文的基本要求
1.1 创新性 医学论文的创新性是指文章要有新意,要发展医学成就,破解医学问题。医学论文有无创新,选题是关键。选题创新是医学论文写作的灵魂,是衡量医学论文价值的重要标准。可体现在:①理论方面的选题应有创新见解,既要反映作者在某些理论方面的独创见解,又要提出这些见解的依据;②应用方面的选题应有创新技术等,也就是要写出新发明、新技术、新产品、新设备的关键,或揭示原有技术移植到新的医学领域中的效果;③创新性还包括研究方法方面的改进或突破。
1.2 可行性 所谓选题的可行性,是指能够充分发挥作者的综合条件和可以胜任及如期完成医学论文写作的把握程度。选题切忌好高鹜远,脱离实际,但也不应过低,影响主客观的正常发挥,降低了医学论文的水平。影响选题的可行性因素有:①主观条件,包括作者知识素质结构、研究能力、技术水平及特长和兴趣等;②客观条件,包括经费、资料、时间、设备等。
1.3 实用性 撰写医学论文的目的是为了交流及应用。要从实际出发,选择够指导科研、指导临床、造福人类的主题,因此,选题的实用性尤为重要。
1.4 科学性 医学论文是临床和医学科学研究工作的客观反映,其写作的具体内容应该是取材客观真实、主题揭示本质、科研设计合理、论证科学严谨、表达逻辑性强、经过实践检验。所以,严格遵守选题的科学性原则,是医学论文写作的生命。
1.5 前瞻性 要选择有研究价值及发展前途的主题,应积极开发研究新领域、新学科和新理论。
2 选题的基本方法
2.1 根据课题研究的结论来确定主题 这是常用的方法,可分为:①以科研的结论或部分结论作为医学论文的主题;②科研结果与开题时预测不一致,待查出原因后,再寻找主题;③科研达不到预期结果,可总结经验,从反面挖掘主题。
大数据背景下的机器算法
专业
计算机科学与技术
学生姓名
杨宇潇
学号
181719251864
一、 选题的背景、研究现状与意义
为什么大数据分析很重要?大数据分析可帮助组织利用其数据并使用它来识别新的机会。反过来,这将导致更明智的业务移动,更有效的运营,更高的利润和更快乐的客户。
在许多早期的互联网和技术公司的支持下,大数据在2000年代初的数据热潮期间出现。有史以来第一次,软件和硬件功能是消费者产生的大量非结构化信息。搜索引擎,移动设备和工业机械等新技术可提供公司可以处理并持续增长的数据。随着可以收集的天文数据数量的增长,很明显,传统数据技术(例如数据仓库和关系数据库)不适合与大量非结构化数据一起使用。 Apache软件基金会启动了第一个大数据创新项目。最重要的贡献来自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是复杂数据准备和ETL的旗舰,可以为许多数据存储或分析环境提供信息以进行深入分析。 Apache Spark(由加州大学伯克利分校开发)通常用于大容量计算任务。这些任务通常是批处理ETL和ML工作负载,但与Apache Kafka等技术结合使用。
随着数据呈指数级增长,企业必须不断扩展其基础架构以最大化其数据的经济价值。在大数据的早期(大约2008年),Hadoop被大公司首次认可时,维护有用的生产系统非常昂贵且效率低下。要使用大数据,您还需要适当的人员和软件技能,以及用于处理数据和查询速度的硬件。协调所有内容同时运行是一项艰巨的任务,许多大数据项目都将失败。如今,云计算已成为市场瞬息万变的趋势。因为各种规模的公司都可以通过单击几下立即访问复杂的基础架构和技术。在这里,云提供了强大的基础架构,使企业能够胜过现有系统。
二、 拟研究的主要内容(提纲)和预期目标
随着行业中数据量的爆炸性增长,大数据的概念越来越受到关注。 由于大数据的大,复杂和快速变化的性质,许多用于小数据的传统机器学习算法不再适用于大数据环境中的应用程序问题。 因此,在大数据环境下研究机器学习算法已成为学术界和业界的普遍关注。 本文主要讨论和总结用于处理大数据的机器学习算法的研究现状。 另外,由于并行处理是处理大数据的主要方法,因此我们介绍了一些并行算法,介绍了大数据环境中机器学习研究所面临的问题,最后介绍了机器学习的研究趋势,我们的目标就是研究数据量大的情况下算法和模型的关系,同时也会探讨大部分细分行业数据量不大不小的情况下算法的关系。
三、 拟采用的研究方法(思路、技术路线、可行性分析论证等)
1.视觉分析。大数据分析用户包括大数据分析专业人士和一般用户,但是大数据分析的最基本要求是视觉分析。视觉分析直观地介绍了大数据的特征,并像阅读照片的读者一样容易接受。 2.数据挖掘算法。大数据分析的理论中心是数据挖掘算法。不同的数据挖掘算法依赖于不同的数据类型和格式来更科学地表征数据本身。由于它们被全世界的统计学家所公认,因此各种统计方法(称为真值)可以深入到数据中并挖掘公认的值。另一方面是这些数据挖掘算法可以更快地处理大数据。如果该算法需要花费几年时间才能得出结论,那么大数据的价值是未知的。 3.预测分析。大数据分析的最后一个应用领域是预测分析,发现大数据功能,科学地建立模型以及通过模型吸收新数据以预测未来数据。 4.语义引擎。非结构化数据的多样化为数据分析提出了新的挑战。您需要一套工具来分析和调整数据。语义引擎必须设计有足够的人工智能,以主动从数据中提取信息。 5.数据质量和数据管理。大数据分析是数据质量和数据管理的组成部分。高质量的数据和有效的数据管理确保了分析结果在学术研究和商业应用中的可靠性和价值。大数据分析的基础是前五个方面。当然,如果您更深入地研究大数据分析,则还有更多特征,更深入,更专业的大数据分析方法。
四、 论文(设计)的工作进度安排
2020.03.18-2020.03.20 明确论文内容,进行相关论文资料的查找与翻译。2020.04.04-2020.04.27:撰写开题报告 。
2020.04.28-2020.04.30 :设计实验。
2020.05.01-2020.05.07 :开展实验。
2020.05.08-2020.05.15 :准备中期检查。
2020.05.16-2020.05.23:根据中期检查的问题,进一步完善实验2020.05.24-2020.05.28 :完成论文初稿。
2020.05.29-2020.06.26 :论文修改完善。
五、 参考文献(不少于5篇)
1 . 王伟,王珊,杜小勇,覃雄派,王会举.大数据分析——rdbms与mapreduce的竞争与共生 .计算机光盘软件与应用,2012.被引量:273.
2 . 喻国明. 大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009—2 012)的舆情模型构建.中国人民大学学报,2013.被引量:9. 3 . 李广建,化柏林.大数据分析与情报分析关系辨析.中国图书馆学报,2014.被引量:16.
4 . 王智,于戈,郭朝鹏,张一川,宋杰.大数据分析的分布式molap技术 .软件学报,2014.被引量:6.
5 . 王德文,孙志伟.电力用户侧大数据分析与并行负荷预测 .中国电机工程学报,2015.被引量:19.
6 . 江秀臣,杜修明,严英杰,盛戈皞,陈玉峰 ,郭志红.基于大数据分析的输变电设备状态数据异常检测方法 .中国电机工程学报,2015.被引量:8.
7 . 喻国明. 呼唤“社会最大公约数”:2012年社会舆情运行态势研究——基于百度热搜词的大 数据分析.编辑之友,2013.被引量:4.
六、指导教师意见
签字: 年 月 日
七、学院院长意见及签字
论文答辩注意事项
答辩步骤
1在毕业论文答辩时,答辩老师首先要求你简要叙述你的毕业论文的内容。叙述中要表述清楚你写这篇论文的构思(提纲),论点、论据,论述方式(方法)。一般约5分钟左右。
2第二步,进行现场答辩。答辩老师向你提出2—3个问题后,做即兴答辩。其中一个问题一般针对你的论文中涉及的基本概念、基本原理提出问题,考察学生对引用的基本概念基本原理的理解是否准确。第二个问题,一般针对你的论文中所涉及的某一方面的论点,要求结合工作实际或专业实务进行讲(论)述。第三个问题,根据学生有一定工作经验,提出专业理论或实务中的问题,引导学生以工作实践中遇到的案例和实务,研讨理论依据。
3注意问题
①自己为什么选择这个课题?
②研究这个课题的意义和目的是什么?
③全文的基本框架、基本结构是如何安排的?
④全文的各部分之间逻辑关系如何?
⑤在研究本课题的过程中,发现了那些不同见解?对这些不同的意见,自己是怎样逐步认[本文来自于JyqKw.com]识的?又是如何处理的?
⑥论文虽未论及,但与其较密切相关的问题还有哪些?
⑦还有哪些问题自己还没有搞清楚,在论文中论述得不够透彻?
⑧写作论文时立论的主要依据是什么?
对以上问题应仔细想一想,必要时要用笔记整理出来,写成发言提纲,在答辩时用。这样才能做到有备无患,临阵不慌。
提示
1、提前熟悉论文,并将所写章节的内容在看看,然后总结三分钟的口述陈述。
2、着正装,带论文、准考证、身份证于11月26日上午8:30到银川市西夏区学院路300号宁夏建设职业技术学院新校区1号教学楼1层阶梯教室,参加论文答辩。名单附后。
3、答辩当天,老师点名后到教室后排号,但是答辩时尽量不要去看事先写好的内容。
4、进入答辩环节时,会有点名考官叫你进去,答辩老师会示意你坐下,大家可以根据自己的情况站着或坐着,不论怎样都要说谢谢老师,态度端正。然后老师会说开始,你就按老师的要求阐述你的论文,要条理性清晰,声音要老师听得到。阐述完以后老师结合你的论文进行提问。
另外从答辩准备环节到答辩结束都要有一颗平和的心,不要紧张,不要词不达意。
最后祝大家答辩顺利。
答辩自述稿模板
尊敬的各位评委老师:
大家好!我是来自……的学生XX,文题目是《……》。我当时之所以选择研究……是因为……,主要表现在:……在着手准备论文写作的时候,我针对……这个命题,大量阅读相关方面的各种资料。对……的概况有了大致了解,缕清思路的基础上确定研究方向,然后与老师商讨,确定论文大致思路和研究方向。然后,为了完成论文,本人收集了大量的文献资料,其中主要来自网上的论文期刊、图书馆的书目、学习教材的理论资料。在……导师的耐心指导和帮助下,经过阅读主要参考资料,拟定提纲,写开题报告初稿,毕业论文初稿,修改等一系列程序,于XXXX年X月X日正式定稿。
具体来说,我的论文分为以下四个部分:
第一部分,主要概述了……,
第二部分,是在对……进行了详细论述的基础上,运用……法对……的深入挖掘。
第三部分,运用……法对……的深入挖掘。
第四部分,……
经过本次论文写作,我学到了许多有用的东西,也积累了不少经验。在这期间,我的论文指导老师……教授对我的论文进行了详细的修改和指正,并给予我许多宝贵的建议和意见。在这里,我对他表示我最真挚的感谢和敬意!
以上就是我的答辩自述,希望各评委老师认真阅读论文并给予评价和指正。谢谢!
成绩评定规则
根据人力资源和社会保障部《关于做好2016年国家职业资格全国统一鉴定工作的通知》(人社鉴发[2016]1号)规定,企业人力资源管理师(一级、二级)全国统一鉴定成绩计算方法如下:
(一)成绩计算:
1、理论成绩=职业道德成绩+理论知识成绩×90%
2、技能成绩=书面技能成绩×100%
3、综合评审成绩=论文内容成绩×40%+论文答辩成绩×60%
(二)理论、技能和综合评审均实行百分制,成绩达到60分以上者为合格,三门成绩均合格的考生,可获得国家职业资格证书。
(三)单项合格成绩保留一年有效,一年期内可任选一次补考机会。补考后仍有单项不合格者,须重新申报原等级全部项目的考试。
论文评定方法如下:
1、论文必须由考生独立完成,字数原则上不少于3000字,侵权、抄袭,或请他人写作,跑题、偏题,或结论不正确,或论据、数据基本不准确,或逻辑结构严重混乱,或语句文字不通顺、病句、错别字太多的论文为不合格论文,不得参加答辩。
2、论文内容部分和论文答辩部分均实行百分制,按答辩委员会中每位成员评定的成绩进行算术平均得出考生论文内容部分的成绩,论文内容部分成绩合格者(占综合评审委员会总数2/3以上委员评分合格且平均分合格的),方可参加答辩。
3、由答辩委员会委员独立对论文内容进行评定,同时提出相应的答辩问题。
4、考生论文答辩部分的成绩由答辩委员会中每位成员评定的成绩进行算术平均得出,2/3以上委员评分合格且平均分合格的为合格。
Abstract: In order to improve graduation papers quality, we should meticulously design to ensure the sound selection of topics, with stress on "applicability"; should elaborately plan to ensure well-done experiments, with emphasis on practicality; should carefully revise to ensure good writing, with stress on "standardization"; should strictly examine and assess to ensure sound oral defense, with emphasis on "scientificity".
关键词: 本科生;毕业论文;质量管理
Key words: undergraduate students;graduation paper;quality control
中图分类号:G64 文献标识码:A文章编号:1006-4311(2010)31-0259-02
0引言
随着我国高等教育大众化进程的深入推进,大多数高校尤其是地方普通高校办学规模急剧膨胀。学生人数激增,教师教学任务加重,科研工作量化,浮躁作风抬头,本科生毕业论文质量下滑、泡沫和危机现象显现。“本科生毕业论文存弃之争”此起彼落。[1-2]放眼我国高教界,围绕本科生毕业论文质量这一主题,各校“八仙过海,各显神通”。老大学依托师资、设备、生源等优势“顺势而为”,新高校凭借贴近应用、跟紧潮流和敢想敢干等特色“乘势而上”。[3-7]
在众多医治本科生毕业论文质量危机的药方中,“真题真做”乃一剂良方。如何做好“两真”呢?我认为应把好“四关”──选题、实验、撰写和评审,突出“四性”──应用性、实践性、规范性和科学性。兹以湖州师范学院化学系化学、化工类专业学生毕业论文为例,简介“真题真做”,抛砖引玉。
1精心设计,把好选题关,突出“应用性”
毕业论文(设计)选题是毕业论文(设计)工作中首当其冲的重要环节。我们为,地方普通高校特别是坐落于地级市的应用型高校,选题质量应着重体现应用性、科学性、实践性、创新性和针对性等方面。具体而言需要遵循“四项原则”,做到“四个结合”。
1.1 本科生毕业论文选题的“四项原则”
1.1.1 应用性原则这是由地方普通高校尤其是地级市普通高校的办学定位决定的,因为这类高校一般以培养应用型人才为己任。学校应积极鼓励师生走出校门,从生产和生活实际中选课题。假如将选题定位于学术性太强、太深或太偏,既与学校定位不相应,也与教师、学生和设备条件不相应,就很可能出现“假、大、空”现象,助长学生脱离实际的“书呆子”气息。
1.1.2 可行性原则各校办学历史、设备条件、师资水平、学生生源和地域文化、产业结构均有较大差异,毕业论文选题应因地制宜,量力而行。所有毕业论文选题必须以学校、实践教学基地和相关合作单位现有师资、学生、设备、经费等实际条件作依托,难易适中,反对脱离实际的大题、偏题、空题。
1.1.3 创新性原则本科生毕业论文虽然不易做到原始创新,但可尽量体现消化吸收再创新或知识集成创新。如配方调整、方法改进、工艺革新等。坚决反对抄袭、拼凑、杜撰等投机行为。
1.1.4 个性化原则毕业论文既有学科、专业的特点,又有导师、学生的差异,还有地域、行业的不同。学校和学院管理部门只制定宏观建议,具体选题交给专业导师和学生在双向选择的基础上协商敲定。
1.2 本科生毕业论文选题的“四个结合”
1.2.1 与学生培养目标相结合毕业论文(设计)选题应符合专业培养目标和教学要求,力求有利于学生综合运用多学科理论知识与技能,有利于培养学生的独立工作能力。选题既要有一定的理论和实践深广度,又要符合学生实际,保证学生在规定时间内经过努力按时完成或取得阶段性成果。
1.2.2 与导师科研项目相结合从导师的在研项目中选取论文题目是一项师生双赢的工作。特别是对于尚未设立硕士学位点的普通高校来说,尽早地从低年级学生中选拔一些优秀生提前进入科研训练,既使导师获得了科研助手,又使学生得到了毕业论文选题。选题应经导师申报、教研室讨论、系院初审、督导组复审、导师修改、题目公布、学生选择等步骤确定。例如,近3年中我从自己主持的省、市科研项目中抽取《纳米TiO2复合丙烯酯乳液的制备》、《纳米SiO2复合丙烯酸酯乳液的制备》、《金属表面TEOS复合涂层的制备与防腐性能》、《金属表面GPTMS复合涂层的制备与防腐性能》、《纳米氧化锆涂料的制备及性能》、《PC表面仿生耐刮涂层的制备及性能》等作为学生毕业论文选题,都取得较好效果。
1.2.3 与生产生活实际相结合毕业论文选题应以满足地方经济发展需要为主线,坚持地方特色,发挥地域优势,挖掘生产和生活中的实际课题。让学生在社会大课堂中通过毕业论文训练学到实际本领,避免纸上谈兵。再如,近3年中我带领学生深入企业选取《密封型电动助力车铅晶蓄电池的性能研究》、《太阳能储能铅晶蓄电池的开发研究》、《高效长寿环保型铁路客车照明用铅晶蓄电池研制》、《速干强粘环保型纸包装粘合剂的研制》、《湖州工业企业中典型危险废物的理化特性研究》、《Ni/Fe3O4复合电磁波屏蔽涂料的研制》等题目指导学生做毕业论文,既完成了毕业论文指导任务,又帮助相关企业开发了新产品或解决了技术难题,还为学生专业实习和就业提供了机会。
1.2.4 与学生兴趣爱好相结合新时期的大学生张扬个性,敢想敢干。张三喜欢“高分子”,李四偏爱“硅酸盐”。因此,毕业论文选题必须以充分尊重学生的兴趣爱好为前提。一是由学生自己主持或参与的开放实验、科学研究项目中衍生而来,二是让学生自行选择导师和课题,三是从生活和实践单位生产实际中自行选题。千万不要以行政命令的方式将管理部门确定的课题硬压给学生去做。
遵循上述“四项原则”和“四个结合”,湖师院化学系学生毕业论文选题基本上做到了“真题真做” (表1),为提高本科生毕业论文质量打下了坚实的基础。
如2010 届化学、化工类专业毕业论文 (设计) 起初公布了近185个选题,最后经师生双向选择等环节确定了153 个选题。按难度分为较难25个、适中113个、较易15个。实验型和理论型题目为30∶1,突出了理工科专业重视实践的特点。
2周密安排,把好实验关,突出“实践性”
实验是培养学生实践能力和创新精神的重要手段。在实验阶段,要求学生既弄清为什么要做这个选题,更好学会怎样做好这项研究?为此,学院应在时间、场地、导师、设备和经费等教学资源方面积极创造条件,提供方便。
2.1 在时间安排上适当错开,体现灵活性因各专业的培养规格不同,就业行业和岗位相异,故毕业论文时间也应有所不同。在制订各专业教学计划或培养方案时,就对不同专业的毕业论文(设计)时间适当地错开安排。如制药工程、材料化学专业安排在第七学期,化学专业安排在第八学期。这样既可缓解学校毕业论文教学资源的紧张程度,又能适应不同行业(企业)的招工要求。
2.2 在场地分配上适当分散,体现立体性随着办学规模急剧膨胀,“学生多场地少”的矛盾日趋突出。为了安排学生人人动手,真题真做,在场地安排上应体现校内与校外、专业与学科、教学与科研相结合的立体化格局。挖掘资源,统筹安排。如教师科研用房、市材料行业技术中心研究室、市先进陶瓷重点实验室、化学实验教学中心和市环保局检测中心、各校外实践教学基地等,都在导师指导下安排学生开展毕业论文实验。
2.3 在导师配备上全员发动,体现专业性针对“学生多导师少”矛盾日益加剧的现实,如何科学合理地配备导师成为能否“真题真做”的关键环节。①全员发动,无论是教师、科研或实验室管理人员,只要是相近专业并具有硕士及以上学历或讲师、实验师及以上职称者,都应适当承担本科生毕业论文指导任务;②适当聘请校外实践基地符合条件的专业技术人员兼任毕业论文导师;③对毕业论文指导计相应的教学工作量,纳入年终统一考核;④对导师和学生实行“双向考核制”(分别填写《本科毕业论文(设计)指导教师审阅表》和《本科毕业论文(设计)学生对导师评价表》)。
2.4 在训练模式上重在实践,体现多样性在毕业论文训练模式上,我们不搞“大呼隆”和“一刀切”,而是根据不同专业的具体特点,采取灵活多样的训练模式,强化“实践”。
①在培养方案中设置贯穿四年的课程论文、学年论文、专题论文和毕业论文训练计划,基本做到从大一至大四 “论文训练不断线”;②从大一(下)开始就鼓励、指导学生申报开放型实验和大学生科研项目,在导师指导下训练科研工作;③从大二开始就对学生进行适当分流。选拔、招收部分对科研感兴趣的学生以“科研助手”的身份和老师对接,学习科学研究;允许志在尽快就业的学生到企业单位进行专业实习和毕业论文,配备两位导师(“技能导师”和“理论导师”);④将有些专业的毕业论文提前到第三学年初开始,早选题、早思考、早实验、早完成;五是在指导方式上充分发挥学生的主动性和创造性,尽量地让学生自己构思、自己确定研究目标、搭建实验装置、设计实验方案、确定实验方法和分析手段。指导教师重在引导学生发现问题、分析问题和解决问题的思维方法和创新能力。
要做好毕业论文工作,除了把好“选题关”和“实验关”外,还必须把好“撰写关”和“评审关”。也许是受到新时期一些快餐文化、网络语言等冲击,时下许多理工科大学生的毕业论文中普遍出现重点不显、层次不明、句子不通、文字错误和标点混乱等现象。此外,假如对论文评审和答辩不重视、不科学,搞形式化、走过场,其质量也将难以保证。因此,我们还强调细心修改,把好撰写关,突出“规范性”;严格评审,把好答辩关,突出“科学性”。限于篇幅暂不展开。
参考文献:
[1]时伟.大学本科毕业论文的弃与存[J].中国高等教育,2010,(7):45-47.
[2]彭江,陆娜.毕业论文应超越“存废之争”[J].教育与职业,2010,(1):40-43.
[3]刘宝欣.关于提高本科毕业论文质量的若干思考[J].科学学与科学技术管理,2007,(12):110-111.
[4]杨庆云,周梅村,纳海莺,李燕.化工类毕业设计(论文) 教学质量监控体系的研究和实践[J].化工高等教育,2006,(4):57-59.
[5]王琪,武寿春.应用型本科院校毕业设计(论文)质量监控的探索[J].江苏高教,2009,(6):84-85.
一、论文一般格式:
1、题目。应能概括整个论文最重要的内容,言简意赅,引人注目,一般不宜超过20个字。
论文摘要和关键词。
2、论文摘要应阐述学位论文的主要观点。说明本论文的目的、研究方法、成果和结论。尽可能保留原论文的基本信息,突出论文的创造性成果和新见解。而不应是各章节标题的简单罗列。摘要以500字左右为宜。
关键词是能反映论文主旨最关键的词句,一般3-5个。
3、目录。既是论文的提纲,也是论文组成部分的小标题,应标注相应页码。
4、引言(或序言)。内容应包括本研究领域的国内外现状,本论文所要解决的问题及这项研究工作在经济建设、科技进步和社会发展等方面的理论意义与实用价值。
5、正文。是毕业论文的主体。
6、结论。论文结论要求明确、精炼、完整,应阐明自己的创造性成果或新见解,以及在本领域的意义。
7、参考文献和注释。按论文中所引用文献或注释编号的顺序列在论文正文之后,参考文献之前。图表或数据必须注明来源和出处。
(参考文献是期刊时,书写格式为:
[编号]、作者、文章题目、期刊名(外文可缩写)、年份、卷号、期数、页码。
参考文献是图书时,书写格式为:
[编号]、作者、书名、出版单位、年份、版次、页码。)
8、附录。包括放在正文内过份冗长的公式推导,以备他人阅读方便所需的辅数学工具、重复性数据图表、论文使用的符号意义、单位缩写、程序全文及有关说明等。
二:论文格式要求:
1、装订顺序:目录--内容提要--正文--参考文献--写作过程情况表--指导教师评议表
参考文献应另起一页。
纸张型号:A4纸。A4210×297毫米
论文份数:一式三份。
其他(调查报告、学习心得):一律要求打印。
2、论文的封面由学校统一提供。(或听老师的安排)
3、论文格式的字体:各类标题(包括“参考文献”标题)用粗宋体;作者姓名、指导教师姓名、摘要、关键词、图表名、参考文献内容用楷体;正文、图表、页眉、页脚中的文字用宋体;英文用TimesNewRoman字体。
4、字体要求:
(1)论文标题2号黑体加粗、居中。
(2)论文副标题小2号字,紧挨正标题下居中,文字前加破折号。
(3)填写姓名、专业、学号等项目时用3号楷体。
(4)内容提要3号黑体,居中上下各空一行,内容为小4号楷体。
(5)关键词4号黑体,内容为小4号黑体。
(6)目录另起页,3号黑体,内容为小4号仿宋,并列出页码。
(7)正文文字另起页,论文标题用3号黑体,正文文字一般用小4号宋体,每段首起空两个格,单倍行距。
(8)正文文中标题
一级标题:标题序号为“一、”,4号黑体,独占行,末尾不加标点符号。
二级标题:标题序号为“(一)”与正文字号相同,独占行,末尾不加标点符号。
三级标题:标题序号为“1.”与正文字号、字体相同。
四级标题:标题序号为“(1)”与正文字号、字体相同。
五级标题:标题序号为“①”与正文字号、字体相同。
(9)注释:4号黑体,内容为5号宋体。
(10)附录:4号黑体,内容为5号宋体。
(11)参考文献:另起页,4号黑体,内容为5号宋体。
(12)页眉用小五号字体打印“上海复旦大学XX学院2007级XX专业学年论文”字样,并左对齐。
5、纸型及页边距:A4纸(297mm×210mm)。
6、页边距:天头(上)20mm,地角(下)15mm,订口(左)25mm,翻口(右)20mm。
7、装订要求:先将目录、内容摘要、正文、参考文献、写作过程情况表、指导教师评议表等装订好,然后套装在学校统一印制的论文封面之内(用胶水粘贴,订书钉不能露在封面外)。
1.纸张与页面设置
(1)A4,纵向;
(2)页边距:上1.0cm,下2cm,左侧2.5cm,右侧2cm
2.页眉
(1)设置:1.4cm
(2)字体:统一使用汉语:小五号宋体。
(3)分割线:3磅双线;
(4)内容:××学院本科期末论文,居中。
3.页脚
内容:页码,居中。
4.论文基本内容与要求
(1)论文题目:单独成行,居中,日语:小2号黑体;英语:TimesNewRoman18号;
(2)作者姓名:另起一行,居中,日语:小4号宋体;英语:TimesNewRoman12号;
(3)内容提要:另起一行,日语:4号黑体,内容为小4号黑体,长度要求150字以上;英语:TimesNewRoman12号,长度要求在100字左右;
(4)关键词:另起一行,日语:4号黑体,3-5个关键词,每个关键词之间用“;”分割,内容为小4号黑体;英语TimesNewRoman12号;
(5)正文
正文部分的要求如下:①正文部分与“关键词”行间空两行;②日语正文文字采用小四号宋体;英语正文文字采用TimesNewRoman12号,标题日语采用四号黑体,英语采用TimesNewRoman14号,每段首起空两格,1.25倍行距;③段落间层次要分明,题号使用要规范。理工类专业毕业设计,可以结合实际情况确定具体的序号与层次要求;④文字要求:文字通顺,语言流畅,无错别字,无违反政治上的原则问题与言论,要采用计算机打印文稿;⑤图表要求:所有图表、线路图、流程图、程序框图、示意图等不准用徒手图,必须按国家规定的工作要求采用计算机或手工绘图,图表中的文字日语用小五号宋体;英语采用TimesNewRoman10.5号;图表编号要连续,如图1、图2等,表1、表2等;图的编号放在图的下方,表的编号放在表的上方,表的左右两边不能有边;⑥字数要求:一般不少于1500(按老师要求);⑦学年论文引用的观点、数据等要注明出处,一律采用尾注。
(6)注释
注释部分的要求如下:①与正文部分空出两行;②按照文中的索引编号分别或合并注释;③“注释”采用五号黑体,注释内容日语采用小五号宋体,英语采用TimesNewRoman9号。
英语注释具体要求如下:
①在文中要有引用标注,如×××[1];②如果重复出现同一作者的同一作品时,只注明作者的姓和引文所在页码(姓和页码之间加逗号);格式要求如下:
[1](空两格)作者名(名在前,姓在后,后加英文句号),书名(用斜体,后加英文句号),出版地(后加冒号),出版社或出版商(后加逗号),出版日期(后加逗号),页码(后加英文句号)。
[2](空两格)作者名(名在前,姓在后,后加英文句号),文章题目(文章题目用“”引起来)(空一格)紧接杂志名(用斜体,后加逗号),卷号(期号),出版年,起止页码,英文句号。
(7)参考文献
参考文献部分的要求如下:①与注释部分间空两行;②应列明期末论文参考的主要文献资料,“参考文献”采用五号黑体,参考文献内容日语、汉语采用小五号宋体,英语TimesNewRoman10.5号。参考文献的著录,按著录、题目、出版事项顺序排列,其格式为:
期刊类:著者.题名[J].杂志名,年份,(期号)。
书籍类:著者.书名[M].城市名:出版社,年份,页数。
网络类:著者.题名[EB/OL].***.com.年-月-日。
③英文作者超过3人写“etal”(斜体)。
英文参考文献格式要求如下:
[1](空两格)作者名(姓在前,名在后,姓与名之间用逗号分开,后加英文句号),书名(用斜体,后加英文句号),出版地(后加冒号),出版社或出版商(后加逗号),出版日期(后加英文句号)。
[2](空两格)作者名(姓在前,名在后,姓与名之间用逗号分开,后加英文句号),文章题目(文章题目用“”引起来)(空一格)紧接杂志名(用斜体,后加逗号),卷号(期号),出版年,英文句号。
科学技术报告
是描述一项科学技术研究结果或进展或一项技术研制试验和评价的结果;是论述某项科学技术问题的现状的文件。科学技术报告中一般应该提供系统的或按工作进程的充分信息,可以包括正反两方面的结果和经验。
学术论文
是某一学术课题在实验性、理论性或观测性上具有新的科学研究成果或创新见解和知识的科学记录;是某种已知原理应用于实际中取得新进展的科学总结,用以提供学术会议上宣读、交流和讨论;是在学术刊物上发表;有其他用途的书面文件。它应提供新的科学技术信息,其内容应有所发现、有所发明、有所创造、有所前进,绝对不允许重复、模仿、抄袭别人的工作。
范文赏析:
广西茶文化生态旅游的开发与建设研究
【摘要】随着广西茶文化的发展,国家已经开始重视广西茶文化生态旅游开发与建设,并且逐渐加大茶文化生态旅游开发与建设力度,然而,在广西茶文化生态旅游开发与建设过程中还存在较多不足之处,影响着广西茶文化生态旅游事业的发展,难以形成良好的发展体系,这就需要相关部门可以制定完善的管理制度,并且根据其发展需求创新开发与建设方式,为其后续发展奠定坚实基础。
【关键词】广西茶文化;生态旅游开发;建设策略
在对广西茶文化生态旅游进行开发与建设的过程中,相关部门必须要树立正确的开发建设理念,根据广西茶文化生态旅游开发与建设情况创新管理方式,保证可以提高广西茶文化生态旅游开发效率与质量,在提高广西茶文化生态旅游行业经济效益的基础上,增强广西茶文化生态旅游行业的竞争能力,使其向着更好的方向发展。
一、茶文化和茶文化旅游
(一)茶文化的内涵
茶文化具体来说就是将茶物象作为载体,并借助这一载体的传播而实现文化传播的一种特殊文化形式,使茶这种实物与文化艺术的有机融合,在一定程度上展现出特定历史时期物质和精神文明的协同发展。在中国,茶文化具有悠久的历史,并且包含丰富的内容,具体涉及到文化艺术、历史考古、科学技术以及经济贸易等多个方面,学术界对茶文化的研究也相对较多,在长时间的研究历程中撰写了大量的茶叶文著作、谱写了众多文辞优美的诗歌,并且基于茶文化的特殊性,对茶文化与祭祀文化、婚礼文化、释家文化等之间的关系进行了研究,对茶文化进行了更深层次的阐释。换言之,中国的茶文化已经不仅仅是茶叶的文化,更是茶、饮茶之人、产茶之地、传茶之路等多种文化的融合体,具有丰富的文化内涵。
(二)茶文化旅游的定义
受到茶文化的丰富内涵的影响,茶文化旅游受到茶文化的影响同样包含丰富的内容,如茗茶产地的自然和人文景观、茶文化所构成的历史遗迹和文学艺术韵迹、茶树地方特色文化等等,多种茶文化相关的旅游产品共同构成了茶文化旅游。基于此,在开展茶文化旅游的过程中应该注意将旅游路线、经典遗迹茶文化代表物品的购买和餐饮、娱乐有机结合在一起,共同构成以茶文化为良好的茶文化消费,切实满足茶文化旅游者的旅游文化需求。
二、广西茶文化生态旅游开发与建设意义
首先,开发茶文化生态旅游可以促进茶文化与茶叶经济效益的共同进步。在对广西茶文化生态旅游进行开发与建设的过程中,会利用广西钟山县与三江县等的茶叶进行生态性开发,并且对茶文化生态旅游进行建设,在促进茶文化发展的过程中,还可以提高生态旅游的经济效益,带领广西茶文化产业的进步,这样,不仅可以起到带头作用,还能使一些与茶文化相互关联的景点景观、茶品购物等经济体系有所完善,促进以文化旅游为核心的茶文化消费。因此,在对茶文化生态旅游进行开发与建设的过程中,可以促进茶文化与旅游事业经济效益的提升。
其次,对茶文化生态旅游事业进行开发与建设可以促进种茶事业的发展。在山西茶文化生态旅游开发与建设过程中,可以通过茶文化的介绍,挖掘出茶文化的历史内涵,并且不断建设茶文化旅游经典,发展茶文化旅游事业。这样,就可以引导种植人员树立正确的意识,科学、合理的开展相关工作,并且引进合适的品种,保证可以塑造出茶文化生态旅游品牌,在提高茶文化生态旅游吸引力的情况下,改善种植业的销售模式,带动种植业的发展,提高茶农的经济水平,达到良好的发展效果。
再次,对广西茶文化生态旅游进行开发与建设,可以培养出专业化与知识化的复合型人才。在广西茶文化生态旅游开发与建设期间,游客在精神与物质享受之外,还需要导游人员的引导与讲解,然而,当前我国关于茶文化生态旅游事业的专业人才较少,由此引发了教育人员对专业人才的重视,并且不断培养出复合性与专业性的人才,进而提高广西茶文化生态旅游开发与建设效果,达到预期的发展目的。
最后,在对广西茶文化生态旅游事业进行开发与建设期间,可以有效丰富广西茶文化生态旅游产品。由于人们的旅游目的不同,对于茶文化的探索与体验需求也不同,丰富茶文化生态旅游产品成为首要任务。在这一观念的引导之下,广西茶文化生态旅游开发部门已经开始研究新的旅游产品,并且鼓励茶文化农户创新茶文化旅游产品,在增加广西茶文化生态旅游内容的基础上,吸引更多的游客,保证可以提高广西茶文化生态旅游事业的发展效率。
三、广西茶文化生态旅游开发与建设优势
在对广西茶文化生态旅游进行开发与建设期间,其存在较多的优势,有利于提高广西茶文化生态旅游事业经济效益的提升。具体优势表现为以下几点:
第一,广西茶叶资源较为丰富,并且茶叶特色突出。在广西地区,茶叶资源较为丰富,主要因为广西的茶叶历史悠久,在唐代的时候就开始生产吕仙茶与象州茶等,迄今为止,中国传统茗茶与新创茶叶品种中,广西地区有三十多种。其中注明的红茶有:广西红碎茶。黑茶有:苍悟六堡茶。绿茶有:桂平西山茶等。花茶有:横县茉莉花茶与桂花茶等。另外,广西地区的早春茶叶采摘的时间较早,受到各类茶叶经营商的喜爱。由此可见,广西地区茶叶资源可以促进广西茶文化生态旅游的长远发展,是其优势条件之一。
第二,广西茶叶发展环境较为良好,可以促进茶文化生态旅游的开发与建设。广西省的山区较多,对于茶叶种植而言,具有较为良好的促进作用。广西山区的日照时间较长,除了挂北等地区之外,其他山区的年平均温度都在22℃左右,最低的温度也不会低于7℃,可以为茶叶生产提供良好的环境。主要因为茶叶生长時间为十个月或是十个月以上,如果温度过低,就会影响茶叶质量。由此可见,广西地区的茶叶生长环境较为优越,适合茶文化生态旅游开发与建设。
第三,广西省政府对茶文化较为重视。近年来,广西省政府制定了茶产业规划制度,并且全面关注茶文化生态旅游开发与建设工作,在为其提供政策支持的基础上,加大了资金的投入,可以提高广西茶文化生态旅游使用的开发与建设质量。
四、广西茶文化生态旅游开发建设的制约因素
当前,广西茶文化生态旅游在开发与建设过程中,还存在较多制约因素,难以提高其开发与建设效率,不能达到预期的工作目的。具体表现为以下几点:
首先,茶文化挖掘力度较差。当前,广西省茶文化的挖掘力度较差,不能更深层次的对茶文化生态旅游进行开发与建设,导致广西茶文化生态旅游开发建设受到抑制性影响。同时,广西茶文化的专门研究机构较少,无法为生态旅游开发建设提供有力的数据支持。
其次,广西茶文化生态旅游开发特色不够鲜明。主要因为在广西茶文化生态旅游开发建设期间,相关管理部门还没有制定完善的开发建设制度,不能明确开发特色,导致出现影响其开发与建设效率的问题。
最后,广西茶文化宣传力度不足。在广西茶文化生态旅游开发与建设期间,相关部门不能根据其需求开展宣传工作,导致广西茶文化生态旅游开发建设效率降低。同时,相关部门没有对广西茶文化生态旅游进行形象定位,缺乏一定的吸引力,不能吸引更多的游客参观,影响着广西茶文化生态旅游开发与建设效果。
五、广西茶文化生态旅游开发与建设措施
(一)制定完善的開发建设规划
广西茶文化生态旅游开发建设部门与政府部门必须要制定完善的规划方案,保证可以提高其开发建设效率。例如:重点关注广西红碎茶与早春名优茶的开发,发挥其在国家茶品牌中的优势,凸显广西茶文化生态旅游特色,保证可以促进旅游事业的发展。
(二)建立专门的茶文化研究机构
在广西茶文化生态旅游建设开发期间,必须要建立专门的茶文化研究机构,保证可以为生态旅游开发建设提供有力依据。首先,要求相关机构借鉴国外茶文化生态旅游开发经验,制定出完善的工作方案。其次,要充分挖掘茶文化资源,保证可以提高其发展质量。最后,要逐渐提高广西茶文化生态旅游开发方案的可靠性,保证可以增强其核心竞争能力。
(三)广西茶文化生态旅游形象设计
广西茶文化生态旅游开发与建设部门必须要重点关注形象设计工作,保证可以为广西茶文化生态旅游树立良好的形象,使得人们对其产生认同感。同时,相关部门还要重视宣传工作,保证可以积极开展茶文化宣传活动,例如:茶叶博览会、茶叶展销会等,或是通过报纸、电视等媒介进行宣传,这样,就可以提高广西茶文化生态旅游的知名度,吸引更多的茶文化爱好者参观。
(四)丰富茶文化生态旅游产品
广西茶文化生态旅游建设开发部门必须要丰富茶文化旅游产品,促进旅游事业的发展。此时,可以借鉴国外的丰富经验,设计茶文化旅游指南、设定茶文化生态旅游主题,例如:民族茶礼区、民族风情表演区等,这样,就可以丰富茶文化产品,为游客提供良好的服务。
(五)培养茶文化生态旅游专业人才
在广西茶文化生态旅游开发建设期间,相关部门必须要重视生态旅游专业人才的培养,制定完善的人才培养策略,为广西茶文化生态旅游事业的发展提供有力支持。首先,可以要求旅游职业技术学院开设茶文化课程,培养专业能力与技术能力较强的茶文化人才,使得旅游人才在全面掌握茶文化历史与基础知识的情况下,参与到广西茶文化生态旅游开发与建设工作中。其次,要配置完善的人才培养基础设施,增强人才培养效果。
六、结语
在广西茶文化生态旅游开发与建设期间,相关管理部门与政府部门必须要制定完善的工作方案,并且加大投资力度,完善相关政策,为茶文化生态旅游开发建设提供支持。同时,还要重视人才的培养,促进茶文化生态旅游事业的长远发展。
参考文献
[1]覃燕玲.广西梧州茶产地茶文化生态旅游开发与生态保护的发展策略[J].福建茶叶,2016,38(04):157~158.
(专业代码:081903 授予工学硕士学位)
一、培养目标
1、较好地掌握基本理论,树立爱国主义和集体主义思想,遵纪守法,具有较强的事业心和责任感,具有良好的道德品质和学术修养,身心健康;
2、系统掌握本学科坚实的基础理论和专门知识,具有从事安全技术工程领域的科学研究或独立担任专门技术工作的能力;
3、比较熟练地运用一门外国语。
二、学科专业及研究方向简介
1、本专业隶属的一级学科为矿业工程。安全技术与工程是针对大型基础设施的公共安全而发展起来的一门新型交叉学科,该学科以保证大型基础设施的安全性和可靠性为目标,主要进行监测技术、检测技术、信息处理技术、控制技术、健康诊断与评价技术等基础理论及应用技术研究。该专业可招收土木工程、交通工程、机械工程、力学、安全工程、信息技术及材料科学与工程等相关专业的本科生。
2、主要研究方向及其内容:
1)结构健康监测与信息处理技术:主要包括结构健康监测技术、监测与诊断系统、监测信息处理技术、数据挖掘技术、远程监测技术等研究。
2)结构健康诊断与安全评估:主要包括结构健康诊断理论和技术、结构健康状态及安全评估技术等研究。
3)既有结构性能评估与控制技术:主要包括既有结构检测技术、仿真分析技术、承载能力及耐久性评定、寿命评估、结构控制及加固技术等研究。
4)大型施工机械安全技术与工程:主要包括大型施工设备的设计、状态监测与故障诊断、施工控制与安全管理等研究。
三、培养方式及学习年限
1、硕士生的培养方式为导师负责制,课程学习和科学研究可以相互交叉。课程学习实行学分制,一般要求在前一年修满所要求的学分。
2、硕士生培养实行学年制,学制2.5年。硕士生的在校学习年限为2~3.5年(含休学)。
四、课程设置与学分要求
课程设置分学位课和非学位课两大类,学位课分为公共学位课、基础理论课、专业学位课,非学位课分为选修课和必修环节。硕士生在校期间,应修最低学分为26学分,其中公共学位课8学分,基础理论课不少于4学分,专业学位课不少于5学分,选修课不少于5学分,必修环节4学分,最高学分不超过34学分。学分积要求是学位课学分积不少于51,选修课学分积不少于15,总学分积不少于66。
课程的考核采取以下几种方式:
方式A:平时成绩(20%)+闭卷考试(80%)的考核方式;
方式B:闭卷考试(50%)+课程论文(50%)的考核方式;
方式C:平时成绩(30%)+课程论文或课程设计(70%)的考核方式;
方式D:考查。
课程
类别课程编号课程名称学时学分开课学期开课单位考核方式
ⅠⅡⅢ
公共课学位课
100401自然辩证法322√人文分院B
100402科学社会主义理论与实践161√人文分院B
101201公共外语64+324√√外语系A
100001专业外语161√B
基 础 理 论 课111105数值分析483√数理系A
111108应用数理统计322√数理系A
111103随机过程483√数理系A
111003有限元法基础483√工程力学系A
专 业 学 位 课121701安全系统工程322√大型结构所B
121702现代结构测试原理322√大型结构所B
121703智能材料与结构322√大型结构所B
120101桥梁结构理论483√土木分院A
120102高等结构动力学42+63√土木分院B
120103高等岩土力学40+83√土木分院B
120105高等混凝土结构学483√土木分院B
120106高等钢结构理论483√土木分院B
120803数字信号处理322√电气分院A
130907模式识别与图像处理322√计信分院C
选 修 课131701结构工程仿真技术322√大型结构所C
131702风险分析322√大型结构所C
131703结构健康监测实验技术322√大型结构所C
131704现代传感器技术322√大型结构所C
131705风工程概论322√大型结构所C
131706结构振动与控制322√大型结构所C
130118工程抗震24+82 √ 土木分院C
130109弹性薄壁杆件理论322√土木分院C
130116环境岩土工程与灾害防治322√土木分院C
131002结构分析及反分析方法322√工程力学系C
130903嵌入式系统及应用322√计信分院C
131201日语161√外语系C
130401人文社科系列讲座161√人文分院C
必 修
环 节140001科研(教学)实践1√D
140002学科前沿报告与学术活动8次1√√D
141501信息检索161√图书馆C
补修课程
五、学位论文要求
学位论文工作是研究生培养的重要组成部分,是对研究生进行科学研究或承担专门技术工作的全面训练,是培养研究生创新能力、综合运用所学知识发现问题、分析问题和解决问题能力的主要环节,也是培养研究生文献阅读能力、工程设计能力、实验能力、数据分析能力和数据处理能力、逻辑推理能力和写作能力的主要环节。要求做到:
1、学位论文的选题必须着重选择对国民经济具有一定实用价值或理论意义的课题,要充分考虑实验的各种条件、课题的份量与难易程度;学位论文的选题必须在第三学期期中(10月底前)完成,开题报告统一交培养单位办公室。
2、学位论文必须在指导教师的指导下由研究生独立完成,研究工作必须坚持实践性、实验性的原则,论文内容应以研究生本人从事的实验、观测和调查的材料为主。对所研究的课题要有自己独立的见解。
3、硕士生论文科研时间一般不少于1年。
4、学位论文实行中期检查制度,一般应在第四学期(5月底)进行,汇报学位论文工作的进展情况,遇到问题和困难及时向导师寻求帮助和指导,保证论文顺利完成。
5、学位论文送审分两批进行,第一批安排在第五学期期中,论文送审截止日为11月10日;第二批安排在第六学期期中,论文送审截止日为4月10日。
6、论文答辩、学位申请和学位授予参照《石家庄铁道学院学位授予工作实施细则》执行。
硕士点负责人:
培养单位学位评定分委员会主席:
(分委员会公章)
年
关键词:异构信息网; 数据挖掘; 查询
中图分类号: TP311.1
文献标志码: A
文章编号: 2095-2163(2016)06-0094-04
0引言
信息网络是一种由图建模的数学模型,其中包含顶点和边两个元素。顶点代表现实世界中的实体对象,边代表实体之间的联系,实体以及实体之间的联系就构成了信息网络。随着信息技术的发展,越来越多的领域开始关注于数据对象之间错综复杂的关系。例如,生物信息学领域中研究基因、酶、蛋白质之间复杂的调控、代谢与交互关系;互联网搜索领域中研究网页与网页之间超链接的关系;社会学和商业领域中研究人与人之间的社会关系。随着信息技术的发展,特别是互联网技术的发展,各种应用领域的信息量都呈爆炸性增长趋势。在现实应用中积累了大量的图数据,例如生物信息学中的基因调控网络、酶代谢网络、蛋白质交互网络;互联网领域的网页拓扑结构图、邮件通讯关系图;在线社交网站中用户之间的社会关系图;城市的道路交通网络、供水排水网络等。信息网络广泛存在于现实世界中,如社交网络、生物网络、道路网络、知识库等。信息网络上的查询和挖掘问题也具有重要的研究意义。
这些图数据的规模还在不断快速增长,其中蕴含了大量有用的知识。挖掘和处理图数据可以得到这些有用的信息帮助用户分析决策。截至2009年9月,全球最大的社交网络Facebook已有3亿多个顶点。这些大规模图数据承载了海量信息。用户根本无法通过视觉观察或手工方法来理解和分析。并且,现实世界中实体不仅仅是单纯的一种类型,而是多种类型的实体同时存在一个网络中;再有,联系也不仅仅存在于同一类型的实体内部,在不同类型的实体之间同样也存在着关系。异构多属性图是包含多种类型顶点和多种类型边的图,其中每种类型顶点具有一组属性。如生物网络、社交媒体网络、在线分享网络等。在图数据规模爆炸式增长的同时,图数据的形式也越来越复杂。因此,海量图数据模型中蕴含着大量有用的知识与信息,亟需从不同维度和不同粒度上对其进行研究提取、挖掘分析。
[BT4]1异构信息网
[BT5]1.1异构信息网的概念
在现实世界中,信息网络通常被假定为同构的,即网络中顶点的类型是相同的(如用户),顶点之间的关系类型也是相同的(如朋友关系)。然而,大多数真实世界的网络是异构的,即顶点和关系的类型是不同的。例如,在医疗保健网络中,顶点可以是病人、医生、医疗检查、疾病、药物、医院、治疗等。把顶点全部看作一种类型,也就是同构信息网络,可能导致丢失重要的语义信息。因此,对具有丰富信息和复杂结构的异构信息网进行分析和挖掘研究是非常重要的。下面将给出异构信息网的形式化定义。
异构信息网是一个有向图G=(V,E,T,R,V,E,A,D,A),其中V是点集合,EV×V是边集合,T是顶点的类型集合,R是边的类型集合。V:VT是顶点类型映射函数,E:ER是边类型的映射函数。A是顶点的属性集合,D是A的域。A:TA是从顶点类型到属性的映射函数。
[BT5]1.2异构信息网的应用
异构信息网可以从交互的大规模数据中构建得来,例如社交网络、科学网络、工程及商业应用等,下面文中则给出几个例子用以具体说明。
1)社交媒体网。 Twitter也可以被看做一个异构信息网络,其中包含顶点类型有用户、推文、标签和词语。2个用户可以互相关注,用户可以或回复推文,推文可以使用词语、并包含某些标签。Flickr是一个图片分享网站,也可以被看成异构信息网。其实现结构中包含的顶点类型有:图片、用户、标签、分组和评论。用户可以上传图片,图片包含某些标签、图片属于某个分组,用户可以对图片发表评论,图片可以有不同的评论。
2)物联网。在智能家居、交通、物流、农业等物联网中,都可以构建出异构信息网。例如,在智能家居网络中,顶点类型有用户、智能终端(空调、热水器、音响等)、智能控制系统、传感器节点、手机或电脑。用户通过手机或电脑远程发送命令给智能控制系统,智能控制系统将命令发送给相应的传感器节点,传感器节点再根据用户的需求发送命令给指定的智能终端对其进行操作。
3)文献信息网络。从DBLP中提取的计算机科学文献信息就是一个典型的异构信息网,其中包含4种类型顶点:论文、会议、作者和关键词。每篇论文对应一个作者集合、一个会议和一组关键词,构成了3种类型的关系。同时,在论文之间还存在引用关系。
4)医疗健康网络。 医疗健康系统也可以被看成一个异构信息网,其中包含的顶点类型有医生、病人、疾病、治疗和设备。病人患有某种疾病,该疾病可以采取特定的治疗方案,使用某种设备,此外,病人也需要由特定的医生负责。
异构信息网可以在很多领域中构建得到,如社交网络、电子商务、社交媒体等许多数据库应用中。异构信息网包含多种类型的顶点和多种类型的边,每种类型顶点包含一组属性。例如,用户的属性可以是其编号、姓名、年龄、城市等。
2异构信息网研究现状
除了异构信息网上复杂的结构信息,顶点的属性信息对于挖掘异构信息网也发挥着至关重要的作用。信息网上现有大多数研究成果都是基于同构信息网的,比如社交网络[1]上的排序、社团发现、链接预测、影响力传播等。然而,这些方法都不能直接用于异构信息网上。这不仅因为连接不同类型顶点之间的不同类型的边所具有的语义不同,也是因为异构信息网包含了比同构网络更丰富的信息。同构信息网可以通过在异构信息网上的投影得到,但是却丢失了大量的信息。例如,作者合作网络可以从更复杂的异构的文献信息网络中投影得到。然而,这种投影操作丢失了有用的信息,如该论文的主题以及该论文作者合作的其它论文等。另外,在原始的异构信息网中蕴藏着丰富的信息,需要设计有效的数据挖掘方法用来探索这些有用的信息。
相比传统同构信息网上的研究,异构信息网上的研究工作才获发展起步。但在最近几年,越来越多的工作开始关注异构信息网方面的研究。异构信息网上现有的研究工作还都比较零散,也未形成规模体系,主要有聚簇[2C7]、基于排序的分类[8- 9]、顶点的相似性搜索[10- 11]、关系预测[12-14]、子图查询[15- 16]、社区发现[17]、实体识别[18]、无结构查询[19]等。下面,文中将分别介绍这些已有的研究成果。
2.1异构信息网上聚簇问题的研究
Rankclus[2]将DBLP网络构建成二分图,根据排序将相同类型的定点进行聚集。信息网络的分析中,文献[4, 7]根据用户选择的顶点类型和簇的种子顶点,对该类型的顶点进行聚簇。文献[6]在顶点属性不完整的情况下,基于顶点的属性和不同类型的关系,对网络进行聚簇。系统通过学习得到不同类型的关系的权重,将用户指定的属性集合带有权重的不同类型关系合并,建立一个概率模型,用于训练出最符合用户需求的聚簇结果。文献[5]以网络中的一种类型顶点为中心,根据元路径将网络分解成为若干个路径图。元路径是不同类型顶点构成的序列,表示了顶点由不同的关系连接起来。例如元路径“作者-论文-作者”代表作者之间的合作关系,元路径“作者-论文-会议-论文-作者”表示在同一个会议发表过论文的作者。通过学习得到每个路径图的权重,将所有路径图加权得到统一的路径图。在该路径图上对顶点进行聚簇。
2.2异构信息网上分类问题的研究
RankClass[8]把排序与分类相结合,对异构信息网进行更好的分析。该方法把顶点进行分类,在每个分类内对顶点进行排序。例如,对于DBLP 异构信息网,先把会议顶点按照领域进行分类,在每个领域内对顶点进行排序,可以使用户很清楚地了解每个领域内影响较大的会议。这种排序与分类相结合的方法,要好于对顶点进行全局的排序。分类对顶点进行排序提高了排序的质量,优秀的排序结果也使分类更为准确。GNetMine[9]研究异构信息网络上只有一部分顶点具有标签,通过将顶点分类,得到所有顶点的标签问题。通过衡量无标签顶点与带有标签顶点之间链接关系的一致性,把无标签顶点与其相关的带有标签顶点划为同一类,得到所有类型顶点的标签。
[BT5]2.3异构信息网上顶点相似/相关性问题的研究
基于元路径的异构信息网上的搜索技术在最近两年得到了关注与重视。Pathsim[10]提出计算2个同类型顶点在给定元路径情况下的相似性的方法。2个顶点通过不同的元路径连接表示不同的含义,其相似性也不相同。信息网上现有的相似性所有工作大多数都集中在同构信息网上。这些工作都忽略了顶点由不同类型的关系连接,具有的含义不同。进一步地,给定查询顶点,Pathsim能够有效地计算出与查询相似度最高的k个顶点,效率远远高于PageRank和SimRank. HeteSim[11]提出构信息网上同类型或不同类型顶点之间相关性的度量。衡量不同类型顶点之间的相似性是十分有意义的。如作者J.F. Naughton与会议SIGMOD相关程度比会议KDD大,青少年更喜欢电影哈利波特,而不是肖申克的救赎。这种不同类型顶点的相关性研究有着大范围的广泛应用,例如推荐系统、聚簇和协同过滤。该方法描述的顶点相关性是基于搜索路径的,2个顶点通过特定的元路径相连。不同的搜索路径含义不同,导致2个顶点的相关程度也将出现不同变化。因此相关性的度量函数也是不对称的。
[BT5]2.4异构信息网上链接预测问题的研究
异构信息网上的链接预测问题已然面世推出了一些重点研究成果。PathPredict[12]提出了异构信息网上预测合作关系的方法。文章用4种度量函数:路径个数、标准化路径个数、随机游走、对称随机游走,来计算2个顶点在所有元路径上的相似性。通过监督模型去训练出不同结构特征的预测权重,得到统一的预测模型。大多数的链接预测工作都是集中在同构网上,并且只关注链接是否发生,而无法预测发生的时间。针对这个问题,文献[13]提出一种链接预测模型,并给出链接发生的未来时间,如作者将于某年在会议上,用户在某个时间将会对电影做出评论等。Anchoring[14]对多个异构信息网之间的用户进行链接预测。单个用户可能在多个社交网络上都拥有注册账号,这篇文章就是为了识别不同的社交网络之间哪些账号是属于同一个用户的。通过用户在社交网络上展现的个人信息、活动时间、地点和文本信息,清晰确认并识别账户的对应关系。当一个人刚刚注册某个社交网站时,利用这种链接预测方法,就可以对其推荐符合标准预期的理想朋友。
2.5异构信息网上子图查询问题的研究
文献[15]研究异构信息网上搜索结构和语义都相似的子图。为了提高效率,利用离线的索引生成候选子图,进一步递归剪枝对候选子图进行验证。文献[16]研究给定查询的模式,计算top-k相似子图的方法。为了解决这个问题,文章提出2种低代价索引:图拓扑索引和最大元路径索引。利用这2种索引,对候选的子图进行剪枝,快速计算得到查询结果。
[BT5]2.6异构信息网上社区发现问题的研究
文献[17]提出动态异构信息网上社区发现的方法。该方法为异构信息网建立社区模型,每个社区包含网络上所有类型的顶点和边。用Dirichlet混合模型为每个时间窗上的网络社区实现建模,能够自动确定社区的实现数量并考虑前一时刻的社区对现在时刻的影响。利用Gibbs采样方法推理出该模型。在该模型上解决符合网络演变规律的社区发现问题。
2.7异构信息网上实体识别问题的研究
SHINE[18]提出了异构信息网上实体识别方法。该文结合实体普及模型和实体目标模型,对异构信息网上的实体识别进行建模。实体普及模型依赖于内容,例如,名字是“Wei Wang”的老师比名字是“Wei Wang”的学生发表的论文数量多。实体目标模型确定元路径的概率,通过期望最大化算法自动学习元路径的权重。
2.8异构信息网上无结构查询问题的研究
GQBE[19]提出在用户不知道网络的顶点类型和结构情况下,只给出查询的元组示例,计算与查询相近的结果。如查询示例为,查询结果可能是,,表示了创立人与公司的关系。该方法构建基于输入的最大查询图,生成查询图的晶格。在晶格上得到top-k相似的查询结果。SLQ研究用户在不了解网络结构的情况下,无需给出准确的查询形式,通过转换函数,查找网络中符合查询的匹配。由于转换函数的代价不同,应用条件随机场得到匹配结果关于转换代价的打分函数,最终输出最佳匹配的top-k个结果。
3异构信息网的未来和挑战
异构信息网的应用日趋宽泛普及,随着信息技术、特别是互联网技术的发展,各种应用领域的信息量都已呈现爆炸性增长趋势。传统技术虽然推出了众多研究成果,但却大多集中在同构网络上。
异构信息网上在线分析处理问题的研究对于异构信息网上知识的提取是至关重要的。现有的信息网络在线处理算法都很简单,缺乏对具体模型定义、执行过程分析(时间、空间、I/O、能耗)、核心步骤优化等层面的深入研究。从立方体计算、物化到OLAP操作,以及复杂的冰山立方体计算等,但却并不适用于图数据。
当前,大规模的信息网络上的挖掘和分析工作已有大量的研究人员在开展理论和技术上的各类探讨,但却仍无法从不同的维度和粒度上为用户分析决策提供有效的视图,以及灵活的在线分析处理。时下的在线处理技术缺乏对信息网络方体格、方体、方体单元详细定义,对于其空间爆炸式增长缺乏可行性技术解决方案;而且,现有技术也缺乏对物化方式、实现算法等的深入研究(对于信息网络而言,中间结果的表示和重用对在线信息网络处理的性能至关重要),缺乏对时间性能、空间开销等的切实充分考虑;现有的信息网络OLAP技术在处理大规模数据方面缺乏良好的数据组织、中间结果物化、高效OLAP算法等性能需求的必须解除设施。在实际问题中,用户关注的目标常常是复杂的信息网络度量,并且只关注那些度量大于给定阈值的立方体,如冰山立方体。迄今为止,这方面的研究工作几乎是零起步、全空白;
随着数据规模的日益增大,信息网络的增长尤其巨大。如何解决信息网络立方体中的海量空间开销即已成为首要关键问题,在每个立方体单元中存储的都是一个子图,而不是传统数据立方体中的聚集值,这就给立方体物化过程提出了现实巨大挑战;
巨量的信息网络除了消耗海量的存储空间外,在其上的巨量计算时间也给研究带来了严峻挑战,尤其是对于复杂信息网络度量。通常情况下,立方体计算需要多次遍历信息网络,这就大大降低了在线处理的效率。如何与用户进行快速交互、且高效实现在线处理已经成为研究学界亟待解决的重要问题。
挖掘带有噪声的、不确定的异构信息网。异构信息网的数据往往是由多个数据源集成而来,而每个数据源的质量不尽相同。数据往往带有噪声,同时部分数据也是不确定的。因此,研究в性肷的、不确定的异构信息网上的挖掘问题对于异构信息网的实际应用则表现出其独特意义及实用价值。
4结束语
随着大数据时代的到来,数据的形式也越来越复杂。随着信息网络的飞速发展,如社交网络、生物网络、道路网络、知识库等,异构信息网应运而生。大多数真实世界的网络都是异构的,即顶点和关系的类型是不同的。异构信息网是包括多种类型顶点和多种类型的边的信息网。异构信息网可以在很多领域中构建得到,如社交网络、电子商务、在线电影数据库等许多数据库应用中。异构信息网能够很好地表达现实世界中不同类型实体以及实体之间的复杂关系。异构信息网上的挖掘问题对于复杂数据形式的分析是十分重要的。本文系统介绍了异构信息网上广泛的应用背景和现有的研究工作,并提出未来的进一步发展方向,期望有更多的研究者投身到这一领域的学术关注和研究中。
参考文献:
[1] AGGARWAL C C. Social network data analytics[M]. New York: Springer, 2011.
[2] SUN Y, HAN J, ZHAO P, et al. RankClus: integrating clustering with ranking for heterogeneous information network analysis[C]//Proceedings of International Conference on Extending Database Technology: Advances in Database Technology. New York, USA: ACM, 2009:565-576.
[3] SUN Y ,YU Y, HAN J. Rankingbased clustering of heterogeneous information networks [JP3]with star network schema[C]//Proceedings of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2009:797-806.[JP]
[4] SUN Y, NORICK B, HAN J, et al. Integrating metapath selection with userguided object clustering in heterogeneous information networks[C]//Proceedings of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2012:1348-1356.
[5] YANG Z, LING L, DAVID B. Integrating vertexcentric clustering with edgecentric clustering for meta path graph analysis[C]//Proceedings of ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2015:1563-1572.
[6] SUN Y, AGGARWAL C C, HAN J. Relation strengthaware clustering of heterogeneous information networks with incomplete attributes[J]. Endowment of Very Large DataBases, 2012, 5(5):394-405.
[7] SUN Y, NORICK B, HAN J, et al. PathSelClus: Integrating metapath selection with user-guided object clustering in Heterogeneous information networks[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7(3):1-23.
[8] JI M, HAN J, DANILEVSKY M. Rankingbased classification of heterogeneous information networks[C]//Proceedings of ACM SIGKDD Int. Conference on Knowledge Discovery and Data Mining. New York, USA: ACM , 2011:1298-1306.
[9] JI M, SUN Y, DANILEVSKY M, et al. Graph regularized transductive classification on heterogeneous information networks[C]//Proceedings of European Conference Machine Learning and Principles and Practice of Knowledge Discovery in Databases. Springer Berlin Heidelberg, 2010:570-586.
[10] SUN Y, HAN J, YAN X, et al. Pathsim: Meta pathbased topk similarity search in heterogeneous information networks[C]//Proceedings of Very Large Databases Endowment. New York, USA: ACM, 2011:992-1003.
[11] SHI C, KONG X, YU P S, et al. Relevance search in heterogeneous networks[C]//Proceedings of international conference on extending database technology. New York, USA: ACM, 2012:180-191.
[12] SUN Y, BARBER R, GUPTA M. Coauthor relationship prediction in heterogeneous bibliographic networks[C]//International Conference on Advances in Social Networks Analysis and Mining. Piscataway, NJ: IEEE, 2011:121-128.
[13] SUN Y, HAN J, AGGARWAL C C, et al. When will it happen? Relationship prediction in heterogeneous information networks[C]//Proceedings of ACM International Conference on Web Search and Data Mining. New York, USA: ACM, 2012:663-672.
[14] KONG X, ZHANG J, YU P S. Inferring anchor links across multiple heterogeneous social networks[C]//Proceedings of ACM International Conference on Information & Knowledge Management. New York, USA: ACM, 2013:179-188.
[15] YU X, SUN Y, ZHAO P, et al. Querydriven discovery of semantically similar substructures in heterogeneous networks[C]//Proceedings of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012:1500-1503.
[16] GUPTA M, GAO J, YAN X. Topk interesting subgraph discovery in information networks[C]//Proceedings of IEEE International Conference on Data Engineering. Piscataway, NJ: IEEE, 2014:820-831.
[17] SUN Y, TANG J, HAN J, et al. Community evolution detection in dynamic heterogeneous information networks[C]//Proceedings of the Eighth Workshop on Mining and Learning with Graphs MLG at KDD. New York, USA: ACM, 2010:137-146.