时间:2023-05-30 10:18:36
开篇:写作不仅是一种记录,更是一种创造,它让我们能够捕捉那些稍纵即逝的灵感,将它们永久地定格在纸上。下面是小编精心整理的12篇服务器维保服务,希望这些内容能成为您创作过程中的良师益友,陪伴您不断探索和进步。
关键词:网络基础设施;网络管理;基于角色的访问控制;ITIL
1 概述
随着国家教育战略和社会的发展,四川广播电视大学(以下简称“四川电大”)的信息化建设已经进入了一个新的时代。随着信息化建设工作的推进,四川电大购入越来越多的网络基础设施,如何使用、管理和运维好这些网络基础设施,成为了一个亟待解决的课题。
近几年,四川电大在网络基础设施方面投入了大量资金,校园网络基础设施得到加强,中心机房达到一定规模。截止2016年8月,校园网已实现中心机房万兆双链路核心,千兆网络到桌面,出口带宽达400兆,并新部署和改造了920个有线网络接入点,新布设光缆达8公里,实现了弱电线路全部下地。校本部部署有128个无线AP,实现了主要办公场所的无线网络覆盖,并实现了有线和无线接入的统一认证。中心机房实现了规划、科学的功能区划分,已有100余台服务器、3套网络存储设备、2台核心交换机、2台高性能防火墙、2台网络行为管理、2台负载均衡的规模。新建设的服务器虚拟化系统,也已于2016年初投入运行。
数量繁多的网络基础设施的新增,对我校网络管理运维人员带来了新的挑战。结合工作中的实际情况,我们发现以往传统的通过Excel表格统计各类网络基础设施的相关数据,再使用纸质笔记本记录设备相关维护保修信息的手工式管理办法,已经不能对现有的设备进行有效的管理。经过多次讨论,我们认为有必要对现有的网络基础设施数据进行有效整合,包括:设备的硬件参数、软件运行情况、IP的地址的分配、域名的分配、过往的运维情况、存放的位置等。因此,建立一个网络基础设施管理系统势在必行。在数据整合的基础上,通过数据和设备之间的关联性分析,使网络管理人员在工作过程中有据可循,提升管理的高效性和精确度,进而实现对现有设备的最优化使用、管理和运维。
众多学者对网络基础设施管理系统的建设模式进行了研究。兴嘎[1]在2011年就撰文介绍了智能基础设施管理系统的相关概念,并对其进行了技术经济分析。汲汾[2]在其硕士答辩论文中则详细阐述了云计算环境下基础设施管理系统的总体设计框架与实现思路。王珏、邱雪松[3]又对系统中核心的适配器技术进行了重点研究。上述研究成果都对四川广播电视大学网络基础设施管理系统的设计和应用提供了有益的指导和帮助。
2 系统功能
从使用功能来看,该系统分为三个部分:其一是基础设施的管理,对设备的相关信息进行添加、编辑、删除;其二是数据统计,对导入系统的数据进行统计;其三是系统管理,对系统的设备、用户、角色、功能节点进行管理。
2.1 基础设施管理模块
基础设施管理又分为五个小模块,分别是:服务器管理、交换机管理、域名管理、公网IP管理、维保管理。
服务器管理整合了:管理员、设备编号、用途、设备型号、存放地址、过保时间、服务器序列号、操作系统、CPU信息、内存条信息、硬盘信息、分配IP地址、服务器上的虚拟机以及维保记录。
交Q机管理整合了:管理员、设备编号、设备类型、设备型号、存放地址、过保时间、端口信息、管理地址、维保记录。
域名管理整合了:域名、公网IP、域名用途、到期时间、安全等级、等保时间、ISP、DNS解析、管理员、备案号、状态。
公网IP管理整合了:公网IP、公网端口、内网IP、内网端口、状态。
维保管理整合了:管理员、设备编号、设备类别、关键字、维保描述、维保公司、维保时间。
基础设施管理模块能对设备的上述信息进行删除、修改和添加。
2.2 数据统计模块
数据统计又分为四个小模块:服务器统计、交换机统计、域名统计、IP地址统计。
此模块能将管理模块所录入的数据进行统计,以柱状图、饼图、折线图、热力图等形式展现,或以Excel表格的形式导出。
2.3 系统管理模块
系统管理模块又分为四个小模块:设备管理、用户管理、角色管理、节点管理。
设备管理模块,管理此系统中的所有设备信息。
用户管理模块,管理用户的增加、删除和编辑。
角色管理模块,定义用户角色,定义什么样的角色有什么样的权限。
3 权限设计
考虑到系统中管理的网络基础设施对四川电大整个网络环境的安全管理工作至关重要,所以课题组对系统的权限管理部分进行了重点设计,以最大限度地保障信息的安全可控。
系统以RBAC[4](Role-Based Access Control,基于角色的访问控制)为模型来构建。在RBAC中,权限与角色相关联,用户根据其职能职责被分配到指定的角色,从而获得角色所具备的所有权限。权限可以根据需要很方便地向角色授予或从角色回收,角色与角色之间还可以建立关联或继承的关系以覆盖更多现实中的客观情况,这在很大程度上简化了权限管理的工作。
用户Help_user与角色Help_role通过映射表Help_user_role关联,角色Help_role与权限Help_node通过映射表Help_access关联,就是RBAC最简易模型,基于角色的权限模型。
【关键词】桌面云虚拟化刀片服务器
一、信息技术的发展加速刀片服务器应用
回顾互联网资源配置的变迁过程,最早的服务器出现在网络的客户端/服务器(C/S)结构中,客户端和服务器共同分担处理任务。后来客户端进一步变瘦,通过浏览器直接接入应用,即浏览器/服务器(B/S)结构。随着互联网应用的增多,多数机构、各个部门都架设了自己的服务器,导致服务器种类和数量出现井喷,如邮件服务器、数据服务器、安全服务器和视频服务器等等。大量服务器运营和维护的负担,以及高能耗又促使新型服务器的诞生。以减轻机构自身维护服务器的成本。
所谓刀片服务器(准确的说应叫做刀片式服务器blade server)是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块“刀片”实际上就是一块系统主板。它们可以通过“板载”硬盘启动自己的操作系统,如Windows NT/2000、Linux等,类似于一个个独立的服务器,在这种模式下,每一块母板运行自己的系统,服务于指定的不同用户群,相互之间没有关联。由于每块“刀片”都是热插拔的,所以,系统可以轻松地进行替换,并且将维护时间减少。这些刀片服务器在设计之初都具有低功耗、空间小、单机售价低等特点,这些设计满足了密集计算环境对服务器性能的需求.而从外表看,与传统的机架式服务器/塔式服务器相比,刀片服务器能够最大限度地节约服务器的使用空间和费用,并为用户提供灵活、便捷的扩展升级手段。与相同计算能力的常规服务器相比,刀片式服务器可降低30%左右的能耗。
二、桌面云构建灵活高效企业办公平台
传统桌面PC作为企业IT中的最普遍也是最重要的办公设备,由于PC是一套独立的系统,主要由使用者自行控制,难以集中管理与维护。在企业运转中,越来越暴露出其弊端和不便,面临着如下关键挑战:信息易泄露,系统安全性低;管理难,维护烦,效率低;资源利用率低下,系统叠加复杂度高,投资收益率低;高能耗、高排放、运行成本高,企业、社会效益难提高。企业必须寻找一种灵活的基础架构,来解决IT供需矛盾和企业信息安全问题。桌面云正是这样一个最佳的云计算实践,采用最新的云计算的技术和理念,引领着IT基础架构的变革和创新。
桌面云解决方案是端到端一体化虚拟桌面解决方案。它是将桌面计算机的计算和存储资源(包括CPU、硬盘、内存)集中部署在数据中心机房,通过虚拟化技术将物理资源转化为虚拟资源;企业根据用户的需求将虚拟资源集成为不同规格的虚拟机,向用户提供虚拟桌面服务。
桌面云系统大大提升了资源的利用率,节省了资金投入。
降低了能耗需求,支持环保。传统PC的功耗一般在200W以上,而桌面云系统平摊到每台虚拟机的功耗一般为35W左右。考虑到桌面云系统的连续运行,在采用节能技术后,桌面云每台虚拟机仍然可以节约70%以上的功耗。
简化了IT管理。统一的运维平台,使得桌面云可以快速发放业务、集中管理办公系统的各类软件,相对于传统的PC办公系统,桌面云的运维效率提升10倍以上。
三、刀片服务器构建IT虚拟化办公新平台
公司现有的刀片服务器E6000采用8U/10刀片架构,单框最大支持40个CPU,其超强的计算能力完全满足公司现有业务应用对计算能力的要求。在E6000上可以非常流畅的运行VMware的虚拟化软件。通过VMware,服务器物理资源被虚拟成多个虚拟机,提升系统资源利用率,减少物理设备数,降低系统复杂度。
P键词:医院信息系统;三级等保;信息安全
1 引言
随着网络与信息技术的发展,尤其是互联网的广泛普及和应用,网络正深刻影响并改变着人类的生活和工作方式。越来越多的医院建立了依赖于网络的业务信息系统,比如HIS、OA、财务系统等等,它们提供了日常办公所需的业务,便利了工作。互联网对社会各行各业产生了巨大深远的影响,与此同时,信息安全的重要性也在不断提升。
医院信息系统是医院实现办公电子化、网络化、无纸化的重要平台,同时也是开展日常工作的重要平台。然而,近年来,随着网络信息安全的快速发展,安全威胁正在飞速增长,尤其混合威胁的风险,如黑客恶意攻击、蠕虫病毒、木马等,有可能会给医院的信息网络和核心系统造成严重的破坏。所以,建设一个全面、安全的信息系统已刻不容缓。
2 系统现状安全分析
医院信息系统现状拓扑图如上图1所示,从整个网络拓扑图可以看出,现阶段医院主要有两个网络出口,包括连接医保专网及连接互联网,互联网区域主要提供给外端用户通过VPN连接接入到内部服务器。在安全防护方面,除了在医保专网的出口边界区域部署有防火墙外,其他地方都没有部署有相应的安全防护措施,主要表现在以下几点:
1)网络出口边界区域缺少相应的入侵防护系统,无法对来自外部的蠕虫、木马、病毒、恶意软件及僵尸网络进行安全防护;
2)在互联网边界区域缺乏相应的防病毒系统,无法对来自互联网的恶意代码攻击、病毒等进行检测和拦截;
3)在内部网络中缺乏相应的安全审计系统,无法对内部的网络行为、服务器访问操作行为等进行审计和日志记录;
4)在Web类服务器前端缺少相应的Web安全防护设备,无法对针对Web服务器的SQL注入、跨站脚本(XSS)、跨站伪造攻击等进行安全防护,同时缺乏相应的网页防篡改系统;
网络内部缺乏漏洞扫描设备,无法对内部服务器系统进行漏洞扫描及漏洞管理;
5)在内部网络缺乏相应的运维审计系统,无法针对内部服务器、数据库、网络设备及安全设备进行统一的安全运维;内部重要服务器上没有安装防病毒系统,无法对服务器进行安全防护,容易遭受病毒的攻击。
3 建设思路
3.1 建设方法
信息安全体系框架是实施安全建设的灵魂和核心,它提供了构建和管理信息系统安全性的理论指南、流程、工具和指标。定义了全面风险管理和安全措施部署的设计路线和方针。使信息系统安全建设在标准化和完备的设计依据中进行,使建设过程具体而可控。从而维护信息价值从输入端至输出端的可信性和可控性;形成完备的事前监控预警、事中防御控制、事后审查追溯的防护机制。呈现持续改进的安全运行管理闭环。
医院信息系统的信息安全建设会同时依据国家/行业政策标准的指导,因而需要结合现实的业务特点与管理情况,构建各类别各层面信息系统的差异化、本地化保护能力,并通过制订运行管理策略,形成面向当前安全措施及关键系统的运行配置、未知风险的预警与控制情况。
适度化的安全建设思想能够将上述的方法论贯穿于信息资产的运行周期中,使各阶段、各层面的安全机制相互补足而形成体系,避免了安全建设的重复实施和过度投资。
3.2 方案效果
在等级保护要求中,医院信息系统安全提出网络访问控制、网络入侵防护、恶意代码防范(防病毒)、安全审计、漏洞管理、运维审计、安全集中管理等需求。本次信息系统安全建设需要完成以下目标:
1)边界安全防护
在医院专网互联区边界处部署防火墙,对内部服务器进行基础安全防护,实现边界的网络安全访问控制,保证服务器的安全。(利旧)
2)恶意代码防护
在医院互联网边界处部署绿盟NF防病毒系统(NF),对来自外网的病毒文件进行安全拦截,保证内部服务器的安全,实现内部网络的恶意代码防护。
3)网络入侵防护
在医院服务器前端部署绿盟入侵防护系统(NIPS),对来自外网、专网及内部用户的木马、病毒、蠕虫以及各类网络攻击行为等进行拦截,保证内部服务器的安全。
4)Web安全防护
在服务器区如果部署有Web类服务器系统(OA办公系统等),需要在服务器前段部署Web应用防护系统(WAF),对来自互联网的针对Web应用的攻击进行安全防护,如SQL注入、跨站脚本、恶意扫描等攻击进行阻断防护,同时,在服务器上部署防篡改软件系统,对文件进行 安全保护。
5)安全审计系统
在医院核心交换机处旁路部署安全审计系统(SAS),通过网络数据的采集、分析、识别,实时动态监测通信内容、网络行为和网络流量,发现和捕获各种敏感信息、违规网络行为,实时报警响应,全面记录网络系统中的各种会话和事件,实现对网络信息的智能关联分析、评估及安全事件的准确全程跟踪定位,做到出现问题时有源可溯。
6)运维安全管理
在运维管理区部署安全运维堡垒主机(SAS-H),对日常所有网络设备以及服务器等的运维进行详细的记录,保障系统运维的安全性。
7)系统安全管理
在医院运维区处部署漏洞扫描系统,可以利用漏洞扫描系统对网络中的系统、网络设备等进行扫描,第一时间主动对网络中的资产进行细致深入的漏洞检测、分析,并给出专业、有效的漏洞防护建议,让攻击者无机可乘。
在医院内部服务器及主机部署防病毒软件,可以有效地对内部终端和服务器等进行病毒防护,保证系统不会因为受病毒感染而造成系统宕机、数据受损等严重事件。
8)集中安全管理
在运维管理区部署安全管理平台(ESPC),对所有的安全设备进行统一管理,实现整个信息系统安全状态的在线分析、在线监控、在管理,提高安全管理效率。
3.3 项目效益
安全技术设施足以保障系统的核心区域,关键信息安全管理制度初步形成,并借助外力形成一定的安全支撑能力,整体信息系统安全和稳定得到保证。
通过完善安全运维管理支撑体系,保证运维的安全、稳定,使得医院信息系统自身具有较高的安全运维能力。
信息系统符合三级等保标准关键要点的要求,确保信息系统通过等级保护测评(覆盖等级保护基本80%以上要素,整个信息系统基本符合等级保护要求)。
4 总结
信息安全没有绝对性,从技术复杂度来说,单一防护模式很容易被突破,只有实施多层防护,才能消除单点隐患。通过建立“一个中心下的三重防护体系”才能增加突破难度,降低安全风险;做到全可达、全可控、全可查。层层防护旨在实现非法破坏“进不来”,即使进来也“拿不走”,即使拿走也“读不懂”,即使有恶意行为也“跑不了”。
医院信息系统的安全管理是一个不断变化的管理过程,随着时间的推移,管理理念、信息技术以及医院信息化程度的不断变化,医院信息系统安全管理的发展思路也应该要与时俱进的不断变化,要根据阶段性的信息安全目标不断的对安全管理体系加以校验和调整,以保证医院信息安全管理体系始终适应和满足实际情况的发展需要,只有做到这样的管理模式,才能够建设更健康的、合理的、有效地使医院信息系统更安全。
参考文献:
[1] 迪普科技助力新疆医疗系统[J]. 数字通信世界,2014(4).
关键词:云胶片;互联网+医学影像;互联网+医疗
目前国内大多数医院,给病人的影像检查结果大都还是物理胶片,由于物理胶片与原始的DICOM影像相比没有可操作性,不利于医生对病情的判断,往往病人重新拍片。目前放射科的放射设备均已经接入PACS系统,实现了DICOM上传,可直接通过手机终端扫描影像报告单上的二维码,查询其影像报告并调阅到电子胶片图像,极大地提高了医疗效率和改善了医疗服务质量。
1云胶片系统架构设计
1.1搭建院内云胶片服务器
为了能及时、快速地把患者的检查报告和影像资料同步到外网云胶片服务器,在内网搭建了一个对应的云胶片服务器作为中转站,将云胶片数据实时推送至外网云胶片服务器,并且云胶片数据推送不会对院内影像系统的数据产生影响。定时将院内影像系统新增的检查数据同步到内网云胶片服务器的数据库中,再由内网云胶片服务器,定时向外网云胶片服务器推送检查记录和影像数据。
1.2内外网数据交互
医院信息网络是所有网络中安全性要求较高的网络之一,因此医院网络系统由2部分构成:一是用于日常医疗信息交换的业务网,俗称内网;二是可以及时获取Internet信息资源的办公网,俗称外网。医院内网是保障医院业务开展的平台,为了有效保障其安全,医院进行了严格的内、外网隔离,这2套网络互不通讯。内网相对安全,对保证医院业务系统的安全稳定的运行起到积极作用,需要建立内外网数据交互区来解决内、外网隔离的问题;搭建一个中转服务器,用于内外网之间的数据交互,院内云胶片服务器先将胶片影像数据推送至内外网数据交互区,再由数据交互区,将数据推送至外网云胶片服务器。
1.3外网数据传输
患者通过云胶片查看检查影像资料时,是直接访问外网的云胶片服务器的,而外网云胶片服务器接收到请求后直接返回相应的影像资料信息,不会经过医院的内网,保证了内网数据安全的同时,又提升了数据交互的效率。
2云胶片系统应用
2.1线下检查报告自助打印
检查报告和胶片发放传统的操作过程非常繁琐,云胶片上线后,报告可在自助机上打印且不发放物理胶片。佛山市中医院CT和MR登记处外各安装了2台自助报告打印机,患者可以到登记处自行打印纸质报告,登记人员不需要整理报告和胶片发放给病人,大大减少了检查科室登记人员的工作量,对于患者来说,能节省排队取报告的时间,就大大缩短诊时间。佛山市中医院作为全国规模较大、以骨伤科著称的大型三甲医院,2020年云胶片报告数为107467份,使用云胶片后,节省了大量的胶片耗材,有利于环保。
2.2线上查看报告和影像
云胶片“线上领取,医患共享”(见图1)。云胶片平台全面实现了传统胶片及报告的电子化应用,并能在第一时间反馈给患者及管辖医生,患者无需到院,直接通过手机查看自己的检查结果和完整的影像资料,避免现场排队。患者关注医院微信公众号并绑定就诊卡或住院号后,医院会推送检查报告结果消息,患者点开检查报告结果消息链接就可以实现在手机上查看全部原始影像资料和文字报告。避免了患者多次往返医院排队领取纸质报告和传统胶片的情况。患者还可以通过微信等方式分享云胶片二维码给医生,医生扫描患者分享的二维码就可以在线查看到患者的影像资料和检查报告。
2.3手术室电子阅片器
佛山市中医院的20个手术室都有安装云胶片电子阅片器,通过手工录入患者信息或者扫描检查报告上的二维码来查看手术患者的检查报告和检查图像,不需要跑到电脑前使用临床影像查询系统进行查看,而且电子阅片器是触屏的,方便医生操作,可以对图像做三维重建(见图2)。
2.4线上检查结果通知
当检查诊断医师提交保存检查报告后,会通过微信公众号、支付宝生活号或者以短信的形式推送消息到患者手机上,患者点开消息就可以使用云胶片查看检查报告结果和影像资料,而且可以对影像进行缩放、移动、三维重建等操作,减少到医院的次数,患者无需在院排队等待打印报告,检查完就可以离开医院,减少检查时间。
2.5实现放射检查信息共享
由于开启了电子化服务,患者可以通过移动终端随时找到合适的医生问诊和会诊,医院之间的共享互认变得可能;就诊方便,不用携带厚重的胶片看诊,只需带上手机或者平板;云胶片避免重复检查,节省医疗费用,满足人民群众多元化健康服务需求。
2.6优化检查流程
常规胶片服务模式下,患者需要按照流程进行开具检查单、预约、缴费、排队检查、排队领取结果等一系列步骤,导致患者就诊时间较长,工作效率低下的同时还会对患者的治疗时机造成一定的影响,加剧患者与医院之间的关系。患者完成检查后,需要到登记处外等候领取报告和胶片,诊断医生提交报告后还需要文员打印纸质报告和物理胶片,然后呼叫患者到登记处取报告,有时离院后还要再返回医院取报告,多次往返医院耗费时间和费用。有了云胶片,患者完成检查就可以离开医院,不需要等待领取纸质报告和物理胶片,只需要通过医院微信公众号及时了解报告情况并查看结果,减少患者就诊时间,提高患者就诊满意度。综上研究,“互联网+医疗”是互联网在医疗行业的新应用,云胶片使患者可通过手机查看检查影像资料和电子报告,从而减少患者在院检查时间;云胶片在患者转诊时可进行分享调阅。云胶片技术替代物理胶片是大势所趋,“互联网+医学影像”的深度融合,能够减轻患者负担,优化就医流程,提升患者的就医体验和改善医疗服务的质量。
参考文献
[1]邱晨飞.“互联网+医疗”新应用——暨我院全面启用云胶片[J].计算机产品与流通,2018(6):278.
[2]柏志安,杨郁青,徐彦栋.基于HIE技术的集团医院影像云平台设计方案[J].中国数字医学,2017,12(6):88-90.
关键词:虚拟化技术;虚拟服务器;虚拟化架构系统;中心机房
中图分类号:TP308文献标识码:A文章编号:1009-3044(2011)18-4308-02
1 传统的中心机房管理模式
随着社会的急遽发展,网络平台越来越彰显出其不可或缺的重要地位。新功能不断拓展,各种应用软件借助网络平台相继实施,丰富的应用给提供运行服务的中心机房提出了更高要求。
由于各应用软件彼此间操作系统的版本、开发的平台和具体的应用都有着很大不同,为避免应用软件交叉引起的软故障,在传统的中心机房管理模式中,往往给新增加的应用系统单独配置服务器,即用一台服务器部署一种应用软件。这势必导致服务器数量直线上升、维护量迅猛增加。毋庸讳言,随着数字技术的普及与深化,传统的中心机房管理模式已呈掣肘之势。具体有:
1)随着服务器数量的增加,服务器购置成本也相应增高;
2)新应用系统方案的实施包括了采购新服务器、安装OS系统和应用软件等一系列工作流程,全程耗时较长;
3)有的应用软件运行时只占用很少的系统资源,对应服务器的硬件资源大半处于闲置,得不到充分利用;
4)在对服务器硬件进行扩容时,其对应的软件业务系统将被迫中断;
5)当服务器系统出现故障时,服务器的修复工作,如恢复OS系统、应用软件、业务数据等,时间将长达数十小时;
6)当服务器出现硬件故障时,因维保厂商提供并更换配件的周期难以控制,造成应用系统的完全中断,严重影响了业务的开展;
7)容灾可避免相关业务因服务器故障而随之中断,但是,容灾需要双机热备,所需资金量翻番;
8)服务器的增加带来中心机房网络节点的增加,故障节点也与之同比增加;
9)服务器的增加带来服务器维护成本的增加,尤其是过保服务器的维保费用,所需不菲;
10)在人员配置不变的基础上,应用系统和服务器数量的增加,将带来中心机房工作人员工作量的增加和工作效率的降低。
这些亟待解决的问题使中心机房应对的环境变得日益复杂。服务器购置成本、硬件维护成本、软件管理成本呈线性增长,服务器运行能耗及空调等机房附加能耗也急剧增加,原有的机房运行能力已经难以满足现有的运行需求,整个中心机房处于超负荷运行的混乱状态。显而易见,传统的中心机房管理模式已经跟不上时展的要求,对中心机房管理模式的变革势在必行。在当下,采用虚拟化技术,打造虚拟化技术下的中心机房管理模式,应该是解决这一系列问题的捷径。
2 虚拟化技术下的中心机房管理模式
随着计算机硬件的不断发展,特别是多核CPU的出现和内存、总线架构的革新,使得虚拟化技术得到飞速发展。在一台高性能多核服务器上创建多个虚拟机,可以完成传统方式下多台物理服务器才能完成的工作。
2.1 虚拟化架构系统
一套完整的中心机房虚拟化架构系统由若干个物理服务器上安装的虚拟化主机程序、一个数据存储系统、一个集中管理平台三部分组成。
2.1.1 虚拟化主机程序
虚拟化主机程序是整个虚拟化架构系统的基础组成,也是核心部分。它是一个功能强大的虚拟层,采用基于底层硬件系统的软件技术,直接安装在每一台物理服务器的裸机上,其上再创建虚拟服务器。多台虚拟服务器运行在一台物理服务器上,这彻底颠覆了为多个应用系统配置多台物理服务器的传统模式。
虚拟化主机程序负责分配硬件资源给各个虚拟服务器,根据不同应用将物理服务器上的处理器、内存、存储器和网络资源按需求划分到各个虚拟服务器中。每个虚拟服务器之间关系就如同放置在中心机房中的物理服务器一样,相对独立、互不影响。对于使用者来说,虚拟服务器和物理服务器也没有太大区别:在虚拟服务器上安装配置Windows或Linux操作系统,系统安装完成后再安装相关应用软件;单个虚拟服务器也能够同时使用多个CPU,来支持诸如SQL数据库、Exchange Server等需要强劲处理能力和巨大硬件资源的应用系统;虚拟化主机程序中还设有虚拟交换机功能,可以将虚拟服务器划分到不同的网络环境中。虚拟服务器的安装方法、实际性能与物理服务器完全相同,具有良好的操控性。
与传统的物理服务器相比,虚拟服务器可以针对不同应用系统分配不同的硬件资源,做到物尽其用。通常说来,中心机房同一批次采购的物理服务器配置差别不大。但是,不同应用软件对服务器配置的要求却并不一样,如DNS服务只需要一个很低配置的服务器就能够运行良好,而像SQL数据库这样高访问率、高吞吐量的应用软件则需要高配置的服务器才能保证其稳定运行。这就意味着一些配置要求不高的应用软件同样也占用了一台高配置的物理服务器,造成应用硬件资源的大量浪费。物理服务器之间彼此独立,即便其他服务器应用硬件资源严重紧张,那些闲置的资源也无法调配给它们使用。采用虚拟化架构系统后,虚拟化主机程序可以通过创建资源池为虚拟服务器在运行过程中实时调配硬件资源。若有虚拟服务器出现现时段硬件资源不足的情况时,可以借用一台或多台非满负荷运行的虚拟服务器闲置资源,在线进行重新分配;待应用运行压力降低后,再将暂借的资源归还给相应的虚拟服务器,从而最大限度地提高这些虚拟服务器所在那台物理服务器硬件资源的利用率。根据测试,传统的物理服务器应用方式,服务器硬件资源的平均利用率只有5%―15%;而采用虚拟化架构系统整合、调配后,服务器硬件资源的平均利用率可以达到60%―80%。
2.1.2 数据存储系统
虚拟化架构系统中的虚拟服务器实际上由磁盘文件和配置文件组成,这些虚拟机文件存放在数据存储系统中的虚拟存储空间内。数据存储系统的创建又有本地存储或共享存储两种类型。
本地存储直接建立在安装虚拟化主机程序的物理服务器上,由虚拟化服务器所配置的硬盘容量决定虚拟化存储的空间大小。采用本地存储方式,初期投入成本较低、结构简单,但扩展性和功能性不够理想。
共享存储需要借助专用的共享存储设备,如SAN、ISCSI、NFS等。共享存储设备和中心机房多台安装虚拟化主机程序的物理服务器建立连接后,便实现了共享存储。在共享存储设备上创建的虚拟存储系统空间具有共享访问的功能,同一时间多台建立连接的服务器均可以同时访问。共享存储降低了对虚拟化服务器存储的要求,让虚拟化服务器专注于对应用软件的处理。在存储容量不足的情况下,共享存储设备还可以在线扩容。采用共享存储方式,初期投入成本较高,结构复杂,但其优越的扩展性和功能性为虚拟化技术高级功能的实施打下了基础。
2.1.3 集中管理平台
为了对虚拟化架构系统进行高效的管理和性能的监控,中心机房需要配置一立的集中管理服务器,为所有安装虚拟化主机程序的物理服务器搭建集中管理平台。登陆集中管理平台,可以对所有加入集中管理的虚拟化服务器进行一站式操作。
在集中管理平台的检测、协调下,虚拟化主机程序、共享数据存储可以实现虚拟化技术中的高级功能,如虚拟资源动态分配、虚拟服务器动态迁移和故障切换保护等功能。利用共享存储设备,集中管理平台可以对相连接的跨物理服务器资源实施动态分配,使多台物理服务器上的硬件资源完全共享;甚至可以对各虚拟服务器实施跨物理服务器的动态迁移,使服务器资源真正达到负载均衡。集中管理平台不间断地对中心机房进行实时监测,当物理服务器被检测出有硬件故障时,集中管理平台能够迅速反应,将故障机上的虚拟服务器主动迁移到其他相连接的物理服务器上,实现了故障切换保护的自动化进程,保证了应用系统的连续运行。
在虚拟化架构系统中,虚拟化主机程序、数据存储系统、集中管理平台三部分紧密合作,为虚拟服务器稳定、高效、安全的运行提供了坚实保证。
2.2 中心机房虚拟化应用的优势与原则
对比传统的中心机房管理模式,虚拟化技术下的中心机房管理模式具有无可比拟的优越性:
2.2.1 降低运营成本
虚拟化架构系统的应用,充分利用了物理服务器的硬件资源,有效减少了物理服务器的数量。随着物理服务器数量的减少,服务器购置成本、硬件维护成本、软件管理成本、服务器运行能耗、空调等机房附加能耗等都相应降低。
2.2.2 提高运营效率
传统模式中,新应用系统方案的实施需要服务器采购、安装、调试等环节。虚拟化架构系统中的虚拟服务器由若干个磁盘文件和配置文件组成,要创建新的虚拟服务器只需要直接复制这些文件。直接复制文件能够快速部署新应用系统,大大降低了创建配置时间,有利于满足客户端需求,提高了运营效率。
2.2.3 提升服务水平
虚拟化架构系统中高级功能的应用,尤其是虚拟资源动态分配、虚拟服务器动态迁移、故障切换保护等功能,确保了应用系统能够独立自主地连续、安全运行,使中心机房管理人员不再需要投入大量时间去维护硬件系统。而能够将主要精力放在对应用系统的维护中,从而有效提升客户服务水平。
虚拟化架构系统的应用,能够打造出生态、高效的中心机房环境。即便如此,对中心机房进行虚拟化改造也要遵循适度的原则,以“高稳定、低成本”为最终目标:一是不能为了虚拟化而虚拟化,避免矫枉过正。要最大限度利用中心机房原有的设备及资源,严格按照物理机的方式进行管理,并充分考虑到虚拟化实施后的可扩展空间,以适应未来技术的发展趋势。二是不能一蹴而就,避免好大喜功。对中心机房服务器和应用程序平台要分批进行优化整合,循序渐进。先对应用压力较小的服务器进行虚拟化架构,积累了足够经验和应对能力后,再逐步迁移应用压力大的服务器。
虚拟化技术作为一种新兴的计算机技术,是对技术、操作、应用、管理,甚至是理念的根本转变。在这种背景下,作为IT业界的领导者Intel、Amd不断推出多核服务器和虚拟化架构系统,加上系统集成商的大力推进,使得虚拟化技术飞速发展,局域网的虚拟化应用已成为计算机应用研究的一个热点,正在对传统的中心机房管理模式提出挑战。打造虚拟化技术下的中心机房管理模式,必将成为未来发展的趋势,具有广阔的应用前景。
参考文献:
[1] 英特尔开源软件技术中心、复旦大学并行处理研究所.系统虚拟化――原理与实现[M].北京:清华大学出版社,2009.
[2] 英特尔开源软件技术中心、复旦大学并行处理研究所.虚拟机系统与进程的通用平台[M].北京:清华大学出版社,2009.
关键词: 信息化建设;虚拟化;动态迁移;IT基础架构
0 引言
随着企业各类信息化的发展,信息化建设的不断深入,当前的传统模式与技术手段逐渐显现出了一些问题:不断增加的物理设备和有限存放空间的矛盾、维持运行环境的高能耗制冷设备成本、部署应用程序的兼容性问题,系统的可靠性和稳定性等,这些都将影响企业信息化建设的进程。虽然企业在不断加大投入,但总体资源利用率始终处于较低的水平。与此同时,科技的日益发展,处理器的制造工艺不断提升,架构变得越来越先进,核心数越来越多,处理器的计算能力与日剧增。为了提高资源的利用率,虚拟化技术应运而生。利用虚拟化技术可以对IT基础设施进行整合、简化管理、为信息应用提供很好的支撑。尤其是虚拟化动态迁移技术,在实际的应用中具有很强的实用性,能够帮助我们在线维护、在线升级服务器,还可以用于负载均衡,容灾等方面,极大的提高系统的综合性能,提升系统可靠性、稳定性[1]。
1 服务器虚拟化概念
服务器虚拟机,就是对一台物理服务器进行划分,通过使用软件模拟物理计算机,创建独立的操作系统,逻辑上与主机服务器相隔离,使一台物理服务器能够支持多个操作系统的并发执行,多个虚拟机之间彼此隔离,无需再为一方面服务器利用率低而另一方面为了部署新的应用而不得不购买新服务器的情况而支付额外的成本[2][3]。服务器虚拟化技术可以整合降低工作负载,解决机群管理中动态切换服务、降低硬件成本的需求,帮助企业节省大量的资金。
对于管理员而言,虚拟机只是运行在物理计算机上的一个应用软件,但是对于虚拟机中运行的应用程序而言,它就是一台真正在工作的计算机。通过虚拟化技术可以扩大硬件的容量,简化软件配置过程,显著地提高服务器的工作效率。目前,针对X86架构的虚拟化技术已经成为业界的焦点,被广泛用于服务器领域。
2 服务器虚拟化的价值
2.1 现状描述
随着企业各种应用软件的不断引入,各类系统不断的增加。出于操作系统版本的差异,软件开发运行的平台不同,开发商的不同,以及应用相互之间的协调和安全性方面的因素考虑,通常服务器都会采用独立运行、集中管理的模式,这种方式可以有效的解决各系统之间因潜在的兼容性,避免可能引起的冲突,但由此也会使得大部分的服务器只运行单一的应用,产生大量服务器资源闲置的状况。
一个比较明显的问题就是,企业的某些关键应用由于用户量的不断增加,当前运行的服务器硬件平台资源无法满足日益增长的服务需求,导致运行速度十分缓慢,严重时甚至会导致服务器宕机,服务中断的情况。考虑到这些系统的重要性,服务器硬迁移带来风险,这种状况很难得到改善。此相反的情况是那些最新购置的PC服务器,其处理器、内存和硬盘等各项指标都比以前有极大的提升,却只是运行了一些负载很低的应用,服务器的平均CPU利用率不到10%。
还有就是随着业务信息量的迅猛增长,现有的离散式IT系统结构,导致企业数据中心大多资源没有得到充分利用,企业部门之间信息割裂,各部门之间无法有效的共享和传递信息,形成一个个信息孤岛。因而,如何提供具有灵活性、可扩展性、高可用性的IT基础设施架构,及时、可靠、动态管理整个业务数据信息,为不断变化与增长的业务提供支持变得尤为重要。
2.2 应对现状解决问题
上述中存在的问题,都可以通过虚拟化技术得到较好的解决。使用虚拟化技术最直接的优势就是能够最大程度的利用现有服务器硬件资源,帮助企业节省大量购置服务器的成本及机房的空间成本。虚拟化技术具有资源共享、负载动态优化、自动化管理、安全性、节省资金绿色环保、解决平台依赖问题的优势:
1)资源共享,通过利用虚拟化的技术,可以将企业的一些硬件资源包括服务器、网络全部都整合起来,可以高效的利用这些资源,提高这些资源的利用率,减少资源的浪费。
2)我们可以利用虚拟化技术实现负载的动态优化。动态优化包含两方面的内容:① 可以随着业务系统的工作负载动态变化来调整资源的供给,正是有了虚拟化才使得这个实现能够更加方便。② 从整个企业的数据中心资源利用率方面考虑,通过使用一些动态优化的算法就能够将这些虚拟化的服务器在不同的资源、机器里面进行调配,减少物理机器的数量。
3)虚拟化技术还可以为我们带来统一管理的好处。面对极其丰富多样的基础设施,中间件和操作系统等,一方面我们可以通过虚拟化技术实现对硬件屏蔽底层的差异,不管是系统管理员还是上层的服务,都可以用统一的方式使用下层的资源,让管理和使用更加方便、高效。第二,利用虚拟化组件的技术可以将企业经常用的软件、服务等做成一个虚拟组件模板,实现一次创建模板到处可以使用的便捷方式,效的加快业务交互过程,提高IT系统响应能力。第三,为了维护数量庞大的服务器群的运维管理成本也因为整合服务器提高管理效率而得以降低,由于减少了服务器,通过控制台集中管理,简化了管理任务,使管理工作变得轻松易行。
本文重点描述了根据公安部出台的《信息安全技术信息系统安全保护定级指南》的要求,在医院信息系统等级防护中应用堡垒机去解决与保护域内计算机系统资源实现身份鉴别认证,并提供有效可回溯的安全审计方式,让医院信息系统获得最大的保障和管理应用效果。
关键词:
信息系统;安全;堡垒机
1、现状与要求
近年国家对企业的信息安全越来越重视,公安部及信息部等出台了《信息安全技术信息系统安全保护定级指南》(以下简称《指南》),卫生部也出台了《卫生行业信息安全等级保护工作的指导意见》对在建及已经运营的医院信息系统进行检查,要求重要信息系统其安全保护等级按照不低于三级进行建设。在《指南》中,要求信息系统必须建立及保存运维访问的各种操作日志。《定指南》将系统划分物理、网络、主机、应用和数据安全及备份等几大安全领域,其中几大领域均涉及到了数据以及操作审计、操作人员身份鉴别等安全问题。
2、医疗信息安全领域存在的问题
医院信息系统主要划分为his,pacs,Lis等几大子系统,其主要目标是支持医院的行政与管理运作,减轻各事务处理人员劳动强度,辅助医院高层对医院运作进行管理决策,提高医院工作效率,从而使医院能够获得良好的社会与经济效益。在对日常各系统的运维过程中,不同公司的维保人员有可能通过互联网络,在外地甚至在家对医院的业务系统进行升级与维护,操作方式基本分散无序,普遍存在由于管理人员登陆帐号管理不规范、运维权限划分不清晰、认证流程简单、缺乏对运维过程的监控、无法控制运维的时间段等等问题,容易导致其运维行为可能存在误操作、违规操作甚至恶意操作等现象,造成系统服务异常或宕机,病人数据信息被泄露或破坏。因此,进一步加强对拥有信息系统高级管理权限的运维操作人员的行为管理与监控,也是医院信息安全发展的必然趋势。
3、堡垒机在信息安全领域的应用
堡垒机,提供了在特定网络环境下,为确保域内服务器、路由器等设备的安全运行,使用协议等方式,接管对终端目标设备的访问界面,对其访问行为进行安全审计与翻译,集中管理、监控记录运维过程的一种设备,确保域内网络与数据不受破坏。堡垒机扮演了对信息系统和网络、数据看门者的角色,所有对网络关键设备、服务器以及数据库的访问,都要经过这个看门者的安全检查。符合安全规定条件在命令和操作才可以从大门通过,这个看门人可以对这些命令和操作进行登记记录,而某些非法访问、恶意攻击以及不合法命令则被阻隔于大门之外。因此,在提高医院信息安全防护等级的过程中,使用堡垒机不仅可以实现用户的身份鉴别、单点登陆、多因素安全认证,还可以将服务器、网络路由设备、数据库等资源的操作进行详细的记录并录像,提供有效的安全审计查询。堡垒机作为医院信息系统等级保护安全体系中的一个环节,可以很方便地做到事中监控,事后找出问题根源。医疗单位要选择一款好的堡垒机,要注意其生产厂家必须能在IT运维管理领域里,可以深刻感知医疗安全行业和国家的合规性规范及高安全性、高可用性和高可靠性需求,不断创新发展,致力从事智能的自动化运维管理。医院在选择堡垒机厂商时要注意厂商是否具备快速响应能力及行业内口碑等,多了解其产品的行业经验,注意了解厂商的是否有医院信息安全领域的服务经验及良好的服务质量,并建议选购前要做好堡垒机设备与医院信息系统的兼容性测试,选择良好的堡垒机厂商可以让医院医疗信息行业运维管理工作增值,这样才能让医院医疗信息系统获得最大的保障和应用效果。
4、堡垒机所应具备功能:
4.1单点登录
堡垒机可通过保护域内的安全设备、数据库、网络设备等对堡垒机专用帐号的授权,支持针对一系列授权帐号的密码定期变换,规范及简化密码管理流程。被授权的维护人员无需再记忆各种不同系统的密码,即可通过堡垒机安全便捷地登录被保护域内设备。
4.2帐号管理
针对保护域内的网络设备、服务器及其他安全设备的各种帐号进行统一管理,监控授权访问资源帐号的整个生命周期。可以根据运维人员的不同身份设计不同帐号角色,满足审计及运维操作管理要求。
4.3身份认证
由堡垒机提供统一的认证入口,支持包括动态与静态口令、硬件密钥、生物指纹认证等多种认证模式对用户认证。并要求可订制接口,支持第三方认证服务;有效提高保护域内设备的安全型及可靠性。
4.4资源授权
针对访问域内网络设备、服务器、数据库等根据ip协议类型、行为等多种要素进行授权操作
4.5访问控制
保垒机能支持对不同用户制定不同策略,有针对性地进行细粒度的访问控制,有效禁止非法及越权访问,最大限度地保护用户资源的安全。
4.6操作审计
堡垒机能支持针对命令字符操作、图形界面操作、文件传输操作等的多种行为的审计与录像全程记录,支持通过实时界面监控、对违规事件进行事中阻截。并能支持对指令信息的关键字搜索,精确定位录像回放位置等功能。
5.堡垒机在医院医疗信息系统安全的主要作用:
5.1从医院来看:
通过堡垒机细粒度的安全管控策略,保证医疗信息系统的服务器、网络设备、数据库、安全设备等安全可靠运行,并可以在一定保障数据的隐私性与安全性,降低人为安全损失,保障医疗信息系统的运营效益。
5.2从信息系统管理员来看
可以将保护域内系统所有的运维账号在堡垒机这个安全平台上管理,让管理更简单有序,确保用户拥有的权限是恰当的,只拥有完成任务所需的最小权限。
5.3权限控制:
通过堡垒机可以通过字符与图形界面直观方便的监控各种韵维访问行为,及时发现与阻隔违规操作、权限滥用等。
5.4以普通用户来看:
系统运维只需要记住一个自己的运维账号和口令,登录一次,就可以访问个资源,大大降低工作复杂性,提高了效率。
作者:胡名坚 周春华 黄慧勇 单位:佛山市第一人民医院计算机中心
参考文献:
关键词:机房设计;规划管理;精密恒温恒湿空调
中图分类号:TP308 文献标识码:A 文章编号:1009-2374(2012)32-0074-02
2009年3月,我公司成功重组为由铁道部控股的合资铁路公司,新公司成立后,如何保障现有运输生产业务正常运行,实现有效调度指挥和生产管理应用服务迫在眉睫,经过铁路局专家组的项目论证,在新公司建设总部机房,完成对两省分部机房的业务数据汇总传输,以达到统一指挥、有效管理的目的。作为某合资铁路公司信息技术中心主任,我主要负责总部机房的设计工作。
1 机房建设的原则
根据铁路运输行业的性质,需要建设的机房等级为B类。经现场考察,考虑电力、水源、自然环境清洁的因素,远离强振源和强噪声源,避开强电磁场干扰,远离粉尘、油烟、有害气体等影响。我们确定的机房位于公司总部4楼,使用面积180平方米。根据机房工程项目的建设需要和铁路运输信息管理系统及调度指挥系统的各种业务应用需求,针对铁路行业专业特点,考虑未来快速增长的实际情况,设计原则应该是高质量、安全、实用和易于管理,同时提供较高的扩展性。
机房建设依据国家有关标准,充分利用、整合现有资源,按照“实用可靠、有效适度、经济节约、技术先进”的总体原则实施。在机房设计、建设过程中还充分考虑方便今后的运行维护,并能有效降低机房运行及维护成本。机房建设的具体原则主要包括:
高安全性。充分考虑并采取有效措施防止火灾、电力故障、通信故障、漏水、雷击、非法入侵等造成的安全事故。
高可靠性。采取有效措施提高平均无故障时间(MTBF),降低平均修复时间(MTTR),提高运维管理水平。
标准化和规范化。在数据中心机房设计和建设过程中,基于有关国家标准和国际标准,坚持统一标准、规范的原则,从而为未来的业务发展、设备扩容奠定基础。
可扩展性。机房必须具有良好的可扩展性,能够根据今后信息化发展及技术进步的需要,提供设备扩容、技术升级、设备更新的灵活性。
先进性。在综合考虑成本、效益的前提下,尽可能采用先进、成熟的技术和设备,保证既能满足当前的需求,又能兼顾未来业务和技术发展的需要。
实用性。机房的设计和工程建设要充分考虑功能的实用性,要以充分满足技术、管理需求为前提。
可管理性。采用的各类机房设备应具有智能化、可管理的能力,同时通过建立全面、完善的集中监控和管理系统,实时监控机房的运行状况,及时发现异常情况和故障,提高机房运行的安全性和可靠性。机房的各类设备、设施要便于维护。
经济性。在进行工程设计和建设过程中,在充分满足需求的前提下,应努力节约成本,降低建设费用。同时,还应综合考虑能以较低的成本、较少的人员投入来维持今后的日常运行,降低运行成本。
人机工程。机房设计和建设过程中应根据人机工程原理,考虑机房工作人员的便利、舒适。
环保节能。采用环保材料、加强环保措施、避免环境污染;采用节能设备、重视节约能源。
2 机房安全方面
供电方面,我们按照《供配电系统设计规范》(GB50052-1995)的要求,购置艾默生电源柜,对机房采用双路供电方式,一路铁路运输生产专用的电力贯通线,一路市电,电力贯通线用于保障列车运行信号和微机连锁,可靠性较高,作为主用线路,出现突发性故障时,艾默生电源柜提供的自动切换开关可以迅速地切换到市电供电。购买两台艾默生40kVA实现ups冗余供电,提供合适的输出电压。在公司楼外部署发电机,提供长期停电时的应急发电。
空调采用精密恒温恒湿空调,按照《通风与空调工程施工及验收规范》(GB50243-1997),采用上通风方式安装设置,这种方式的优点是空调所需加湿给水管和凝结水排管均明线布置,一旦有漏水现象,可以快速发现,及时排除,避免采用下送风方式时,加湿给水管和凝结水排管布置在活动地板下,出现问题不易发现,造成安全隐患。缺点是送风管和送风口的安装布置施工难度较高,因与空气流动特性相矛盾,容易引起房间下部温度偏高。但对于运输生产来说,安全是最重要的,经过统一规划,协调布置,上送风方式为安全生产提供有效保障。
防雷系统根据《建筑物防雷设计规范》(GB50057-94)设计安装,机房接地根据《电子信息系统机房设计规范》(GB50174-2008)设计,交流工作地、直流工作地、保护地、防雷地共用一组接地装置,接地电阻
小于1Ω,接地系统的连接方式采用辐射式。
另外,消防系统采用七氟丙烷气体灭火系统,气瓶间设置在机房外,采用管网式结构,在机房天花板设置喷嘴,火灾报警系统由消防控制箱、烟感、温感联网组成。
3 机房实用方面
根据机房实用性要求,我们把机房规划为中心服务器区、数据存储区、托管服务器区、核心网络区、线路设备区、安全系统区和设备配线区七个区域。
在中心服务器区部署了运输管理信息系统所需的各种应用服务器和门户网站服务器;在数据存储区安装了中心存储设备,主要包括磁盘阵列和磁带库;在托管服务器区安装不具备运维条件的小站服务器;在核心网络区安装了路网核心路由器、多层交换机等设备;在线路设备区安装了华为optix metro 1000系列OLT和ONU设备;在安全设备区部署了联想网御VSR系列防火墙;在设备配线区安装了ODF和DDF。
4 机房可管理方面
根据《智能建筑设计技术》(GBJ232-82),我们选用了美国ALC智能自动系统监控方案,对自动消防报警系统、门禁系统等进行监控,监控中心设置在信息中心值班室,发生报警事件时,ALC系统会及时提示,值班人员可根据系统提供的信号发生地点、信号类别和原因做出相应处理。
根据需要,我们制定了相应的机房管理制度,如《机房出入等级制度》、《机房巡视制度》等,并严格制度落实,列入考核。
5 实施效果及改进措施
提高运维精细化管理水平交通设施管理和故障处理一般都有一定的流程和制度,但没有配套的技术手段的支持,流程和制度往往难以真正地得到高效贯彻执行。系统将规范交通设备的管理,实现交通设施设备从购买、入库、使用、维修、报废的全生命周期管理,降低设施的养护成本;规范交通设备运维工作中故障处理流程,规范交通设施故障发生、故障恢复、故障维修、修复确认、维修完成后故障单信息完善、故障延期修复报备等环节;落实养护相关的制度,并可针对各个环节进行考核,从而提高交通设施的运维管理水平和效率。提高运维效果评价科学性怎样评价运维系统使用后的效益?需要看它给正在运行中的系统和设备带来哪些改变,这些改变是积极的还是糟糕的。系统从不同用户所关注的问题入手,依据需求结合实际数据设计相关的考核指标。考核指标从三个角度来进行评价分析:从系统设备健康水平,从运营方和养护方的管理服务水平,从系统产生的经济效益角度。通过运维管理系统自动记录的过程数据来多角度统计分析,量化表达各种考核指标,能够提高运维效果评价的科学性。智能交通设施管理系统集成了中间件、GIS、FLEX和视频识别等先进技术,实现了三个层次共32项主体功能,下一章节将会对系统设计和实现进行简要阐述说明。
设施运维系统及评价体系的设计和实现
1系统架构设计
智能交通设施综合管理系统分为状态信息采集层、智能分析报警层和人机交互界面三层,对应的系统软件架构分三层设计:信息采集、智能报警分析、平台系统。如图(1)所示。信息采集层负责设施运行信息的自动化采集,向智能报警分析和平台系统提供基础数据。它直接或间接通过设施提供的标准接口或系统接口采集相关状态、性能、配置等运行数据,数据内容包括:服务器告警信息、服务器性能、应用软件状态、网络设备运行信息、网络拓扑信息、机房动力环境监控信息、外场设备状态和采集信息等。信息采集方式可集中和相结合,使采集软件灵活部署。智能报警分析层负责分类汇总信息采集层采集到的数据,通过报警阀值和报警规则预处理后生成基础事件,不同来源的事件经过过滤,同类事件经过压缩,相关联的事件经过根源分析,获得用户所需的根源报警,根据报警事件重要程度进行分级,整个过程实现了向平台系统提供设施的智能报警。平台系统层围绕设施运维应用,实现各种业务功能,具体业务功能包括:资源管理、日常养护、日常监控、应急保障、业务报表、系统评价。系统的用户角色分为养护公司、运维管理人员、运行管理人员和部门领导四类。各角色主要业务职责如下:(1)养护公司:综合报警监控的确认巡检;故障报修登记、设备报修签收、设备维修结果登记等;(2)运维管理人员:设备报修签发、设备维修结果审核、设备报修搁置列表管理、设备停用管理,设备生命周期管理;设备基础信息采集入库及维护、机房设备位置、端口、接线、IP、VLAN等资源信息采集入库及维护;(3)运行管理:内外场设备报警查看处置;(4)部门领导:对各岗位操作情况进行统计考核。
2设施信息采集
状态信息采集层主要实现外场设备状态信息采集、内场设备状态信息采集、机房环境监控信息采集,所有采集的信息会接入消息总线中间件并存入历史数据库,为进一步智能报警分析提供数据支持。(1)外场设备状态信息采集:系统通过接口协议,实现对信号机、电子警察、监控摄像机、卡口、情报板、车检器等外场智能交通设备运行状态信息采集;(2)内场设备状态信息采集:通过IBMTIVOLI智能基础设施管理软件实现对服务器、交换机、数据库、应用软件等内场设备运行状态信息采集;(3)机房环境监控信息采集:通过接口协议采集机房温湿度计、UPS、配电柜、空调、消防、门禁和地漏报警信息。
3智能报警分析
智能报警分析层根据采集的状态信息,经过压缩过滤和算法分析,可以综合判断故障根源,为快速处置和问题诊断提供参考。(1)报警事件压缩过滤:根据采集到的状态数据和维护人员指定的报警规则,生成基础事件。对于同一种设备的同一种事件,由于事件产生的渠道不同,会生成多条重复的报警信息,比如通过交换机主动上传的trap事件,和根据交换机的状态数据生成的事件可能会出现重复报警的情况,对这种事件进行过滤。对于某种瞬间发生或者处在报警边界值的事件,可能会频繁的生成和消失,这样就会产生很多重复无用的事件。为了避免这种情况,通过设置平滑周期,对这种事件的生成进行压缩。(2)事件根源分析:通常情况下,在生成的众多单点事件中,往往是由其中的某几个根源事件导致的,根据单点事件之间的逻辑关系和被管对象之间的物理拓扑关系,依次递归查找,根节点对应的事件,即为根源事件。(3)事件分级:报警事件级别分四级普通事件:需要养护人员关注,事件作用一般为预防提醒非关键设备某些指标工作异常,但设备还能工作,不影响其他设备。警告事件:需要设备管理员和养护人员关注,事件作用一般为提醒非关键设备工作异常或不能工作,但不影响其他设备。严重事件:需要值班员关注,告知设备管理员。事件作用一般为关键设备工作异常或不能工作,影响分系统内局部设备。致命事件:需要值班员关注,及时电话通知设备管理员和养护人员。事件作用一般为关键设备工作异常或不能工作,影响全局设备或全系统正常运行。智能报警分析应用场景示例,如图(4)所示。
4运维管理应用
运维管理应用主要实现日常监控、日常养护、应急保障、资源管理、生命周期管理和业务报表分析统计等功能。(1)日常监控:通过机房模拟图、二维或三维地图监控外场设备,以列表和图表的形式展示设备运行的实时信息,报警事件产生,自动定位故障设备,按照报警级别,启动关联预案,监控人员按照预案处置。如图(5)所示。(2)日常养护:日常养护工作通常有设备定期巡检、临时故障维修、抢修,养护中要遵循养护制度,养护过程需要规范,设计了养护流程管理。它支持多岗位跨网络协同工作流程化管理,包括故障报修登记、故障签发管理、任务签收管理、维修结果登记、维修结果审核、搁置列表管理和归档列表管理等。如图(6)所示。为养护更加便捷和使用系统更方便,引入了手持终端。如图(7)所示。图(7)(3)应急保障:在突发重大事故或灾害的情况下,保障各系统正常运行,需要应急保障手段,系统提供一些辅助,主要有各类灾害事故预案模型演练、培训,应急设施资源的查询,预案相关人员组织。如图(8)所示。(4)资源管理:基于自主开发的GIS支撑管理平台和Flex机房管理功能对内外场设备位置、端口、接线等空间和属性信息进行协同维护管理。(5)生命周期管理:对设备安装、建设交付使用、每次维护、到最终报废进行全生命周期过程记录和管理。(6)业务报表:对系统资源情况、设备资产保值、监控设备性能、设备故障、养护记录数据、各职责岗位绩效考核、等多方面进行综合统计分析。
5系统评价分析
系统相关的用户大致分为三类:投资方、运营管理方、养护公司。三者都有对使用该系统期望和诉求。投资方的诉求:建设这套系统后,今后的运维养护能否更省钱,能否为运维养护提供长久支持;运营管理方的诉求:养护效率、质量、养护水平得到提高,人均台班费用得到控制,自身的管理改进和提高,运营管理取得的成绩可以量化,能更好的为业务部门提供系统保障;养护公司的诉求:能更省时省力的完成工作,能更好的响应运营方的要求。针对这些诉求,结合运维的信息,制定了对应的评价指标,指标从三个方面回答用户的诉求:资金成本、运维服务水平、系统健康水平。(1)资金成本=节省的养护人工成本+节省的设备成本,节省的养护人工成本核心指标是人均的费效比和设备养护率。设备养护率随着养护的年限逐年增长,可以根据实际设备使用环境,同行业水平,结合系统记录的养护记录制定,一般第一年0.4,保修期内,每年增长0.1,过保修期每年增长0.2,以3年保修期计算,到第5年设备养护率达到1,这意味着过保的设备5年后的养护频率要大于1。人均的费效比=人工总花费/(人均出工时间×养护团队人数)。节省的养护人工成本=(今年的人均费效比-上年人均费效比)×(今年设备养护率/上年设备养护率)×上年人工总花费。节省的设备成本的核心指标是过保设备每年的折旧价值和当年设备过保的备件花费。过保设备每年的折旧价值根据设备的使用环境和it设备折旧值制定,it设备一年质保,5年报废,一般过保设备每年的折旧价值为:设备采购价格×0.2。设备过保的备件花费是指设备过保后,维修的备件花费。节省的设备成本的公式:Σ(单个过保设备每年的折旧价值-当年单个设备过保的备件花费)。(2)运维服务水平=运维管理绩效×50%+养护服务水平×50%,运维管理绩效的核心指标是养护任务的完成率;养护服务水平的核心指标是养护任务质量平均得分、养护任务规定时间完成率和养护培训成绩。养护任务质量得分最高不超过100分,每次养护任务由审核人员根据养护制度要求和养护结果综合评分。养护培训成绩由运营公司组织养护人员学习和考试评分。运维管理绩效=养护任务的完成率×100。养护服务水平=养护任务质量平均得分×40%+养护任务规定时间完成率×100×40%+养护培训成绩×20%。(3)系统健康水平=设备总完好率×100,设备总完好率是指所有设备完好工作时间的比率。设备总完好率=Σ(单个设备实际完好工作时间/单个设备理论要求完好工作时间)。评价的指标结果通过图表的方式直观表现,如图(9)所示。
系统项目实施效果
(1)使用这套系统后,可量化从养护资金使用效率、养护成本、养护运营绩效、系统运行稳定等多方面带来的改变。(2)通过设定指标,从管理绩效、成本核算等方面量化考核运营公司。(3)设施全生命周期的管理,对设施质量评估提供了数据支持,对设施资产进行了优化配置。(4)以规范的方式管理养护数据,在管理过程中能方便的统计分析系统的不稳定点,排查系统隐患,保障系统运行稳定。(5)综合的智能报警,提高了故障排查效率;报警预案、报警联动,加快了故障的响应速度。(6)强化了养护制度的管理,对养护安全、养护纪律起到规范、督导作用。(7)应急抢修的管理、手持设备应用、各种应急养护预案的培训和演练,为应急保障提供了技术支持。(8)手持终端设备的应用,使得养护全过程信息直达、高效、迅速,系统提供更有力信息支持。(9)规范的管理养护数据、落实养护制度、养护应急预案的培训等,使得养护知识、养护经验共享,提高养护服务水平。
关键词:绿色机房;节能;机房改造
中图分类号:TP308文献标识码:A文章编号:1009-3044(2012)08-1944-02
Improvement ProjectStudy of Large-scale Green Energy Saving Computer Room
ZENG Zhi-long1, LU Chang2
(1.Institute of Mathematical Information Industry of Zhejiang Ocean University, Zhoushan 316000, China; 2.Public Experiment Center of Zhejiang Ocean University, Zhoushan 316000, China)
Abstract: The scale of the public computer room is large in the University generally, the annual electricity consumption of resources is also very prominent, but in fact the computer room has great energy saving space. By researching of the current structure and operation mode, analysis ofinfrastructure and management model, proposed improvedprojects, and provides a practical method for building the large computer room of the green energy, provided a reference model.
Key words: green computer room; energy conservation; computer room transformation
我校公共机房总共分为15个房间,拥有900台学生机,规模庞大,每年消耗大约50万度电,占机房运行总投入的15%左右,是一个用电大户,然而随着绿色节能环保理念的深入,如何构建节能型的绿色机房成为机房建设中重点考虑问题,充分挖掘节能潜力,能够为学校节省巨大的资源投入,并且,在节约能源的同时,还不能牺牲教学效果与机房性能。
1存在问题
经过对本校机房的各个节能点进行研究分析,在当前存在的问题中,有些是因为前期建设的时候没有充分考虑绿色节能的方案,有些是因为疏于管理维护,从基础建设到运维管理都存在许多问题,对资源造成了较大的浪费,归纳如下:
1)电源线路结构单一,无法做到灵活精细地独立控制机房。
在进行基础电路布置的时候,采取了单线的总控模式,没有相对于单独子机房进行细分规划,开的时候一起开,关的时候一起关。这种方式导致了无人上机时候,显示器处于待机状态,特别是对于大量使用还没有更换的CRT显示器,以单台待机状态显示器1天消耗10W计算,机房一年运行以300天计,一年消耗的总电量是300×10×900=2700(KW),而且,这无形之中提高了室内温度,也造成空调运行的携带浪费。
2)服务器不间断运行,利用率低。
高校公共机房的服务器与提供商业服务的服务器有所区别,很多机器无需提供7*24小时的不间断服务,只是在授课期间开启相应服务即可,在无人值守机房管理的模式下,服务器基本上长年累月开启,按照常规运行300W功率计算,有10台服务器,1天空余运行时间10小时,1年将耗电365×10×10×300=10950KW。如何让服务器在不需要的时候能停止对电能的消耗是节能的一个关键点。
3)服务器等设备应用分散,利用率不高。
很多服务器单独运行某个应用,但其实随着硬件技术的发展,特别是新购的服务器性能都很强劲,服务器CPU的利用率基本上只有5%左右,所以没有充分挖掘服务器的性能,设备越分散,耗能越多。
4)空调设备长年累月运行,浪费巨大。
空调设备功率大,运行时间长,学生机房的空调设备还可以通过日常管理来减少使用,但是对于主控机房,因为采用无人值守的方式,空调必须常年累月运行,甚至在室外温度低于0度的情况下仍然进行制冷,耗电量非常惊人。
5)设备老化,CRT和旧型号主机的大量使用。
CRT显示器因为辐射大、耗电高已经被厂商淘汰,机房却仍在大量使用,旧型号的机器缺少绿色节能技术,甚至在无负载的情 况下,照样耗电严重。
6)管理松散,没有针对性的制度措施。
管理制度没有及时更新,缺乏与时俱进的管理思想,缺乏常规性合理性的操作,导致很多设备没有及时切断电源。
2方案研究和实现方法
针对以上的情况分析,结合已有的技术手段,通过采取以下措施进行改进。
1)合理规划机房空间,细化机房各供电线路,为精细化管理提供基础条件。在暑期机房空闲时间,把整体机房分割成以房间为单位的子机房,重新铺设改造供电线路,在主控机房电源控制箱中,设置单独控制开关,人为控制电源。在具体操作过程中,机房管理人员可以针对具体机房课表,对不上课的机房切断电源,避免因为待机而造成的电源浪费[4]。
2)利用BIOS设定和执行脚本命令进行自动开关机。
对于学生端电脑,可以借助机房信息管理系统来实现定时关机,我们事先安排好课表,当课程结束的时候,管理系统会自动发送关机指令到客户端,并正常关闭电脑。对于服务器,我们可以利用BIOS程序(主板底层的参数设置系统)设置,定时进行开机操作。开机后,参考开机后的画面热键提示,进入setup设置后,寻找类似于“Resume By Alarm”的设置选项,固定设置每天开机的时间,设置好保存并退出即可。进入系统之后,为了自动执行各类应用,应该把相应服务或者程序设置为自启动模式,省却每次人为的操作。
针对Windows的操作系统,我们可以从网上下载定时关机的小软件来解决定时关机的问题,也可以通过编写脚本来实现,以每天21:30关机为例,运行代码如下:at 21:30 /every:M,T,W,Th,F,S,Su shutdown -s -t 120,这样就可以实现定时关机了。
3)整合现有资源,挖掘高性能服务器等设备的潜力,提供尽可能多的应用。
借鉴当前流行的云计算模式,对当前的服务器进行有效整合,发挥规模化效应,充分挖掘高性能服务器的潜力,运用虚拟化技术,让尽可能少的设备运行尽可能多的应用服务,提高使用的效率。对于当前硬件的性能,我们可以设置多个虚拟机,同时提供不同的应用服务,让CPU和内存的使用率维持在50%以上,当然,不能过度使用,否则会明显延长访问响应时间[1]。
4)衡量一次性投入精细空调设备与普通空调的成本和长期运行产生的费用,确定购置方案。
精细空调的节能效果非常好,但是采购成本是普通空调的几十倍,它的产能必须要经过长时间的运作才能体现。所以在采购前,要充分做好调研工作,如果机房运行时间在6年以上,可以考虑采购,否则只会增加成本投入[2][3]。
5)针对老旧的耗能产品,只有更换成新出的节能产品才能有效节省用电,但是介于机房已有模式和资金问题,我们无法一次性解决。在今后采购设备的时候,应该把绿色节能指标纳入招标要求,在满足使用性能的同时,可以倾向于那些具有节能技术的产品。
6)从管理层面,确定相关制度来保障。
技术只是一种保障的手段,但更多的时候需要制度的有效执行,制定机房相应管理守则,常态化规范化对节能进行管理,通过巡视、记录等方式对需改进点进行人为干预操作,是保证建设绿色节能机房的关键因素。
3结论
计算机机房经过改造后,运行半年以来,平均比以前节约用电10度,耗能节省了20%,成功地实现了绿色节能机房的改造,成为全校的节能冠军。各个高校可以参照本校的实际情况,对现有的机房进行改造,一定可以挖掘出更多的节能空间。
参考文献:
[1]耿英保.浅议计算机机房节能[J].中国集体经济科技研发,2006(6).
[2]周航.通信机房节能热管理设计探讨[J].电信工程技术与标准化,2009(3).
关键词:教育数据中心;安全运维;技术体系
中图分类号:TP393 文献标志码:B 文章编号:1673-8454(2016)19-0005-06
一、省级数据中心的整体架构
近年来,福建省教育管理信息中心从更高层次上将过去以单位建设和运营的传统信息系统整合成以省级为单位的数据中心,形成资源共享、互联互通、服务整合的有机整体,省级数据中心实现虚拟化和动态管理,为本省提供教育管理信息系统运行的云服务平台,承载和满足国家教育管理公共服务平台在省级教育行政部门的部署和运行,集成和支撑省本级各类教育基础数据库和各类教育管理信息系统,服务于所辖区域内教育行政部门和学校的信息化管理业务应用。
整体设计架构如图1所示。
随着教育管理信息系统的建成,各级各类教育部门对信息系统的依赖程度将会越来越高,逐步形成覆盖各级各类教育的学生、教师和学校及资产等方面的海量信息,这对维持教育管理信息系统安全稳定运行,保障教育管理信息安全提出了更高的要求
二、省级数据中心安全防护的变化
利用云计算技术,省级数据中心实现了计算资源、网络资源、存储资源的虚拟化和服务化,同时数据中心的安全威胁和防护要求也产生了新的变化。云计算带来的一个最明显的变化就是计算网络的边界发生了改变,诸多的业务系统运行在数据中心云服务平台上,保障数据中心的业务连续性和进行灾难恢复将是一个巨大的挑战,任何一个机械故障、人为错误、黑客攻击、病毒木马如果得不到有效的控制,就很有可能造成整个数据中心的崩溃。
1.安全防护对象扩大
安全风险并没有因为虚拟化而消失或规避。尽管单台物理服务器可以划分成多台虚拟机使用,但是每台虚拟机上承载的业务和服务和传统单台服务器承载的基本相同,同样虚拟机面临的安全问题跟单台物理机也是基本相同的,如对业务系统的访问安全、不同业务系统之间的安全隔离、操作系统和应用程序的漏洞攻击等。
数据中心需要防护的对象范围也扩大了。安全防护需要考虑以HyPevsor和vcenter为代表的特殊虚拟化软件,由于 vcenter等本身所处的特殊位置和在整个系统中的重要性,如果漏洞没能及时修复,这必定会给虚拟化平台带来一定的安全风险,一旦攻击者获得虚拟化平台的管理权限,将可以随意访问任意一台虚拟机,服务器的业务数据也就没有任何安全性可言了。
2.威胁扩散速度快
在虚拟化环境中,同一台物理服务器上的不同虚拟机之间的通讯是基于服务器内部的虚拟交换网络解决,相邻虚拟机之间的流量交换不通过外部的网络交换机,此时外部的网络安全工具也都无法监测到物理服务器内部的流量。其中任何一台虚拟机存在安全漏洞被攻击控制后,攻击者可通过这台虚拟机入侵同一台服务器上的其他虚拟机。
虚拟机可以根据实际需求在不同物理机之间进行动态迁移,这可能会让一些重要的虚拟机迁移到不安全的物理机上,或者一些测试用的虚拟机与重要的虚拟机迁移到同一虚拟局域网,从而带来安全风险。
3.病毒扫描风暴
完成服务器虚拟化之后,为了保护虚拟服务器的安全运行,要在每一台虚拟机上安装防病毒等安全软件,每台虚拟机因此要消耗相同的CPU、内存等硬件资源,常规防病毒扫描和病毒码更新等也需要占用大量资源,这样随着虚拟机数量的增加,后端存储的负荷随之变大从而影响到系统的运行速度。
虚拟机的初衷是绿色环保,低碳节能,没有业务运行的时候可以关闭虚机,业务恢复时开启虚机,但关闭期间病毒代码是无法更新的,如果多台虚拟机同时开机更新防病毒软件的病毒码,这时网络带宽也有较大影响。如果所有虚拟机上的防病毒软件设置定期扫描或更新,将会引起“防病毒风暴”,影响服务器应用程序的正常运行。
三、省级数据中心安全运维技术体系构建
依据国家等级保护的有关标准和规范,以省级教育数据中心基础环境的安全防护需求为出发点,根据云计算虚拟化的特点和风险状况,同时参考传统“进不来,拿不走,看不到,改不了,走不脱”的防御要求,分别从事前监控、事中防护和事后审计三个角度进行考虑,采用分区分域、重点保护的原则,对数据中心网络和业务应用系统进行分区分域防控,对承载的国家教育管理公共服务平台、本级应用系统和重点区域进行重点的安全保障,根据业务应用系统面临的实际安全威胁,采用适当的安全保障措施,建立覆盖物理、网络、主机、存储、数据库、应用的整体信息安全防护技术支撑环境,提升数据中心的抗攻击能力,维持国家教育管理信息系统稳定运行,保障教育管理信息安全。
1.物理层
(1)机房安全
机房是数据中心重要的基础设施,服务器设备、网络设备和存储设备等是数据中心机房的核心设备。这些设备运行所需要的环境因素,如供电系统、空调系统、消防系统、机房与监控系统是数据中心机房重要的物理基础设施。福建省级教育数据中心前身是省教育厅信息中心机房,由服务器机房、网络机房、控制室、配电机房四部分组成,现有数据中心使用面积达115平方米,安装了机房智能、供配电、通风,环境监测、防雷接地、门禁等子系统,满足机房建设的相关标准和要求,符合信息安全等级保护三级的合规要求。
(2)资产管理
数据中心管理关键在于立足全局,明了拥有的资源,知晓设备放置在哪里,它们是如何连接到一起的。准确的资产数据是数据中心日常运维的基础之一,随着数据中心的设备数据增加,资产信息的准确性显得更加重要。对已有的虚拟机、物理设备和应用系统进行标记,例如业务IP、管理地址、外网映射、对外开放端口、VPN情况、资源情况、域名、相应特殊策略及对系统的简短描述。
2.网络层
(1)安全区域的划分
为保障数据中心整体结构安全,将安全区域划分作为安全运维技术体系设计的首要任务。数据中心的网络构成非常庞大,支撑的应用系统也非常复杂,因此采用基于安全域的办法是非常有效的,结合数据中心的基础环境及业务系统的实际情况和特点,以安全保障合理有效为原则,将信息系统网络划分为多个相对独立的安全区域,根据各个安全区域的功能和特点选择不同的防护措施。
省级教育数据中心既承载着国家教育管理信息系统,又为自建应用系统提供运营支撑。根据安全等级保护要求完成安全区域划分,分别设置外网接入区、骨干网络区、前置服务区、应用服务区、数据库区及运维区等,同时在应用服务区里根据应用对象划分了教育部系统区、厅主要应用区、其他应用区,结合各个安全区域的业务特点设计保护措施和安全策略,这大大提升了安全防护的有效性,也体现出重点区域重点防范的建设原则。
(2)外网接入区
主要实现网络出口及出口的安全管理、带宽管理、负载均衡控制。根据外网接入区的特点分析和需求分析,对该区域进行边界的防护,以及对入侵事件的深度检测及防护,抗拒绝服务攻击以及流量分析构成完善的防护系统。
A.实现边界结构安全。数据中心有多条ISP链路,包括移动、联通、电信等。通过互联网边界部署链路负载均衡设备避免因ISP链路故障带来的网络可用性风险和解决网络带宽不足带来的网络访问问题。根据业务的重要次序进行带宽分配优先,保证在网络发生拥堵的时候优先保护重要业务,保证网络各个部分的带宽满足业务高峰期需要。
B.实现边界访问控制。在互联网边界部署边界万兆防火墙,一方面满足数据中心万兆网络环境需求;另一方面满足互联网边界移动、电信、联通等线路接入以及对流经防火墙的数据包提供明确的拒绝或允许通过的能力、提供细粒度的访问控制,并满足网络层面抗攻击能力。防火墙详细记录了转发的访问数据包,便于管理人员进行分析。同时在防火墙配置会话监控策略,当会话处于非活跃一定时间或会话结束后,防火墙自动将会话丢弃,访问来源必须重新建立会话才能继续访问资源。
C.实现边界恶意代码防范。在互联网边界部署防病毒网关,采用透明接入方式,在最接近病毒发生源安全边界处进行集中防护,对夹杂在网络交换数据中的各类网络病毒进行过滤,对网络病毒、蠕虫、混合攻击、端口扫描等各种广义病毒进行全面的拦截。截断了病毒通过网络传播的途径,净化了网络流量,满足三级等级保护中实现边界恶意代码防范的要求。
D.实现边界安全审计。在互联网边界部署上网行为管理系统,满足为单位内部用户提供内网用户上网行为合规性检查,提供用户上网行为日志记录,不合规上网行为阻断等功能。
(3)骨干网络区
核心交换区连接数据中心内部各个功能分区,是整个运行网数据中心的核心,其功能是高速可靠地交换数据,需要具备高性能、高可靠。各个功能分区汇聚位置采用独立的汇聚交换机去实现。
A.实现边界访问控制。通过数据中心核心交换机配置防火墙板卡和IPS板卡,为数据中心的网络应用提供主动、实时的防护,监测网络异常流量,自动对各类攻击性的流量进行实时阻断,增强数据中心稳定性、可靠性、安全性。
B.数据中心万兆汇聚防火墙具备虚拟防火墙功能,通过将数据中心万兆汇聚防火墙虚拟成应用服务器区边界防火墙,为应用服务器区/数据库服务器区/运维管理区边界提供细粒度的访问控制能力,实现基于源/目的地址、通信协议、请求的服务等信息的访问控制,防止终端接入区用户非法访问应用服务器区的资源,并且利用防火墙的多个端口,将实现多个区域的有效隔离。
3.平台层
云安全技术多集中在虚拟化安全方面。虚拟化环境下计算、存储、网络结构、服务提供模式等的改变,带来了应用进程间的相互影响更加难以监测和跟踪,数据的隔离与访问控制管理更加复杂,传统的分区域防护界限模糊,对使用者身份、权限和行为的鉴别、控制与审计变得更为重要等一系列问题,对安全提出了更高的要求。
(1)防火墙
传统的网络安全设备无法查看虚拟机内的网络通信,因而无法检测或抑制源于同一主机上的虚拟机的攻击。针对服务器虚拟化面临的风险,通过部署与VMware虚拟化环境底层系统无缝集成的无安全防护系统,减少物理和虚拟服务器的攻击面。使用双向状态防火墙对服务器防火墙策略进行集中式管理,阻止拒绝服务攻击,实现针对虚拟交换机基于网口的访问控制和虚拟系统之间的区域逻辑隔离,构建虚拟化平台的基础架构多层次的综合防护。
以透明方式在VMware vSphere虚拟机上实施安全策略,按照最小授权访问的原则,细化访问控制策略,严格限制访问虚拟机宿主机和虚拟机的访问IP 地址、协议和端口号,保障虚拟机在动态环境中的安全。
(2)防恶意软件
为了确保虚拟化平台及虚拟机的安全运行,必须部署必要的安全工具,在虚拟机上安装网络杀毒软件和恶意代码查杀程序,防止虚拟机遭受病毒及恶意代码的侵袭,设置病毒和恶意代码查杀策略。及时更新病毒库和恶意代码库,保证病毒和恶意代码及时被清除。
无安全模式以一台物理机为管理单位,无需在每个虚拟机中部署安全防护程序,集中一台虚拟安全服务器中部署运行,随时在线升级和维护,分时扫描各应用服务器虚拟机,对虚拟环境的性能不会造成显著影响,从而避免了“防病毒风暴”等现象。
(3)补丁程序更新
虚拟化平台由于自身设计的缺陷,也存在安全隐患。要保证虚拟机的安全,必须及时为虚拟机进行漏洞修补和程序升级。即便如此,仍然存在安全隐患,原因在于虚拟机系统的补丁可能落后于更新,而且承载不同操作系统的虚拟机可能迟滞不同级别的补丁和更新。所以当其他虚拟机受到保护时,这些还没有更新补丁,容易受到安全威胁的机器就会影响其他虚拟机的安全。
4.系统层
安全测试与风险评估。在部署信息系统前,对承载应用系统的数据库、中间件进行安全配置,并在系统正式上线运行前进行安全测试与风险评估,对于发现的问题整改完成后再行上线,避免应用系统带病运行造成后期整改困难。
(1)部署漏洞扫描系统
如果说防火墙和网络监视系统是被动的防御手段,那么安全扫描就是一种主动的防范措施,能有效避免黑客攻击行为,做到防患于未然。采用最新的漏洞扫描与检测技术,包括快速主机存活扫描技术、操作系统识别技术、智能化端口服务识别技术、黑客模拟攻击技术、入侵风险评估技术等多种扫描技术的综合应用,快速、高效、准确地发现系统安全隐患并在短时间内修复漏洞,最大限度地降低系统安全风险,消除安全隐患。
(2)服务器加固系统
操作系统核心加固通过对操作系统原有系统管理员的无限权力进行分散,使其不再具有对系统自身安全构成威胁的能力,实现文件强制访问控制、注册表强制访问控制、进程强制访问控制、服务强制访问控制、三权分立的管理、管理员登录的强身份认证、文件完整性监测等功能,从而达到从根本上保障操作系统安全的目的。此外,内核加固模块稳定的工作于操作系统下,提升系统的安全等级,为用户构造一个更加安全的操作系统平台。
5.应用层
(1)应用服务区划分
应用服务区主要承载运行环境内的应用服务器,包括教育部应用的oracle、weblogic等中间件服务器等。核心区通过独立的防火墙设备接入应用服务区。
根据应用系统承载不同的应用,实现不同的功能,不同的管理模式,不同的应用系统划分为不同的保护等级,应用服务区分为教育部应用区(三级)、厅主要应用区(三级)、市县应用区(二级)。
(2)前置服务区
提供Web服务的服务器被放置在前置服务区,主要运行网站等互联网应用。在前置服务器区边界部署Web应用防火墙,能够满足为前置服务器区边界提供强制访问控制能力以及能够提供应用层针对网站攻击防护能力。事前,Web应用防火墙提供Web应用漏洞扫描功能,检测Web应用程序是否存在SQL注入、跨站脚本漏洞。事中,对黑客入侵行为、SQL注入/跨站脚本等各类Web应用攻击、DDoS攻击进行有效检测、阻断及防护。事后,针对当前的安全热点问题,网页篡改及网页挂马,提供诊断功能,降低安全风险,维护网站的公信度。从而更有效地对厅网站进行全面的保护,有效降低安全风险。通过部署Web应用防火墙弥补防火墙、IPS在应用层方面薄弱的防护能力。
6.数据层
(1)数据库安全审计
数据库服务区承载了运行环境下核心应用系统的核心数据库。目前共3套核心Oraclerac集群服务器。在数据库服务器区接入交换机旁路部署两台数据库审计系统,通过技术手段并结合管理制度,能够确保数据库服务器区的数据库系统的信息安全;能够及时发现非法用户以及黑客对数据库错误操作和非法操作,并进行及时阻断;能够对数据库查询和修改等操作进行记录,并能提供事后追溯;能够检测和分析数据库应用系统存在的BUG,并能提供相关报表信息;对所有数据库操作可实现字段级的细粒度审计,便于数据库管理。
(2)数据传输安全
保障业务数据在传输过程中的完整性与保密性。一方面,在外网接入区边界部署IPSECVPN实现在省级数据中心与教育部数据中心进行数据传输时,通过VPN技术措施进行传输加密,实现数据通信加密安全;另一方面,在前置服务器区部署SSLVPN实现在福建省教育厅数据中心服务器与外部出差、外部办公人员应用终端之间进行数据传输时,通过SSLVPN技术措施实现数据传输的加密,实现数据通信加密安全。
(3)数据容灾备份
备份是用户保护计算机中重要数据信息的最佳方式。通过Symantec Netbackup实现本地统一备份以及远程数据复制归档的功能,并且在本地配备重复数据删除功能,通过重删后的数据进行远程数据复制归档,从而降低数据的传输大小以及对传输带宽的要求。实现省级教育数据中心的各类结构化、非结构化数据的本地数据备份,制定备份策略,备份服务器将自动进行数据的增量备份与全备份操作;实现各类数据的异地归档备份数据级容灾,能够在数据中心生产数据以及其备份数据均产生问题时,通过容灾机房实现远程归档备份的数据还原操作;实现教育数据中心关键系统的独立部署以及本地数据备份,大大提高系统的数据安全性。
7.运维层
(1)安全运维管理平台
安全运维管理平台的主要监控对象包括各省级教育数据中心所辖硬件设备(网络设备、安全设备和服务器等)和应用系统,主要实现的功能包括:资产管理、性能监控、信息安全告警管理、信息安全事件审计、信息安全风险管理、工单管理、通告管理及多级联动等主要功能。
按照教育部安全运维管理平台统一配置规范、统一接口标准建设省级安全运维管理平台,一方面负责采集分析省级教育数据中心网络设备、安全设备、服务器、中间件的性能指标,实现省级数据中心基础环境的业务可用性集中监测与管理;另一方面收集汇总本级环境中的安全事件并进一步通过关联分析实现对部署在本级的国家教育管理信息系统的整体安全运行态势进行集中监控、分析与管理。最终省级安全运维管理平台通过IPSecVPN构建的数据加密传输通道上报业务可用性运行状态、重大信息安全风险、重要信息安全事件及信息安全审计分析报告等数据信息至中央级安全运维管理平台,实现对全国教育信安全事件的集中监测、上报与响应。
(2)应用安全监测与预警平台
应用安全监测与预警平台以应用系统为对象,对应用系统进行漏洞监测、实时挂马监测、关键字监测、可用性监测、事后篡改监测、安全告警与安全势态跟踪,实现对应用系统的可用性、脆弱性和内容安全性进行监测、预警。
统一部署的应用安全监测预警管理平台,实现对部署于数据中心的国家教育管理信息系统及自建系统进行应用安全监测与管理;并通过本平台上报国家教育管理信息系统的重大安全风险、重要安全事件及应用系统安全审计分析报告等数据信息。
(3)安全运维审计
在运维管理区部署运维审计系统,逻辑上将人与目标设备分离,建立“人-〉主账号(堡垒机用户账号)-〉授权―>从账号(目标设备账号)的模式;在这种模式下,基于唯一身份标识,通过集中管控安全策略的账号管理、授权管理和审计,建立针对维护人员的“主账号-〉登录―〉访问操作-〉退出”的全过程完整审计管理,实现对各种运维加密/非加密、图形操作协议的命令级审计。通过细粒度的安全管控策略,保证服务器、网络设备、数据库、安全设备等安全可靠运行,降低人为安全风险,避免安全损失。堡垒机不仅能记录操作痕迹,还能回放记录,追溯责任,定位问题,运维审计结果能以各种报表形式展现,满足不同人员的需求。
四、结束语
安全运维是确保信息系统正常运行的必要环节,也是信息系统生命周期中的一个长期工作。省级教育数据中心安全运维技术保障体系依托统一身份认证管理平台,通过分级和分域进行安全管理与保障,实现各个分域子网安全,实现基于安全域的安全互联、接入控制与边界安全防护,构建安全管理中心,提供安全管理、安全监控、安全审计、容灾备份、应急响应等安全服务手段,保证数据中心计算环境安全,保证承载的国家教育管理公共服务平台和本级各类教育管理信息系统的运行,最终形成“安全开放、等级保护、按需防御”的等级化安全保障体系,服务于所辖区域内教育行政部门和学校的信息化管理业务应用。
参考文献:
[1]教育部教育管理信息中心.国家教育管理公共服务平台省级数据中心建设指南(印发稿)[Z].2013.
[2]曾德华.省级数据中心建设目标、内容框架与实施管理[J].中国教育信息化,2013(13):8-9.
[3]安宏.国家教育管理信息系统信息安全保障体系建设[J].中国教育信息化,2013(13):16-19.
[4]邓高峰,高四良,李玉龙.服务器虚拟化安全问题分析及防护措施[J].计算机安全,2014(8):30-32.
关键词:云计算;服务器虚拟化;数据中心
DOIDOI:10.11907/rjdk.161896
中图分类号:TP3-0
文献标识码:A 文章编号文章编号:16727800(2016)011020602
0 引言
数据中心(DC)是企业或单位的智力支持部门,其重要性毋庸置疑。在传统的数据中心,存放着大量服务器、存储设备、网络设备;一整套完备的制冷、消防、环境监测、安防监控等系统,对整个企业的正常运转发挥着重要作用。数据中心业务增长日益加快,对运维人才的要求也不断提高。为保障系统正常运转,既要加大软硬件设备投入力度,也要注重运维管理人才培养。传统企业CTO因行业背景及所处地域或企业文化影响,面对这种变革,往往慢上半拍,当其反应过来已落后行业或主流社会一大截。服务器虚拟化技术的出现为解决眼前困局开辟了一条崭新通道。
虚拟化由来已久,在早期的IBM 7044计算机上已有其应用,之后IBM相继开发了型号为Model 67的System/360主机。直至今天,在最新的IBM小型机POWER8系列主机上还能发现它的身影,可以说大型计算机、小型计算机与生俱来就拥有虚拟化技术。Model 67主机通过虚拟机监视(Virtual Machine Monitor)虚拟所有的硬件接口,高效利用直接运行在底层的硬件部分,使得可以同时运行多个虚拟设备,进而进一步演化发展,通过虚拟机技术,可以有效实现多个操作系统的同时使用;之后在RISC服务器与小型机上陆续开始采用虚拟化技术来提高计算机的使用频率,尽可能发挥计算资源的计算能力。这种设计思想在今天看来是具有前瞻性和创新性的,也为虚拟化技术的实现奠定了坚实基础。IBM在1999年提出的逻辑分区概念,直到发展成动态逻辑分区(DLPAR)技术,在不中断运行的情况下进行资源分配,使得系统管理更加轻松,更有效地利用资源,降低总成本。
在对传统数据中心进行服务器虚拟化进而为云计算作升级准备时,IT人员必须了解关于服务器虚拟化技术的基本概念及原理,特别是该技术存在的风险。因此,有必要深入分析数据中心服务器虚拟化的优势及不足。
1 服务器虚拟化技术优势
(1)成本低。
成本降低是服务器虚拟化技术带来的显著效果。最常见的场景是硬件大量减少,比如服务器数量减少,通过成熟的服务器虚拟化技术,将IT开销缩减60%~80%是很平常的。服务器数量可能只需要原来的1/10。而原有的服务器变成虚拟服务器,从而减少了硬件。与此同时由于硬件的减少,为硬件提供保障的如制冷、消防设施、安保、环境监控等多项设施需求也随之降低,进而降低了整体IT成本。而在管理上对服务器的迁移、数据的备份、计算资源的扩展却会更加灵活高效。
据谷歌公布的数据显示,谷歌数据中心能源消费达到2.6亿瓦特,这相当于弗吉尼亚州首府里士满或者加州欧文市家庭用户的所有用电量,或者说,这相当于一座标准核电站1/4的输出功率。通过服务器虚拟化技术可以有效降低电能消耗实现“低碳”排放,进而朝着“绿色计算”这个方向迈进一步。
诸如此类的多种开销的减少,最终会体现在经济效益上。设备的减少意味着更少的能耗开支,空间的减少意味着更少的租赁费用。所有这一切都说明虚拟化技术在成本控制上有更大优势,同时也为“绿色地球”作出贡献。
(2)资源共享。
服务器虚拟化技术的运用,将一些硬件资源包括服务器、存储空间、网络全部都整合起来,可以高效地加以利用,提高资源利用率,减少资源浪费。利用虚拟化技术实现负载的动态优化,动态优化包含两方面的内容:由于应用系统的负载是变化的,应用虚拟化技术可以灵活地根据负载需求灵活调整服务器计算资源来提供服务。通过使用动态优化算法就能够充分利用未使用的计算能力和空间。
(3)可靠性高。
在传统的IT架构中,为提高可靠性通常是将整个系统置于商用集群环境中[1],金融、政府、电信等关键领域都应用了这一场景。正因为这些应用需求,造就了对IOE的依赖和制约,也对今天的“去IOE运动”起到了一定的推动作用。集群的使用尽可能地提高了系统可靠性,但是集群环境是昂贵的,其维护也非常困难。通过虚拟化方法能够非常灵活地提高可靠性,它是在Hypervisor层次上进行保护,而不是在应用层上,并且它能够非常容易地去实现保护。比如虚拟化软件自带的HA工具集能够简单快捷地实现业务需求,同时兼顾了灵活的扩展性,使得服务器的可靠性得以提高,相应软件的可靠性也相应得以提高。
(4)灵活性强。
在传统的IT环境中,应用系统的增加、升级、维护等工作,需要对OS和软件进行安装或维护。这项工作需要大量的时间和精力,通过虚拟化技术能够简单灵活地快速完成,不需要考虑准备新的硬件设备,只需要在资源池中给应用系统增加或修改业务系统所需要的计算资源即可。
2 服务器虚拟化技术不足
随着技术的飞速发展及海量数据的激增,服务器虚拟化技术以其独特优势在各数据中心正在替代传统的、庞大的服务器系统。服务器虚拟化技术的扩展性、灵活性、环保性备受人们青睐,但其也具有两面性,因此带来了不少问题。
(1)物理故障危害大。
在传统IT架构中,如果一台服务器出现硬件故障导致其不能正常工作,通常启用备用服务器就能使业务在较短时间内恢复,而不会影响部署在其它服务器上的服务。但是在虚拟化环境中,如果出现硬件故障,就意味着所有部署在该物理机上的所有服务都将因此故障而不能提供服务。在这种环境中,硬件故障带来的危害更大。
(2)应用场景局限性。服务器虚拟化技术并不是万能的,在传统的X86架构中通过虚拟化的方法,将廉价服务器组合成一个集群,尽可能发挥服务器的效率,降低IT成本。然而在一些非常高端的应用中,它对服务器计算资源的消耗极大,需要频繁访问内存和硬盘。对于这样的高端应用,应该将其放到真正的物理机中运行而不是虚拟环境中,只有这样才能更好地保障应用的实现。
(3)排错过程更复杂。现有成熟的服务器虚拟化商用解决方案中,一旦出现故障或错误将给IT管理人员带来较大风险,这种风险不仅仅存在于故障本身,同时也体现在排除这种故障或错误所需要的成本上。其中复杂的排错过程和专业的技术要求都会给每个管理者带来困扰。
3 主流服务器虚拟化产品
3.1 VMware虚拟化技术
VMware虚拟化[2]将操作系统从运行它的底层硬件中抽离出来,并为操作系统及其应用程序提供标准化的虚拟硬件,从而使得多台虚拟机能够在一台或者多台共享处理器上同时独立运行。借助虚拟化技术,客户可以轻松将多台不同服务器的工作负载整合到更为可靠并且性能更高的平台上。VMware虚拟化技术在服务器虚拟化领域可以说是首屈一指,有大量用户采用其服务器虚拟化产品。
3.2 微软虚拟化技术
微软具有全面而灵活的端到端的解决方案,其投入不仅仅局限于服务器虚拟化,通过System Center实现整合和管理,在客户中进行广泛的推广与部署。虚拟化技术的关键在于普及化,微软有很好的平台,有助于推动该技术的普及化。
3.3 Citrix虚拟化技术
Citrix Systems技术[34]使得数字办公无处不在,极大提高了工作效率。通过与世界一流业界伙伴携手合作,Citrix解决方案为企业级用户实现应用、远程访问、移动办公以及业务一致性等卓越功能,极大提升了企业的IT投资回报和生产效率。它拥有开源的服务器虚拟化平台XEN,但其主要优势在于桌面虚拟化业务。
4 结语
随着虚拟化、云计算技术的快速发展,越来越多的应用和业务都承载于这些新技术之上。传统数据中心的技术变革势不可挡,在此背景下选择适合自己的服务器虚拟化技术是每一个IT技术管理者必须思考的问题。本文对主流服务器虚拟化技术进行了详尽阐述,并对传统数据中心技术变革的若干问题进行深入研究,同时总结了服务器虚拟化技术的优势与不足。虚拟化是大势所趋,企业应当从自己的实际情况出发,综合考虑虚拟化带来的各种影响,找到适合自己的模式。
参考文献:
[1] LEANDRO CARVALHO.HyperV 3.X虚拟化技术企业现场实战[M].台湾:胡为君,译.峰资讯,2013.
[2] [法]ERIC MAILL,RENFRANOIS MENNEC,马博峰.VMware虚拟化技术指南[M].北京:机械工业出版社,2013.