it运维管理论文
it运维管理论文
IT运维管理作为企业信息化管理的重要组成部分,有效保障了企业业务的正常运行。这是学习啦小编为大家整理的it运维管理论文,仅供参考!
it运维管理论文篇一
IT的运维管理与实现
摘 要:在科技不断发展和信息技术日新月异的当今社会,人们的日常工作对信息系统的以来越来越大,因此,整个信息设备的稳定运行以及日常的维护工作就显得尤为重要。本文以ITIL理论为基础对当今社会的IT的运维管理与实现做了深入的探讨。文章开头简单介绍了IT在国际以及我国的发展历程,并就ITIL作了详细的概述;其次,通过对IT运维管理系统流程与运维管理以及资源管理和服务台与服务台各功能的实现来论述了整个IT运维管理系统的设计与实现过程。文章最后对本文进行了细致的总结,并就未来IT的运维管理的发展做了展望。
关键词:IT运维管理;稳定运行;维护工作;设计与实现
中图分类号:TP311.52
20世纪90年代以来,随着英国政府电信管理中心及其下属的中央计算机研发中心对IT服务管理实践指南,即ITI信息技术基础设施库的正式发布,IT服务的质量由此开始有了一个质的飞跃。自此,作为IT管理模型的杰出代表,ITIL技术被广泛采用,在很大程度上发挥了现代信息化资源的优势。随着近些年IT业的不断地快速发展和市场应用信息化处理技术的发展日趋成熟,IT管理系统在整个部门工作中的地位显得越来越突出。当前形势下我国国内的IT运行管理体系仍旧以分散管理为主流系统,随着我国经济的不断壮大与发展,传统的IT运维管理已经不能满足这种高工作量的工作,各单位内部事物的工作效率成为了高层管理着很伤脑筋的难题;由于现在国内对于IT运维管理要求的不断提高,使得上述问题日益突出,对于运行维护部门而言要求资源进行支持的加强化已成为必然;因此,为了保证当今形势下我国网络的稳定性和安全性,对于整个IT行业的运维管理就必须改变以往的分散式管理运维制度,进行强化集中管理,加强以ITIL为主导的新一代运维系统的建设工作。以前,信息部门在处理相关故障方面并没有一个统一规范的处理标准和处理步骤,同时也缺少对出现的相关的问题的记录工作。自从基于ITIL为理论基础的新型IT服务管理平台投入运行之后,通过对整个发生的事件管理和配置管理两个主要流程的记录与处理,实现了整个IT运维管理的流程化和标准化的处理过程后,企业员工可以很方便的通过多种途径对IT中出现的各种故障报告或者提出与之对应的服务请求。
1 ITIL简介
作为IT服务管理的核心框架,ITIL是一套能够协同整个运维流程通过服务级别协议(sLA)来提高IT服务质量的一种新型理论。它融合了系统管理、网络监测以及系统开发管理等现代管理活动,以及对信息变更处理、资产管理和问题管理等许多流程理论与实践的IT服务管理理论;整个IT管理主要分为两大部分,即服务支持和服务提供;ITIL把整个IT管理活动归纳为一项管理功能和十个核心流程的处理工作;IT服务支持和服务提供又各包含五个流程,主要有事件管理和问题管理等环节;通过介绍我们不难发现,ITIL是通过对整个IT运维服务中的服务支持来进行事件管理的,事件管理对整个IT服务中遇到的故障能够做出应急处理,通过对管理方法的变更、发布和配置管理来保障整个IT处理过程的记录和管理工作的顺利进行,从而达到对整个服务系统影最小化的目的。ITIL的根本目的就是为改善一系列IT服务质量不佳的状况而不懈的努力。在整个IT处理的业务流程的改进过程中,ITIL能够支持包括对现代企业组织机构不同形式和不同构成要素工作的全面支持与处理工作。并且可以做到根据机构、部门、工作组、所处岗位对不同人员进行灵活的模式分工。
2 IT运维管理系统的设计与实现
2.1 IT运维管理系统流程与运维管理
为了适应不同运维环境的需求,IT运维管理系统就应该对事件故障的发生以及相应流程标准处理机制全面考虑。使系统能够根据使用者的需求功能(问题管理、事件管理以及发布管理等)进行高效的管理与预处理工作。所谓问题管理简而言之就是当整个设计运维管理系统自动发现机制中,一旦出现故障信息,能够迅速的以IT系统维护的关系作为依据对整个IT信息进行自动筛选并且发送给相关的运维管理人员,系统将收集到的信息进一步向系统工作台进行转发,以提醒相关人员对故障进行进一步的处理工作。事件管理,顾名思义,就是对已经产生的事件进行筛选,然后判断是有相应的错误存在;一般而言,在具体条件下系统对做出处理反馈或者交由相关工作人员进行处理的事件有一定的记忆能力,这对于系统能够最在有效的条件下解决故障事件的能力有了更好地保障。当前,随着网络协议发展的日趋成熟,整个计算机服务管理系统的资源模块的不断升级,以TELNET、SSH、SNMP等多个协议为代表的新型资源管理模块能够完成对信息的自动提取、发现设备故障和对设备故障进行监控等任务;一旦设备出现故障,运维管理人员处就能够对故障进行及时有效的处理,在运维管理模块给出故障分析的具体位置并就故障进行处理的过程。另外,为确保整个系统的的正常运行,运维管理模块在对相关事件日常管理的基础上还增加了专门针对于日常运维管理机制的设计工作,在各个配置模块上添加了日常任务管理的功能,保证了每天系统对全套设备进行安全检查的质量与效率。
2.2 资源管理
作为整个IT运维管理系统的基础,资源管理系统能够实现对全套系统的所有资源进行清楚的记录并且有效地对管理效率有所提升,当前资源管理手段还是主要建立在对相应资源的电子或者纸质文档的管理上,但是这种传统的资源管理模式一旦出现资源的种类以及数量稍有增减的现象,便会使整个资源管理的工作变得十分繁复。因此在整套运维管理系统平台中,运维管理人员须首先对各种资源进行分类,然后按照固定的格式和要求完成对各类资源相关信息的录人工作,最后还要对整个管理流程配置自动监管设备,以保障在故障产生时系统能自动进行提醒。
2.3 服务台与服务台各功能的实现
服务台是客户向系统提交相关操作请求的一个窗口,而作为客户提供的服务请求,说白了其实就是业务部门与整个信息中心之间进行信息交流的一个接口,但这个接口特殊是因为它具有唯一性。因为整个来自服务台业务的客户投诉和服务台系统的监控系统发出的告警信息都是通过这个借口来传递的。服务台业务流程是:根据客户投诉或者监控系统发出的告警填写服务请求工单,服务台值班人员根据请求的严重程度判断是否需要马上处理或者现场处理,如果需要直接进入事件管理流程的入口(升级为事件);如不需要就分配给相关人员立即处理,处理完毕后填写请求处理工单,该服务请求流程结束。
3 小结
提高整个IT运维管理部门工作效率的最为行之有效的方式就是从整个IT系统的扩展性能、实用性能和集成性能方面出发以全局的眼光来提高整套IT设备的管理从而完成以ITIL理论为基础的全套运维管理系统的设计工作,成为当下相关信息中心研发部门进行研究和改进的重点。
参考文献:
[1]张瑞冉.IT服务管理在运维管理中的研究与应用[D].首都经济贸易大学2012
[2]杨小晔.IT运维管理平台的设计与实现[D].北京邮电大学2011
[3]林碧芬.基于信息类型的信息网站设计模式研究[J].福建电脑.2009(11)
[4]李长征.国家部委IT运维管理体系案例[J].电子政务.2008(12)
作者单位:华为技术有限公司,广东深圳 518129
it运维管理论文篇二
IT运维管理的自动化的研究
摘要:随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。IT运维从诞生发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如
何实现性能与服务最优化,同时保障投资收益最大化。
关键词:IT运维管理 自动化 路径
IT运维管理自动化是指通过将IT运维日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作,使IT运维工作得到升华。IT运维自动化不单纯只是一个维护过程,同时更是一个管理的过程,一个能够主动诊断和维修终端系统并能快速简便更新补丁程序的自动化运维平台显然是IT工作雇员的愿望。因此,实现IT运维管理自动化是从传统被动式服务转变为主动预防式服务,以完善的流程程序贯穿整个运维管理的过程,实现运维管理的标准化、规范化、流程化和自动化是目前企业信息化建设急需解决的问题。
根据调查显示,当IT专业人员被问及他们在系统管理面临的最大的挑战时 ,近一半的受访者(46%)选择了“提供对终端用户满意的服务水平”。这个看似最为基本的要求反而成为IT专业人员最大的难题。显然,保持应用程序和系统启动并运行并不像听起来那般容易,这就更有理由让公司考虑自动化作为一个有效的解决方案来设置和维护最高级服务水平。
具体来说,一个企业往往拥有许多IT资源来维持其系统充分运转,通常有很多机位在管理,甚至处于不同的地理位置,且IT工作人员由于平时工作繁忙,每天都在重复着做着同一件事以至于让IT运维管理工作陷入被动化“救火式”状态,从而造成IT运维管理人员往往要等到事情发生才会想起来去解救,没有流程设置,周而复始就形成了连锁的恶性循环反应。如果能通过有限的IT人员和预算保持这一切安全运行且效率最好,这便是自动化的效果。
一、 绪论
1、 IT运维管理自动化研究的背景
新世纪的到来,也给各个行业带来了新的挑战和机遇。伴随着信息化的不断深入,企业数据量呈指数倍上升趋势。IT运维管理也逐渐出现了一些瓶颈。一方面数据中心集中了几乎所有的应用和系统,技术复杂度和关联度已经不能和以前相比;另一方面运维人员的高度集中和专业化也带来了IT运维管理的高度复杂性。
虽然这些年在安全设备的应用上越来越多,安全手段的采用也越来越多,但安全状况却不见好转。一些IT管理人员经常纳闷:我们已经在安全方面投入了相当多的努力,但为什么还会不时的出现安全问题?面对众多的设备与手段,IT运维人员有时候感到无所适从,其根源又是什么呢?IT运维自动化的下一步该怎么走?接下来,我们将在本文中详细介绍解决这些问题的办法。
2、我国当前IT运维管理自动化的发展现状
我国企业的IT运维管理大部分停留在IT运维管理软件的应用深化,管理流程的制定、梳理和优化,管理制度的完善阶段。但企业在实施信息化决策时,忽视了对内部业务流程和信息技术的管理变革。
运维管理部门平常的工作就像是“救火队”。IT人员总是随时紧张的待命,以便应付计算机系统各种各样的需求,即使这样,运维部门的服务质量和维护成本还是存在很多问题。我们需要将这些被动的管理转化为监控管理的主动改造。
目前很多企业已经接受了它的核心战略必须支持企业。IT部门在现在的在企业中发挥着越来越重要的作用,企业的高管也慢慢的发现,IT不再是我们所谓的“支持者”而是一个“驱动程序”。与国外尤其是欧洲的发展比较,我国的IT服务管理还处于早期的发展阶段。
欧洲众多成功企业大量的实践证明,企业在实施IT运维管理的自动化后,减少了重复和多余的工作,有效的利用了人文资源;增强了IT人员的素质,提高员工的服务能力和工作效率;使得IT部门的服务水平规范,使工作流程规范,使得通过人事变动的风险变低;提高IT服务的可用性、可靠性和安全性,为企业用户提供高质量的服务;IT部门的开支的有效控制,降低运营成本,降低经营风险;使得在公司的投资回报率能总体增长,给企业带来巨大的经济利益,使得企业的综合竞争力提高。美国宝洁公司从1997年开始使用IT运维管理的自动化的IT服务管理体系,在接下来的四年里节省了超过约5亿美元的预算,其运行费用下降了6%-8%,同时减少技术人员的数量大约在15%-20%。大量的实施服务管理的成功实践案例,可以提高企业的运作效率的25.3%。
3、IT运维管理自动化的研究意义
企业需要建立完善而成熟的IT运维管理自动化体制,通过流程管理,不断提高IT运维质量,实现高效运维,提升组织内IT服务满意度。IT运维自动化是基于流程化的框架,将事件与IT流程相关联,—旦被监控系统发现性能超标,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助IT运维人员完成日常的重复性工作(如备份、杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。
4、IT运维管理自动化现状存在的问题
目前许多企业的IT运维已经实现从人工运维到计算机管理,但在交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统的被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:
(1)运维人员被动、效率低
在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发现并着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对IT运维的服务满意度都不高。目前大多数企业的IT运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。 (2)缺乏一套高效的IT运维机制
目前许多企业在IT运维管理过程中自动化的运维管理模式不足,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行处理和修复,或者是在处理过程中存在问题,缺乏发现故障的流程化,而在解决问题时不但缺乏标准化的解决方案,也缺乏一个完整的跟踪记录。
(3)缺乏高效的IT运维技术工具
随着信息化的深入,企业IT系统日趋复杂,林林总总的网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,严重影响企业的正常运转。出现这些问题部分原因是企业缺乏事件的监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很难得到主动、快速的处理。
二、IT运维管理自动化的系统总体设计
IT运维管理自动化系统的主要功能包括数据的采集、数据展示和运维告警。本节我们将从这三个方向出发,来介绍这三种技术。
1. 需求分析
软件需求分析在整个软件开发与维护过程中越来越重要,直接关系到软件的成功与否。其主要目的是:在综合分析用户对系统提出的一组需求(功能、性能、数据等方面)的基础上,构造一个从抽象到具体的逻辑模型表达软件将要实现的需求,为下一阶段的软件设计提供设计基础。
2. 系统功能需求
在这里我们分别介绍三种技术,而三种技术的运用是互不可分的。
3. 数据采集
数据的采集是IT运维工作的主要根本,只有完成了数据的采集,才可以通过数据来了解企业IT系统运行的状况,才能够进行分析、预防故障的发生、处理故障、以及进行系统的升级、优化工作。
4、数据展示
数据采集有很多种,这里我们介绍的是RRDTOOL。RRDTOOL是指Round Robin Database工具(环状数据库)。Round robin是一种处理定量数据、以及当前元素指针的技术。RRD的一个目的是在一个环型数据归档中存储数据。
为了大家能更直观、更方便的理解环形数据归档技术,我们给出RRDTOOL简单的数据流程图,如图2:
5、运维告警
随着IT运维管理自动化的不断深入和完善,在企业中,运维告警处于非常重要的地位。在重要信息运行的过程中,能快速、及时、准确的反映问题信息,使我们能在最短的时间内处理、解决问题,从而避免巨大的损失,把损失降到最小。通过运维告警管理能降低IT管理人员的管理被动性,将管理人员从企业内部的计算机面前解放出来,真正实现无人值守的运维管理,从而节省很多开支。
在接下里来的文章里我们将介绍NAGIOS的运维告警服务。为了更直观的了解IT运维告警的运行,我们给出其流程图。
运维告警流程图如图3:
三、工作展望
随着社会的进步与发展,有越来越多的中小企业逐渐壮大,也有越来越多的中小企业发展起来,而IT运维管理的自动化还需要进一步的发展,紧随企业的需求,随着信息量的加大,对IT运维管理的自动化的要求也越来越高。希望在以后的,能有一款更好的软件,包含各种功能,能处理更多的数据,为中小企业提供便利。为提高IT运维处理问题的效率和服务质量,建设IT运维呼叫中心也是很有必要的,实现语音呼叫和业务数据的对接,配合IT运维管理系统使用。使IT运维管理的自动化发展的更完善!
参考文献:
[1]Jan van Bon,章斌译.基于工TIL的全球最佳实践.IT服务管理,清华大学出版社,2006.1.
[2]左天祖.中国IT服务市场现状与发展趋势. 2010.1.
[3]概念、理解与实施.IT服务管理, 2008:9~10.
[4]ITIL Glossary of Terms and Definitions,2007.5.
[5]陈宏峰,刘顾. ITIL Version3理论与应用白皮书,2010.7:8~14.
作者简介:
郭明岩,男,1985年8月,湖北工业大学计算机学院在职研究生,研究方向:计算机网络。