现在的位置:首页  /  云计算培训 >云计算技术教程

什么是云计算运维

来源: 薪享宏福
发布时间: 2018年12月11日
分享到:
        IT运维是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如硬软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。
 
       IT运维的难题与对策
 
        一、企业目前面临着如下的网络运维管理难题:
 
  1.网络运维缺乏绩效考核标准,职责不清,相互推诿。
 
  多数企业的IT部门目前都基本是按照IT基础架构功能来划分各个部分,也有少部分的企业是按照业务来进行划分。缺乏IT服务工作量量化考核工具,没有计算IT服务人员的工作绩效,也没有监督IT服务人员解决故障的处理效率和处理质量。因而在IT服务人员解决问题时缺乏协作,而一般IT出现故障或问题,都不会是简单的某个环节单独出问题,很多时候需要多个部门协作才能排除故障。所以,在企业运维过程中经常出现责任不清,相互推诿的现象。
 
  2.网络资产管理混乱,漏洞百出。
 
  IT设备和软件资产众多,目前还停留在人工管理的范畴。例如,IT设备的定期排查力度不够,设备巡检不到位:IT设备台账不能方便反映设备维修历史记录;软件资产未建立台账进行管理,软件的升级、变更等缺乏登记信息:设备和软件的配置信息不详,或者配置信息经过长期维修调整已经与实际不相符合:还有IT设备采购、调拨、报废等管理流程处理效率低。
 
  3.网络运维服务管理缺乏流程保障,维护人员忙于救火,缺乏主动服务。
 
  IT部门除了确保信息系统安全、稳定、可靠运行之外,还将面临如何管好、用好这庞大的系统,为业务部门提供有效的决策支持的挑战。然而很多时候,管理员都具有这样的通性,那就是IT业务没问题的时候神情特别轻松,但是一旦故障发生,尤其是涉及到企业核心电子业务的时候,那就得全体动员,尽快恢复业务运行,要是正赶上领导亲自来部门督战,气氛就会更加紧张,所以“救火队员”这个称号是对IT部门最恰当的角色定义。
 
  4.网络组织重“硬平台”建设,轻“软平台”管理,维护人员与客户满意度低投诉引起的相关部门的责难将打击}T运维人员积极性。
 
  5.日常工作中未能建立知识库,因此知识分散,信息中心过度依赖某个人,人员流失就会影响故障解决速度。
 
  6.网络系统缺乏长期规划,更缺乏复杂系统的运维管理经验。
 
  二、提高云计算运维服务能力的理论分析
 
  针对以上所说的网络运维管理难题,早在20年前,国外的一些政府单位和大型企业已开始着手探索应对办法,经过多年实践,总结出了相对完备的一套体系架构,该架构已经被业界公认为事实上的国际标准——ITIL(Information Technology lnfrastructure Library),即IT基础架构库。在国外,该标准正在被HP、IBM、CA、微软等企业广泛采用,并付诸实施。并在实践的基础上,形成了各自的ITSM(即information technology service management,IT服务管理)方法论及产品,并成为了他们开拓IT服务市场的招牌。
 
  1.IT基础架构库ITIL简介
 
  20世纪80年代,英国政府为了提升信息化设备和系统的运行效率,保障信息系统建康运行,有效进行服务外包管理,指定当时的英国政府计算机与通信局,研究开发一种方法,用于指导全国政府部门高效、经济地运营信息化设备和系统,结果产生了信息技术基础架构库((Information Technology Infrastructure Library),它汇集了IT服务业内的最佳实践,是指导如何在运维管理中定义人员、流程、服务活动及其之间关系的指导框架。ITIL的框架包括业务管理、服务管理、IT基础架构管理、安全管理、应用管理等,其中最核心的是服务管理中的服务支持和服务提供。
 
  2.ITIL对IT部门的效益分析
 
  ①通过实施ITIL,IT部门可以全面监控网络、主机、存储设备、安全设备、数据库、中间件及应用软件等IT资源。
 
  ②更加有利于IT部门对其负责的IT资源进行管理。
 
  ③ITIL流程可以对日常运行维护工作(或外包作业)提供一个管理框架。
 
  ④通过ITIL规范的服务台,可以建立一个更好的IT部门与业务部门沟通的平台。
 
  三、提高IT运维服务能力的对策
 
  综上可知,企业IT运维的难题并不是网络应用能力的不足而是网络运维管理能力和IT运维服务的缺失。网络运维的行业标准为ITIL,通过ITIL在企业的实践,我们可以从以下几个方面提高企业的网络运维服务能力:
 
  1.基于ITIL流程和理念,建立合理的工作流程,合理安排人员岗位,明确职责,避免一旦出现故障,互相推诿或者不知该找谁解决的情况。能保障在业务中断的第一时间找到相关负责人去解决问题,迅速恢复业务。
 
  2.实现统一监控平台,将各种监控资源通过集中展现和告警的方式进行统一管理,从整体上全面、快速了解系统当前的运行状态,帮助运维人员快速定位故障,缩短排查时间。
 
  3.高效的、合理的流程设置和流转,相互关联的事件工单、问题工单、变更工单、配置工单,使得运维工作流转过程中的资源关联清晰、过程明确可控、历史数据和处理过程可查,提高业务系统运行效率。
 
  4.高效、实时、准确的配置管理库可为运维服务提供所需的配置项信息,可通过设定的条件自定义查询、浏览、打印,不必费时费力去整理杂乱繁多的纸质记录,降低IT运维人员工作量。
 
  5.追踪资产生命全周期的资产管理,可对所有台账资源一目了然,对资产的使用状态准确记录,提高资产设备的重复使用率,及时淘汰报废设备,更新所需设备,提高IT资产使用率,降低IT资产投入。
 
  6.建立知识库积累,避免专业的技术问题永远只能依赖某一个或几个专业人员来解决的现状,使运维工作中的实际经验和专业知识得到共享,让人人都能成为IT运维专家。
 
  7.量化运维人员的运维工作,通过运维分析数据制定运维考核标准,逐步提高运维人员的服务水平和服务质量。
 
  总的来说,通过有效的实施IT运维管理,降低人员工作量。同时提高IT运维人员工作效率,保障业务人员的工作效率,提高业务系统运行状况,进而提高企业整体网络运维能力,同时提高客户满意度。