在A银行科技部门强化运维体系建设的过程分中,

从信息工程监理角度看IT运维管理(1)

1.引言

经过十年的信息化发展,国内很多行业的很多单位都已经实现了一定程度的信息化。在大规模的信息化建设完成后,将面临长期的系统运行维护的问题。在IT项目的生命周期中,大约80%的时间与IT项目的服务和运营有关。

如何维护已经建成的信息系统,成为信息化建设走向良性循环发展轨道的重点。作为信息工程监理单位,一般完成项目验收就结束了监理工作,但随着市场需求的不断扩大,监理公司顺应市场,已经将业务扩展到了运维阶段的监理,本文将说明信息工程监理如何进行IT运维管理。

2.IT运维现状

根据高德纳咨询公司(GartnerGroup)的调查发现,在经常出现的问题中,源自技术或产品(包括硬件、软件、网络、电力失常及天灾等)方面的问题其实只占了20%,而流程失误方面的问题占40%,人员疏失方面的问题占40%。流程失误包括变更管理没有做好、超载、没有测试等程序上的错误或不完整,人员疏失包括忘了做某些事情、训练不足、备份错误或安全疏忽等。

图片 1

图2-1IT系统出现故障原因分析图

从世界范围看,IT部门面向内部的最终客户提供服务的历程可以分为四个阶段,如图2-2所示:

图片 2

图2-2IT部门演变历程图

第一阶段是救火队阶段,哪里出了问题赶快派人到哪里,有时候会忙得焦头烂额,响应也不及时,打电话找不到人,最终客户满意度不高;第二阶段是为了提高客户满意度,很多企业逐渐设置了专门的热线服务,受理故障申告后,及时安排工程师处理,跟踪故障处理过程及时反馈最终客户,客户满意度逐渐提高;第三阶段是集成的服务和运行中心阶段,其显著特征是在HELPDESK的基础上,进行了几个方面的优化和改进:一是在故障处理的基础上进行了问题管理,采取措施分析故障根源,解决故障隐患,二是服务过程流程化,三是增加了变更管理、资产配置管理、服务水平SLA管理等内容。同时,必须有一个良好的服务管理系统的支持,不仅仅是网管监测系统,服务台/服务热线在接到客户的保障后,马上就知道当月已经发生的故障历时,并确定这次故障的优先级别;第四个阶段是主动维护管理和自动维护管理。IT系统能够自动报告,SLA与其对业务的影响紧密相关。

目前,中国的很多企业还处于第一、二阶段,刻不容缓的工作是对客户的服务要尽快提升到一个更高的水平。

3.信息化管理体系建设内容

IT运维管理体系要真正发挥效益,避免“为技术而技术”,需要融合人、流程、技术。根据信息化的发展要求,赛迪监理认为配套的管理措施应包括组织模式、管理制度、管理流程、绩效考核、运维费用、技术支撑等内容。

3.1组织模式

监理单位应协助信息中心从全局的角度定位IT运行维护和服务工作,将中心目前分散进行的各项IT运行维护和服务的工作职能逐渐整合,进行集中统一管理,统一调度IT运行维护和服务的技术力量,并结合信息中心实际情况和管理需要进行配套的组织机构的设置和逐步完善。

第一,成立IT运维管理领导小组。初期可以成立由信息中心领导和各处(室)负责人组成的IT运维管理协调小组,从总体上负责IT运行维护和运维管理的统一组织协调,监督检查各处室服务质量;将来根据IT运维管理发展,可以成立由部领导、中心领导和业务司局领导组成的信息化治理领导小组。

第二,建立面向用户的服务接口。初期以服务台为统一服务接口,不断扩充与完善服务台的功能,统一受理客户的IT服务请求,记录问题并及时解决,对解决不了的较为专业的问题派发给专业的技术人员,各相关处室提供技术支持,并明确相关技术支持人员及职责;将来逐步建立独立的IT运行维护和服务机构(运维中心),专门负责IT运维和服务工作,合理划分建设与运维的边界,实现建设与运维的分离。

第三,设置合理的组织机构。初期保持目前组织机构和职责不变,进一步理顺关系;将来随着信息化发展和管理成熟度的不断提升,逐步建立起完全适应体系运行的IT治理组织机构。

3.2管理制度

赛迪监理认为管理制度是指IT运行维护和服务工作必须遵循的内部管理规定,用于提高工作的协调性和管理的有效性。借鉴IT运维管理体系国际标准标准ISO20000要求,管理制度分为“纲领性办法”、“分项办法”、“实施细则或操作指南”和“配套表单”四个层次,见图3-1。

图片 3

图3-1管理制度级别图

第一级:制定涵盖信息中心IT运维管理全过程的纲领性总体办法《IT运维管理办法》,作为指导IT运维管理工作开展的统领,内容涵盖IT服务全过程的管理控制点和人员管理等核心内容,包括IT运维管理模式、归口管理、组织结构与职责、人员岗位与职责、IT运维管理工作规划与执行、预算保障、绩效评价等方面的管理规定。

第二级:结合IT服务的实际情况,针对管理工作需要而制定的具体管理分项办法,范围涵盖系统、网络、机房、桌面、设备备品备件及耗材、文档等,明确管理职责与规范操作流程。

第三级:在第二级分项办法的基础上,按照精细化管理需要,对某些方面的运行维护工作的具体实施过程与操作程序做出的细化准则或指南。

第四级:配合第一、二、三级制度的执行而配套制定的表单等,用于记录、备案人、物、行为等信息。

) 1.引言 经过十年的信息化发展,国内很多行业的很多单位都已经实现了一定程度的信息化。在大规模的...

A银行以”服务至上、科技先行”的原则,大力推动科技部门和信息系统的建设,并注重强化运维体系建设,提升系统服务水平,保证关键应用的可用性。

若要在企业中实现ITIL的完美落地,事件管理就是成功的基础和必要的条件。从目前ITIL在国内实施的情况来看,事件管理是企业选择ITSM软件的首要考虑因素,也是企业逐步实施ITIL关键的第一步。

建立健全应对重大事件(突发事件)的预警、报告、决策、指挥、响应及退出等环节的应急处置机制。制定监测指标,实时监测业务运行状态,及时发现异常情况,及时预警;建立清晰的报告流程,明确报告路线;建立应急指挥、决策体系,统筹协调,高效决策,保证指挥流程畅通;制定应急处置响应流程,加强关键岗位人员配置。

1、配置信息混乱
–设备和软件供应商众多,厂商范围和时间跨度都很大,信用和评价目前还停留在人工管理的范畴,需要用IT技术手段管理。
–设备台帐不能反映设备维修历史记录。软件的升级、变更等缺乏登记信息。
–设备和软件的配置信息不详,或者配置信息经过长期维修调整已经与实际不相符合。
2、运维急于救火
–维护的设备和系统众多,疲于应付突发故障;巡检机制不到位,预防工作未贯彻执行。
–故障处理过程缺乏共享的记录信息和跟踪信息;故障处理流程不规范,职责划分不清晰。
–维保厂商或外包服务商处理故障进度无法在线监控,服务质量缺乏考核手段。
–没有形成有效的知识库,遇到相同的问题,不能从知识库获取解决问题的办法。
–运维分析报告编制困难,维护成功率、维护及时率、用户满意度等指标缺乏准确的统计。
3、绩效管理缺乏数据
–IT服务工作量量化考核困难,无法计算IT服务人员的工作绩效。
–外包服务商或厂家工程师处理及时率缺乏准确统计,结算和考核都缺乏数字化依据。
  。。。。。。  
【解决方案】
     今天ITSM发展到IT运维的业务驱动阶段,即用户开始实行IT资源的动态分配,向管理要效益。其特点在于制定服务目录,引进财务管理,乃至于让业务部门按服务的级别和内容向IT部门(IT服务商)付费,以减少资源浪费,提高生产效率。IT服务管理是从业务入手,用软件工具来调配IT资源,解决客户所遇到的业务问题。
   关注客户的重点、烦恼和需求的面向流程的解决方案:导入ITIL管理方法,构建ITSM管理体系,通过部署E8.HelpDesk软件系统,并完成客户化实施,提升企业内部IT服务能力和企业竞争力;提高专业IT服务商的服务效率和市场竞争力。  

建立健全应对重大事件(突发事件)的预警、报告、决策、指挥、响应及退出等环节的应急处置机制。制定监测指标,实时监测业务运行状态,及时发现异常情况,及时预警;建立清晰的报告流程,明确报告路线;建立应急指挥、决策体系,统筹协调,高效决策,保证指挥流程畅通;制定应急处置响应流程,加强关键岗位人员配置。

服务台如同接待客户的前台,在ITSM系统中,“Single-Point Contact”是服务台在事件管理中的重要属性,也是接收所有IT事件的入口。通过服务台统一管理IT事件,串联所有人、事、物。

E8.ITSM是一款比较成熟的本土IT服务管理平台,产品开发公司为深圳市非凡信息技术有限公司,它包括图形化的、具有中国特色的流程管理平台和IT运维管理平台两部分。其中IT运维管理平台包括了运维流程管理、监控及一体化管理平台、应急管理等功能。

•   变化:业务需求变化快、IT工作负荷大、IT服务能力服务水平有局限性; 复杂性:各种各样的IT资源、大量基础设施和复合应用程序;成本:管理和监管,要求不断提高IT投资回报率;安全性:规章、安全性和审计能力。

建立应急预案一体化管理体系,建立涵盖总体预案、专项预案等预案框架;统筹预案管理,加强预案之间的衔接与配套;建立有效的预案维护机制,涵盖预案制定、评审、发布、变更和回收过程;制定预案编制规范,保证预案编制质量;强化预案后评价与持续改进机制,保证预案有效性。

下图是ITSM一个标准的事件处理流程图,服务台接收到新事件后,根据事件信息将其分配给具体的一线工程师进行处理,若一线工程师不能解决可以升级给二线工程师,处理完成后要返回到客户进行确认,客户确认满意才能关闭事件,这是一个标准的事件处理步骤。

加强应急处置,提高协作能力。应急管理包括故障应急处理、高可用冗余建设、灾难恢复计划DRP或业务连续性计划BCP等几方面。

      ITIL是关于IT服务管理领域事实上的世界标准,它以流程为导向,以客户为中心,通过整合服务与流程提高企业或组织的IT服务提供和服务支持的能力与水平。ITIL标准告诉我们做什么,但没有告诉我们怎么做才能达到ITIL管理目标,因此有必要大胆实践,探索符合中国企业实施ITIL管理体系的最佳方案。
【棘手问题】

根据风险战略与业务连续性目标,制定灾难备份体系建设策略与实施路线;以业务有效恢复为目标,逐步加强灾备体系建设;逐步加大数据、系统、基础设施等各类资源的保护范围以及恢复能力;逐步推进分支机构灾难备份建设,提高电子银行渠道灾难恢复能力,推进外联交易、支付、清算等重要渠道灾难备份建设。

IT日常管理,为IT运维人员提供了工单管理、值班管理、巡检管理、公告、知识库、报表统计等日常运维工作所需的多个管理工具。

探索灾难备份体系建设模式,加强架构设计,应用技术创新,加强数据中心集约化、标准化、流程化管理;深入研究数据中心“双活”、“多活”建设模式,提高数据中心之间相互备份、切换和接管能力。

经验方面:非凡公司具有多家大中型企业和银行的实施经验;本着对客户负责的原则,非凡公司实施方法采用顾问加产品的方法帮助企业建立IT运维管理体系、规范各岗位职责和流程,把IT运维管理的最佳实践和企业的实际相结合提升企业的IT服务管理水平。

关注客户反馈情况、开展客户满意度调查

    加强运维流程管理。进一步完善运维管理流程,健全运维管理制度和标准,重点加强事件管理、问题管理、变更管理、配置管理等关键管理流程和数据管理、机房管理等制度标准建设与执行力。加强管理流程整合,完善信息交互机制,形成闭环管理。强化事件分级制度,建立有效的事件升级及响应机制;加强事件后续分析与处理,不断优化管理流程;建立变更分类标准和变更分级审批流程,完善变更窗口管理制度,有效降低变更对生产运行的负面影响;制定配置参数移植、修改、备份、存储、更新、销毁等方面的管理制度,控制配置操作引发的风险。完善数据存储、使用、传输以及备份管理,进一步制定标准、规范,重点强化客户信息和经营分析数据等敏感数据访问控制、清理、销毁以及数据变形使用管理;进一步加强机房人员、供电、空调、防火管理。

2、系统化就是利用E8.IT运维管理平台,这种IT服务管理系统将各种IT管理流程、运维管理经验、IT服务管理思想系统化,并能不断优化,扩展。

服务标准化定义,规范运维流程

A银行信息科技部运维中心根据IT服务管理的三点和四化指导原则,积极推进IT运维服务管理平台的建设并于2012月3月份上线了深圳非凡公司的E8.ITSM系统,把IT服务管理的理念和最佳实践融合进IT运维服务管理平台,真正的推动A银行的IT运维管理转变为IT服务管理。

    加强运维流程管理。进一步完善运维管理流程,健全运维管理制度和标准,重点加强事件管理、问题管理、变更管理、配置管理等关键管理流程和数据管理、机房管理等制度标准建设与执行力。加强管理流程整合,完善信息交互机制,形成闭环管理。强化事件分级制度,建立有效的事件升级及响应机制;加强事件后续分析与处理,不断优化管理流程;建立变更分类标准和变更分级审批流程,完善变更窗口管理制度,有效降低变更对生产运行的负面影响;制定配置参数移植、修改、备份、存储、更新、销毁等方面的管理制度,控制配置操作引发的风险。完善数据存储、使用、传输以及备份管理,进一步制定标准、规范,重点强化客户信息和经营分析数据等敏感数据访问控制、清理、销毁以及数据变形使用管理;进一步加强机房人员、供电、空调、防火管理。

在传统的IT服务管理模式中,在事件处理完毕后,工程师往往会忽视客户的反馈;但客户反馈对于改进IT服务,提高客户满意度却十分重要。因此,在事件管理中进行用户反馈很有必要,可以通过问卷调查的形式让客户对事件处理的情况进行评价,从而建立IT服务部门与客户之间的沟通的桥梁,提高客户满意度,改善IT服务质量。

A银行信息科技部运维中心根据IT服务管理的三点和四化指导原则,积极推进IT运维服务管理平台的建设并于2012月3月份上线了深圳非凡公司的E8.ITSM系统,把IT服务管理的理念和最佳实践融合进IT运维服务管理平台,真正的推动A银行的IT运维管理转变为IT服务管理。

勤智ITSM主要特点:

加大集中监控及一体化管理力度。健全生产系统软硬件、网络及应用系统性能监测指标体系,优化监控策略;在实现对系统、设备、网络、基础环境等监控基础上,重点加强对核心应用系统和电子银行渠道监控;构建统一监控平台,统一管理和展现各种监控资源,实现集中告警方式,全面、及时掌握系统整体运行状态,快速定位故障、缩短处理时间;加大对总分行监控系统整合力度,提高总行对分行生产系统监管能力,进一步完善监控、响应、处理、报告、反馈和跟踪机制,实现全行范围基础设施和主要应用系统生产运行情况的全面监控,提高运行管理的全面控制能力。提高运维管理自动化水平,整合操作、维护、监控、响应、处理等管理流程,推进企业级总控中心(ECC)建设,促进运维管理一体化。

本文由必威发布于必威-运维,转载请注明出处:在A银行科技部门强化运维体系建设的过程分中,

相关阅读