笔记-IT服务部署实施-5.2 IT服务部署实施要素

5.2 IT服务部署实施要素

5.2.1 人员要素部署实施

作为一名系统规划与管理师,保持客户对服务的认可是其需要关注的重点内容之一,而人员是其中重要的组成要素。对人员IT服务部署实施过程的管理和控制有利于对服务人员进行有效管理,保证服务交付过程中人员的综合能力满足客户实际的服务需求,确保人员能力跟上客户需求的变化发展。除此之外,参照计划部署实施IT服务相关的人员管理体系,也有利于调动人员的积极性,稳定服务团队并保证服务团队成员的连续性,同时体系化服务团队的知识和技能,提升服务团队的能力。

1. 外部招聘和内部调岗

系统规划与管理师协助HR采用外部招聘内部调岗的方式来组建服务团队,在此过程中,系统规划与管理师需参照储备计划,根据岗位说明书中对人员的知识、技能、经验三方面的要求分别进行判断。对于不同岗位补充进来的人员,应根据公司现有绩效考核文化,建立其绩效考核指标。

2. 建立培训教材库及知识转移方法

除了通过招聘和调岗的方式选取合适的人员提供服务以外,系统规划与管理师还需要与HR定期组织相关培训,体系化地补充现有服务团队人员的知识。在规划设计阶段中,系统规划与管理师已经编写了培训计划,而在部署实施环节中,需要组织相关人员编写培训教材并完善知识体系,在条件允许的情况下,专门形成培训教材库,定期维护和更新培训教材以保证教材的适用性,培训教材应涵盖技术、管理、工具等方面的内容,包括但不限于:

技术,如数据库知识、虚拟化技术等。
管理,如质量管理、领导力等。
过程,如IT服务管理过程等。
资源,如IT服务工具、服务台手册等。

5.2.2 资源要素部署实施

1. 知识库内容初始化

知识库设计好后,需要对内容进行初始化,可遵循如图5.1所示的流程。

1)来源

(1)由信息技术工程师提供
召集有经验的信息技术工程师,要求他们提供知识库的内容,知识库的建立并不是某个人智慧的积累,毕竟一个人的知识和经验有限,我们需要在企业中营造这样一种乐意共享自身知识的氛围,能够提供有效知识条目的工程师能够获得奖励。发布一系列奖惩和鼓励措施。

(2)从过往的事件和问题的处理日志中提炼
事件与问题的处理过程需要详细记录,能为下一次处理相同事件提供指导和参考。知识库内容可以从这些处理日志中提炼后获得,事件处理步骤的详细记录对于知识库内容的建立有着重要的帮助。

2)审核

依据知识库内容加入的审核标准,由资深技术人员审核内容的正确性和完整性,避免与原有的知识库内容重复或冲突,给出审核意见后提交批准加入知识库中。

3)发布

可以由指定人员如知识库管理员批准接受此条知识内容。管理员依据审核人的意见批准或拒绝此条知识内容,依据建议做出相应的调整后,将被批准的知识条目记录到知识库中。

2. 工具部署、使用手册与相关制度

此处提到的工具部署、使用手册与相关制度特指监控工具、过程管理工具与专用工具。

(1)工具部署前做好工具的测试,以测试结果作为重要的部署决策依据。
(2)规划好工具上线后的试运行阶段,包括试运行的周期、试运行的目标和结束标准。
(3)依据风险级别与影响度范围,决策工具部署上线是否采用阶段式部署
(4)与工具相关的知识应从开发团队或工具厂商处有效转移给工具的IT服务团队,包括各类工具的使用手册、使用说明与服务管理制度。

3. 备件库建立与可用性测试

备件规划与设计完成后向供应商采购所需备件及服务,依据备件供应商的评价对供应商进行选择,对所选备件进行可用性测试,确保备件能满足SLA中约定的目标要求。

备件采购完成后,做好备件入库登记,对入库备件进行标识,规范备件的使用和核销,做好备件物品的账务管理,备件库中的备件应提供使用者备件信息的参考,使其了解备件当前的状态。定期对备件状态进行检测,以确保其功能满足IT服务需求。

发布备件管理制度与规范,如库房管理制度、备件出入库规范、备件申请流程、备件采购流程等。

4. 服务台管理制度的初始化

服务台管理制度中至少要包括如下内容。

(1)服务台中各岗位的角色与职责。
(2)服务台的主要工作流程。
(3)记录事件与服务请求的具体要求。
(4)事件与服务请求分派的原则。
(5)事件回访的相关规定与要求。
(6)服务台的绩效考核指标。

5.2.3 技术要素部署实施

在IT服务过程中可能面临各种技术难题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿应用所提出的新要求,供方应根据需方要求或技术发展趋势,部署发现和解决问题的技术能力。

1. 知识转移

1)知识转移的目的

知识转移是技术部署实施的重要环节,完备的知识转移可提高IT服务技术支撑能力,降低风险,缩减成本,提升效率。

2)知识转移的内容
(1)历史运维资料
  • 相关工作界面和人员职责说明书。
  • 内外部支持信息(开发商、厂商、业务部门、公司内部相关部门)。
(2)基础架构资料
  • 系统部署和网络物理拓扑。
  • 系统架构说明:软/硬件配置。
  • 系统数据备份与恢复操作说明书。
  • 系统应急、容灾处理方案(如集群切换和恢复)。
  • 系统日常运维操作手册。
(3)应用系统资料
  • 应用系统测试报告。
  • 应用系统使用手册。
  • 应用系统需求和设计文档。
  • 应用系统安装配置手册。
  • 应用版本说明(含与其他系统的依赖关系说明、已知错误列表及对应的临时措施等)。
(4)业务资料
  • 业务架构图(业务功能模块在系统中的分布)。
  • 业务流程(系统交互、工作流说明、业务功能说明、业务对象说明)。
  • 业务场景说明(前台业务高峰说明、后台关键作业时间周期)。
  • 业务培训资料。
  • 业务运维文档(业务问题FAQ、业务问题诊断)。

技术部署实施与知识转移实例如图5.2所示。

技术部署实施与知识转移实例

2. 应急响应预案的制订与演练

1)制订应急预案与演练的目的

应急预案是组织在信息系统方面的总体应急预案,适用于组织IT系统发生重大系统性故障,导致全国性或地区性的业务中断、大量客户数据资料丢失以及组织认为应采取应急机制的其他IT系统重大突发事件,包括以下情形:

(1)自然灾害引起的对IT系统的灾难性破坏。
(2)网络通信设备、通信线路故障导致IT系统的重大故障。
(3)电源电路以及机房等基础设施故障导致IT系统的重大故障。
(4)IT系统数据库、系统和存储、中间件故障导致的重大系统性故障。
(5)IT系统发生网络攻击破坏、计算机病毒传播或被利用从事违法犯罪活动等引发的重大安全突发事件。
(6)应用系统发生重大故障。
(7)组织认为应采取应急机制的其他IT系统重大突发事件。

2)应急演练原则

(1)结合实际、合理定位。紧密结合应急管理工作实际,明确演练目的,根据资源条件确定演练方式和规模。
(2)着眼实战、讲求实效。以提高应急指挥人员的指挥协调能力、应急队伍的实战能力为着眼点。重视对演练效果及组织工作的评估、考核,总结推广好经验,及时整改存在的问题。
(3)精心组织、确保安全。围绕演练目的,精心策划演练内容,科学设计演练方案,周密组织演练活动,制订并严格遵守有关安全措施,确保演练参与人员及演练装备设施的安全。
(4)统筹规划、厉行节约。统筹规划应急演练活动,充分利用现有资源,努力提高应急演练效益。

3)突发事件等级划分

(1)特别重大突发事件(I级)。
实例:系统性故障造成20%~60%的集中的基础、核心、关键系统不可用,且在24小时内无法恢复;或60%以上集中的基础、核心、关键的系统不可用且12小时内不可修复。

(2)重大突发事件(Ⅱ级)。
实例:系统性故障造成20%~60%的集中的基础、核心、关键的应用系统不可用且在12小时内不可恢复。

(3)较大突发事件(Ⅲ级)。
实例:关键业务全国性的中断,且预计恢复时间大于6小时、少于12小时。

(4)其他造成区域性业务中断的故障。
实例:造成区域性业务中断的故障,恢复时间小于6小时的IT事件按照日常事件处理流程执行。

4)组织指挥体系及职责
(1)指挥小组职责
  • 指挥、协调集团公司及系统内部组织的信息系统突发事件处理工作。
  • 启动信息系统应急预案。
  • 协调行政工作和后勤保障资源。
  • 作为与组织管理层和业务部门沟通情况的接口。
  • 决定其他重大事项。
  • 通知或召集相关的恢复小组负责人。
  • 根据指挥小组的指示,协调处理其他事务。
  • 负责组织本预案的维护、演练和管理工作。
(2)IT恢复小组职责
  • IT恢复小组负责IT环境的恢复工作,包括基础设施、应用系统和其他IT环境。在应急阶段,由信息技术部、资产管理营运部和IT运行中心各功能区的人员协同组成虚拟团队进行恢复操作工作。
  • IT恢复小组组长负责通知或召集相关的恢复小组组员。
    表5.1给出了各小组名称及其职责。
    各小组名称与职责
5)应急响应演练
(1)演练启动

演练正式启动前各参演单位按照应急指挥办公室通知的场景进行集合,举行简短仪式,由演练总指挥宣布演练开始并启动演练活动。

(2)演练执行
  • 演练指挥与行动:参演人员根据控制信息和指令,按照演练方案规定的程序开展应急处置行动,完成各项演练活动。
  • 演练过程控制:综合应急预案采用桌面演练方式进行,专项应急预案及现场处置方案采用实战演练方式进行。
  • 演练记录:各预案在演练实施过程中,采用文字、照片和音像等手段记录演练过程。
(3)演练结束与终止
  • 演练结束与终止的程序:演练完毕或演练出现意外情况时,由总策划发出结束信号,演练总指挥宣布演练结束。
  • 演练结束与终止条件。各预案演练结束的条件:方案的演练目的、内容、程序都已按要求演练完毕。演练中止的条件:出现真实突发事件,需要参演人员参与应急处置时,要中止演练,使参演人员迅速回归其工作岗位。
(4)应急演练评估与总结
  • 演练评估:演练过程中,评估组人员分别对各个场景进行演练记录,填写《演练方案实施情况评估表》。
  • 演练总结:现场总结,事后总结。
(5)成果运用

对演练暴露出来的问题,演练单位要及时采取措施予以改进,包括修改完善应急预案、有针对性地加强应急人员的教育和培训、对应急物资装备有计划地更新等,并建立改进任务表,按规定时间对改进情况进行监督检查。

(6)文件归档与备案

演练组织单位在演练结束后应将演练计划、演练方案、应急预案演练评估报告、应急预案演习报告(总结)等资料按规定报有关部门备案,并留一份归档保存。保存的期限是通常为6年。

7)考核与奖惩

演练组织单位有权对演练参与单位、部门及人员进行考核。对在演练中表现突出的单位及个人,按照公司有关规定,可给予表彰和奖励;对不按要求参加演练,或影响演练正常开展的,要给予相应处罚。

3. SOP标准操作规范

(1)制订SOP的目的

SOP就是将某一事件的标准操作步骤和要求以统一的格式描述出来,用来指导和规范日常工作。SOP的精髓是将细节进行量化,用更通俗的话来说,SOP就是对某一程序中的关键控制点进行细化和量化。

(2)SOP的作用 ▲
  • 将企业积累下来的技术和经验记录在标准文件中,以免因技术人员的流动而使技术流失。
  • 使操作人员经过短期培训,快速掌握较为先进合理的操作技术。
  • 树立良好的服务形象,取得客户信赖与满意。
  • SOP是贯彻标准化作业的具体体现,实现服务管理规范化、服务流程条理化、标准化、操作的形象化、简单化。
  • SOP是系统规划与管理师最基本、最有效的技术管理手段。
(3)SOP的编写要点

SOP的编写通常需要遵循如下原则:

  • 在人力、财力、物力等资源允许的范围内可以做到;
  • IT服务人员都能看懂,且每个人的理解都相同;
  • 效率最高和成本最低,并识别出关键风险点;
  • SOP正式发布前要经过测试与评价环节;
  • 可以根据业务与技术发展需求,实现快速迭代;

4.技术手册发布

编写各类用于发现与解决问题的技术手册,应包含发现问题的技术手段,如监控阈值、测量方法等,以及解决问题的措施与可选方案。技术手册发布的流程如图5.3所示。

(1)审核:技术手册在发布前应进行审核,验证可行后以文档管理的要求进行存档。

(2)存档:为了能够对技术手册实现高效使用,应采用分级管理的方法,分级管理便图5.3技术手册发布的流程于使用者快速定位到所需要查看的技术手册。

(3)发放:通知相关人员进行查看,组织培训讲解,确保使用者按手册要求进行操作。

5.搭建测试环境

搭建发现与解决问题所需的测试环境。依据规划设计要求建立测试目标,运用各类测试模拟工具,模拟真实环境中的场景,执行测试设计中的要求,通过测试验证技术的可行性和可靠性等要求,增加客户和服务提供方的信心,规避IT服务的潜在缺陷,有效减少突发事件的发生率。

5.2.4 过程要素部署实施

系统规划与管理师需要将各管理过程正式发布,并进行试运行。为了保证过程体系的顺利平稳发布,系统规划与管理师需要通过必要的管理工具实现过程的电子化,并在此基础上收集充分的初始化数据,及时跟踪发现试运行期间暴露的问题,为下一阶段奠定良好基础。

1. 过程与制度发布

在此阶段,系统规划与管理师主要实现制度的发布以及工具的部署上线。后面将详细介绍流程电子化管理在部署实施方面的管理要点。

过程的设计已经在规划设计环节中完成,因此系统规划与管理师应组织服务工程师和管理人员等完成过程与制度的发布,从而进入试运行阶段。在过程发布时,应对相关人员进行充分的培训,如帮助服务台人员充分熟知新体系中事件和服务请求的处理流程、接线话务要求和表单的填写要求等。除了人员培训以外,还需要进行相应的宣传贯彻,保证体系的贯彻执行,具体方式可以采用桌面提醒、海报等方式。

2. 过程电子化管理和数据初始化

对过程的电子化管理可帮助系统规划与管理师在服务运营过程中更好地提供服务,这可以通过对记录的追踪、KPI的统计分析、定制化的客户服务等方式实现。

部署实施过程中应重点关注:

(1)过程管理电子化工具与其他工具的互联互通,如呼叫中心系统、集中监控系统。
(2)规划设计中的过程KPI如何通过电子化工具直接获取,并形成所需的报表。
(3)如何在电子化工具中实现各个过程与其他管理过程之间的接口。
(4)过程与知识库的关联关系,如问题导入知识库的方法等。

除对于相关过程需要关注电子化管理方式以外,系统规划与管理师还需要完成对数据的初始化工作,主要包括以下数据。

(1)组织基础信息,如部门等。
(2)人员基础信息,如岗位、职责、权限等。
(3)过程角色,如运维管理部工程师承担事件管理过程二线工程师角色和问题管理过程技术专家角色。
(4)客户信息,如客户基础信息、服务级别协议等。
(5)历史信息,如最近两个月的事件单等。
(6)其他信息,如事件管理过程提醒时间等。

3. 体系试运行

体系试运行是为了检查设计的各过程是否能够很好地落地并服务于客户,因此是部署实施阶段很重要的一项活动。在试运行期间,系统规划与管理师需要监控各过程的执行情况,判断新过程的效果,主要通过以下方式进行检查:

(1)管理目标达成情况:如通过当前设置的考核指标仍然无法准确统计人员工作量等。
(2)客户满意度:如试运行的过程是否对客户造成了负面影响,系统规划与管理师需要根据这些影响的原因判断影响是否是暂时性的,例如,是由人员对过程不熟悉造成的,还是由于过程设计过于复杂导致解决时间增加等。
(3)服务工具使用效果:根据不同原因,系统规划与管理师需要对人员培训、体系宣贯、过程设计、系统调优等方面进行适当调整,以保证向服务运营过程的顺利过渡。

--------------本文结束 感谢您的阅读--------------