笔记-IT服务持续改进-7.2 服务测量
7.2 服务测量
服务测量用于获得与服务交付过程相关的各种数据,进而获得服务改进活动所需的各种原始资料。对服务进行有效测量是进行服务改进的基础,通过服务测量可以获得各种数据,进而作为服务改进的基准和依据,并为服务改进设定目标。如果没有有效的服务测量,将使得服务改进活动失去方向和动力,并可能最终导致服务质量下降。
服务测量的范围包括IT服务全生命周期阶段的每个方面,覆盖战略、战术和操作等多个层面,需要系统规划与管理师从技术和业务两个不同的视角来确定测量指标。
测量指标的类型可分为如下3种:
(1)技术指标:基于IT组件和应用的测量,如可用性、性能。
(2)过程指标:通常以KPI表示,反映服务管理过程的运行或健康状况。KPI有助于回答4个关键问题:过程的质量、绩效、价值和符合性,持续服务改进利用这些KPI识别对各过程的改进机会。
(3)服务指标:对端到端的服务绩效的测量,通过技术和过程指标加以计算。
7.2.1 服务测量的目标
服务测量的目标是监视、测量并评审服务及服务管理目标的完成情况,分析与服务计划的差距,并为服务改进提供依据。服务测量活动的价值体现在:
(1)验证之前所做的决策是否正确,所做的工作是否有效果。
(2)较目前的服务在成本、质量、有效性等方面是否比之前得到了改进。
(3)证明服务改进活动的必要性,并向管理层争取必要的资源,以支持服务改进。
(4)指导服务改进活动的方向和目标。
7.2.2 服务测量的活动
在实施服务测量的各项数据收集活动前,系统规划与管理师应明确测量的目标和方向是否与服务供方的运营目标及业务需求相匹配。以下将从人员、资源、技术及过程几个要素分别描述具体测量活动和收集项目,系统规划与管理师还应依据成本和技术能力进行筛选,尽可能避免主观判断的测量项。
1. 服务人员测量
考虑到人员是提供IT服务的基础,因此从IT服务改进测量的角度,我们更应该关注人员培训管理、人员招聘管理、人员绩效管理、人员储备管理、岗位职责管理、人员工作量管理等,具体对应如下测量活动:
(1)识别备份工程师对项目的满足度和可用性。
(2)测量人员招聘需求匹配率。
(3)收集培训的应用情况,如培训覆盖率、满意度及评价。
(4)人员能力测量,如识别并收集考评团队内部最新的人员技能、资历认证等。
(5)服务工作量测量,如根据来电量进行服务台人员配比预测等。
(6)岗位职责更新情况,如识别最新组织结构变化等。
(7)人员绩效考核分配机制测量,如关注分配比例的合理性。
(8)实时监控团队工作状态,如关注员工易动隐患等。
【人员测量参考实例】针对IT服务人员绩效指标及实际达成情况,进行绩效考核和评估,绩效评估及应用可按表7.1所示操作,测量分配比例的有效性和具体指标。测量分配比例是否达到绩效考核的目的,同时关注参评人员对于该分配比例的反馈。
2. 服务资源测量
跟踪服务资源现状和变化趋势,针对IT服务运维工具、服务台、知识库和备件库进行相关测量。以项目为单位,根据不同服务项目的进程需求,由系统规划与管理师周期性统计该项目的资源健康状态和使用情况。
(1)IT服务运维工具
针对服务过程中使用的监控工具、过程管理工具和专用工具进行测量,测量活动包括:
- 测量工具的功能与服务管理过程是否有效匹配。
- 周期性识别相关工具的使用手册是否有效并进行相关验证。
- 监视IT服务运维工具的健康状态,如可用性、软/硬件历史故障等。
(2)服务台
服务台关键测量指标示例如表7.2所示。
(3)备件库
由系统规划与管理师根据项目要求,周期性统计发生的资源消耗情况(事件数量、备品备件数量等),做出工作效率分析,并与前期数据对比分析,出具服务资源需求分析等。测量活动包括如下项目。
- 盘点备件资产:针对现有备件资源进行账实盘点,为备件库调整计划提供数据支撑。
- 统计备件损坏率:根据备件名称、编号、备件分类、损坏原因、损坏分类、损坏地点、修复方案等信息进行逐条统计。
- 统计备件命中率:可根据通用备件、专用备件分别统计周期内备件的使用情况,测量实际命中率与计划命中率的差距。
- 统计备件复用率:针对可复用的备件品类,按照修复时间、修复类型、备件编号等信息进行统计。
(4)知识库
收集知识的积累数量、知识的利用率、知识的更新率、知识的完整性、各类知识的比重、知识新增数量与事件、问题发生数量的对比关系。
3. 服务技术测量
(1)识别研发规划:根据运维技术研发计划,测量技术规划的完整性和落实情况。
(2)识别研发成果:各种技术对运维业务的实际应用效果和实用性。
(3)技术手册及SOP统计:如根据事件分类进行SOP覆盖率的定期统计,根据诊断方案或典型故障的解决方案进行使用率的定期统计等。
(4)应急预案实施统计:收集所有应急预案在实施过程中,如人员能力、职责、流程、技术等方面的量化指标,如实际发生的应急响应、升级时间等。
(5)监控点和阈值统计:定期比对监控点的适用性,通过测量实际监控结果,判断阈值设定的合理范围。
4. 服务过程测量
服务过程测量活动是分层次的,对于单一服务项目而言,测量活动至少应该覆盖服务管控和服务执行两个层次。前者主要从业务和用户的视角来测量服务过程,关注服务交付结果,后者主要从技术视角来测量服务过程,关注具体的服务过程和细节。
1)服务管控测量
服务级别分析主要包括:
(1)目标:总结与分析服务项目的服务级别及关键绩效指标的完成情况,为提升服务质量提供依据,并作为项目报告基础信息,向用户呈现服务的绩效信息。
(2)方式:以项目为单位,根据不同项目的进程需求,由系统规划与管理师负责统计分析,并整理出项目服务级别及绩效信息。
(3)活动:由系统规划与管理师制订阶段性项目计划及需求,进行统计分析,并形成“项目绩效分析”作为项目总结报告或月度服务报告的核心组成部分。评测内容包括(但不限于):服务SLA达成率分析、重大事件分析(MTTR、服务效率)、人员绩效分析等。
2)服务执行测量
(1)事件统计分析
- 目标:动态跟踪服务过程中每个事件的完成情况,及时发现服务过程的不足之处,并予以纠正。
- 方式:由事件管理负责人对项目实施过程中记录的事件进行记录和监控,以此作为服务可用性和SLA分析的基础数据。
- 活动:重大事件回顾:分析过去一段时间内所发生的重大服务事件或故障,总结经验教训,并对所采取的纠正弥补措施进行有效性分析。事件统计和分析:在项目执行阶段,系统规划与管理师将对执行过程中发生的所有事件进行统计和分析。汇总和发布:系统规划与管理师定期将总结报告进行汇总,并发布给客户及用户,出具重大事件报告、事件分析总结报告。
(2)问题统计分析
- 目标:降低事件发生概率,提高事件处理效率。
- 方式:由问题管理负责人定期制订并发布。
- 活动:问题经理定期统计周期范围内产生的问题和解决方案,并形成相关报告发布给所有服务实施团队,出具问题分析报告。分析内容包括周期内问题数量、已解决问题数量、遗留问题数量、知识库更新信息等。
(3)变更与发布统计分析
- 目标:有效监控变更与发布执行过程中的风险,提升服务可用性水平。
- 方式:由变更经理发起,在每个变更发布活动发生时做跟踪管理,并定期编制变更和发布分析报告。
- 活动:变更、发布活动触发时,由变更经理负责监控每个变更、发布的执行过程的合规性及变更执行的有效性,并跟踪管理直至相关活动结束。周期性地对服务的变更发布活动做数据汇总和统计分析,作为总结报告的组成部分;出具变更、发布分析报告。
(4)配置统计分析
- 目标:有效进行配置状态的统计,保证配置数据的准确、完整、有效、可用、可追溯。
- 方式:由配置管理负责人发起,有效管理与配置过程一致的活动记录,包括识别、记录、更新和审核等。
- 活动:记录配置管理活动的细节,使得相关人员可以了解各配置项的内容和状态,确保配置项和基线的所有版本可以恢复;按照配置管理计划,定期或按事件驱动进行检查。
7.2.3 服务测量的关键成功因素
为保证服务测量活动的有效实施,为服务改进提供各种数据和信息,必须注意以下关键成功因素。
(1)针对性的服务测量框架:系统规划与管理师需要在规划设计阶段就定义好针对该项目的服务测量框架,分析干系人可能关注的服务绩效指标,从业务和技术的多重视角,定义出管控层和执行层的关键绩效指标。
(2)有效的自动化监控和测量工具:对服务组件的自动化监控和测量,是获得服务测量数据的重要方法。很多基础数据都依赖于部署有效的自动化工具才能获得,如某台服务器的可用性指标、网络的中断时长、CPU利用率等。
(3)渠道的测量方法:监控、评估、调查、座谈、抽样等。
(4)避免成本约束:准备足够的资金来购买和部署相应的监控和测量工具。
(5)降低人员阻力:增强用户及服务人员对服务测量活动的理解和配合,如可适当采用激励方式,鼓励用户积极参与满意度调查,适当采用绩效考核,要求服务工程师及时上传知识文档等。
(6)获取管理层的支持。
(7)通过接受培训等方式,获取成熟的服务管理过程。
(8)利用机制管理技术部门与业务部门之间的有效沟通和协调。