笔记-IT服务运营管理-6.5 过程要素管理

6.5 过程要素管理

在IT服务运营中,对流程的执行、监控与调优是至关重要的,因为流程是IT服务运营活动的主要体现,也是对用户体验产生直接感受的关键要素。作为系统规划与管理师,应对规划设计阶段所提及的流程,包括服务级别管理、服务报告管理、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,进行有效的支持并确保执行。

6.5.1服务级别管理

服务级别管理流程须确保供方通过定义、签订和管理服务级别协议,满足需方对服务质量的要求。在IT服务运营的流程中应当充分执行以下事项。

(1)更新服务目录并管理服务级别变更:在服务运营中,随时会产生新的服务需求及请求,或组织的服务能力提升、服务范围扩大等,或客户在原有服务范围的基础上变更服务级别需求,均应对服务目录进行及时的更新,并在与客户协商一致的基础上对服务级别协议进行变更
(2)监控服务级别协议执行情况:需定期监控服务级别的达成情况,做出服务级别监控图表,对不同程度的服务级别协议违反情况提出警告,通知相关人员。
(3)对如下关键指标进行管理服务目录定义的完整性,签订服务级别协议文件的规范性,服务级别考核评估机制的有效性和完整性。

【实例】服务级别跟踪表实例如表6.5所示。

6.5.2 服务报告管理

服务报告管理流程须确保供方应通过及时、准确、可靠的报告与需方建立有效的信息沟通,为双方管理层提供决策支持。在IT服务运营的流程中应充分执行以下事项。

(1)建立、审批、分发服务报告。根据不同的对象,定期或阶段性地进行服务报告的建立与分发,分发前需要进行审批。
(2)对服务报告进行归档。将分发过的服务报告进行归档,按照不同时段、不同对象分门别类,以备查找,如进行服务改进、发生纠纷时均需要查找有关证据。
(3)更新服务报告模板。在服务报告提供时,因为服务需求或范围发生变化,或者有更优秀的展现形式时,都应该及时更新服务报告模板。更新服务报告模板需要提前与发布对象沟通。
(4)对如下关键指标进行管理:服务报告过程的完整性、服务报告的及时性、准确性。

▲ 【实例】服务报告:

服务报告

1、报告基本信息

报告目的:为了有效决策与沟通……
报告范围:SLA中界定的运维服务项目
报告对象:查看服务报告的相关干系人,如客户代表、系统规划与管理师等
报告人:编写报告的人员信息
服务间隔时间:××××年××月××日—××××年××月××日
报告时间:××××年××月××日

2、服务指标达成率

{提示:此处描述的SLA中定义服务指标达成率,是为了向客户展现服务期间内的服务质量,适用于对外提供给客户与内部服务团队分析。}

统计
{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计实际服务指标数据与约定服务指标间的差距,为后续服务改进提供基础。}

指标名称 服务标准 实际值 指标状态 备注
事件平均响应时间 10分钟 5分钟 正常
事件平均处理时间 20分钟 15分钟 正常
现场服务满意度 8.5分钟 8分钟 非正常
系统/网络可用性 99% 90% 非正常
…… …… …… …… ……

分析
{提示:此处主要针对指标状态为“非正常”的指标(违反SLA的指标)进行分析,寻找问题根源,分析问题原因。如现场服务满意度低:经分析后发现是因为上门服务的人员态度较差,造成客户不满意。}

改进建议
{提示:此处主要针对已经确认的问题原因提供改进建议,如提供服务意识培训。}

3、事件分析

{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计间隔时间段内所有事件的数量,同时可提供时间段内的不同时间的事件数量趋势,以便做后续分析。如事件总数、事件成功关闭数量、不同月份的事件趋势等。}

4、重大事件

{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计重大事件占据时间段中所有事件数量的比例。如重大事件数量等。}
可在此处附上间隔时间段内所产生的重大报告文档。

5、现场服务满意度

{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计间隔时间段内所有现场服务的满意度情况,可为SLA指标“现场服务满意度”提供数据支持。如现场服务满意度case总数、服务满意数量、不同月份的服务满意度趋势等。}

6、趋势分析

服务达标趋势分析
{提示:此处描述按SLA约定的时间间隔(1次/季或1次/年或1次/合同期)内,每个时期内(如每月)服务达标情况的比较与分析。如与前几个服务报告达标情况的比较。]

服务回顾分析
{提示:自本标题后的所有章节(除“报告结论”外),都是面向内部服务团队具体的分析指标,各中心可根据策略定义的报告频率,借鉴如下报告编写指南,选择相应的报告模板,编制各自的内部服务报告。}

7、人员加班及培训情况

详细列出当月的加班情况,分析现有人员能力是否能够满足需求,是否有计划地安排相应的培训等。

分析:侧重于能力分析。

改进建议:描述能力改进。

8、报告结论

描述报告的总体结论。

6.5.3 事件管理

事件管理流程须确保供方具有检测事件、尽快解决事件的能力。在IT服务运营中,流程应充分执行以下事项。

(1)对事件进行受理与处理:包括接收事件,对事件进行分类和初步支持、调查和诊断并解决。
(2)对事件进展进行监控与跟踪:需要对事件的处理过程进行跟踪,确保每个环节都在约定时间内完成。一般建议由服务台进行监控与跟踪,并确保事件的最终关闭。
(3)对事件进行升级:当出现技术不足、超时、事件范围超出、沟通不利、需要外部资源沟通等情况时,需要对事件根据预定的规则进行升级。
(4)进行事件满意度调查:应对每个事件的处理情况进行满意度调查,可以通过工具或人工的方式收集满意度得分。对于重大不满意事件,应当及时报备、升级并处理。
(5)完成事件报告:事件报告包括事件解决率、事件平均解决时间等指标,也需要对重大事件进行回顾。事件报告一般定期制订。
(6)对如下关键指标进行管理:事件管理过程的完整性、有效性,事件解决评估机制的有效性。

6.5.4 问题管理

问题管理流程须确保供方通过识别引起事件的原因并解决问题,预防同类事件重复发生。在IT服务运营中应充分执行以下事项。

(1)对问题管理进行受理:包括问题建立、分类、调查和诊断、解决、错误评估、关闭等。
(2)采用并更新知识库:可以在问题解决时调用知识库条目,同时在问题解决后,及时更新知识库,确保知识库能支持解决对问题引发的事件。
(3)完成问题报告:问题报告包括问题解决率、问题平均解决时间等指标,也需要对重大问题进行回顾。问题报告一般定期制订。
(4)对如下关键指标进行管理:问题管理过程的完整性,问题解决评估机制的有效性。

表6.6显示了变更请求日志和配置项状态报告。

6.5.5 配置管理

配置管理流程须确保供方维护运行维护服务对象的必要记录,并保证配置数据的可靠性和时效性,关联支持其他服务过程。在IT服务运营中应充分执行以下事项。

(1)对配置项进行识别、记录、更新:对于新增加的配置项,需要进行识别,对其类别与属性做出判断与记录。变更后的配置项,需更新到配置管理数据库,确保其变更的记录能被追溯。
(2)对配置数据库进行管理与维护
(3)对配置项进行审计
(4)对如下关键指标进行管理:配置管理过程的完整性,配置数据的准确、完整、有效、可用、可追溯,配置项审计机制的有效性

6.5.6 变更管理

变更管理流程须确保供方通过管理、控制变更的过程,确保变更有序实施。在IT服务运营中应充分执行以下事项。

(1)受理变更请求:对变更进行受理,对于变更进行分类,确保变更单填写规范。
(2)对变更进行评估、审核:对变更进行评估并最终审核,要充分考虑变更所带来的风险,对于变更或不变更带来的后果需要进行分析,必要时应该召开变更顾问委员会(CAB)进行讨论。
(3)对变更进行实施、确认和回顾等:需要协调发布管理或项目管理对变更的实施过程进行管理,在必要时需提出或批准回退计划,对变更后的成果要进行实施后评审。
(4)生成变更报告:对变更完成情况进行统计分析,包括未经批准变更数量及占比、不同类型的变更数量及占比、不成功的变更数量及占比、取消的变更数量及占比、变更关联的配置数等。变更报告应定期发布。
(5)对如下关键指标进行管理:变更管理过程的完整性、变更记录的完整性。

6.5.7 发布管理

发布管理流程确保一个或多个变更的成功导入。在IT服务运营中应充分执行以下事项。

(1)执行发布计划,对发布进行测试:对发布计划的内容进行实施,确保按照里程碑完成发布阶段的各个发布包内容,对发布包要进行充分的测试,确保发布成功。
(2)发布失败时执行回退方案:在发布失败时,需要协调变更管理进行回退方案的执行。
(3)对发布进行记录,更新配置数据库:如果发布影响了配置项,需要及时主动保证配置管理数据库的更新。
(4)生成发布报告:对发布完成情况进行统计分析,包括发布成功率、发布及时率、是否更新配置管理数据库等。发布报告应定期发布。
(5)对如下关键指标进行管理:发布管理过程的完整性,发布过程记录的完整性、准确性。

6.5.8 安全管理

安全管理流程确保供方提供符合信息安全要求的服务。在IT服务运营中应充分执行以下事项。

(1)执行安全策略:应当按照安全策略制订的要求,进行日常工作,如移动介质的安全检查、进出入机房的安全检查、风险评估等多项工作。
(2)对违反安全策略的事件进行监控与追踪:应当对违反安全策略的事件进行监控,如非法用户的登入、非法软件的安装等。对于违反安全策略的事件要进行追责,并给予足够的重视。
(3)安全管理的关键指标包括:运行维护服务过程中信息的保密性,运行维护服务过程中信息的可用性,运行维护服务过程中信息的完整性。

【实例】典型移动介质安全策略。

典型移动介质安全策略

(1)不得将载有重要信息的存储介质随意存放,未经安全责任人授权,不得带出公司。
(2)公司不得擅自使用私人自带设备。外来人员不经批准不得带入移动设备和介质。
(3)若介质上的内容不再需要,应立即清除。对于存放有重要信息的存储介质,在销毁时,保证措施到位,避免不必要的泄露。
(4)公司内的移动设备读取和光盘刻录限制在指定计算机上,并需要进行登记。
(5)公用移动设备和介质,借用需要审批流程,使用完毕后及时归还,归还前要进行信息删除处理。

6.5.9 连续性和可用性管理

连续性和可用性管理应确保向客户承诺的协议的可用性、连续性在任何环境下都能满足。在IT服务运营中应充分执行以下事项。

(1)可用性和连续性计划必须至少每年开发、检查,确保协定的需求在从遭受一般损失到巨大损失的任何情况下,都得到满足。计划必须被维护来反映协议下的业务要求变更。
(2)当业务环境发生重大变更时,可用性和连续性计划必须被重新测试
(3)变更管理流程必须评估变更对可用性和连续性计划的影响
(4)可用性必须被测量和记录。计划之外发生的不可用情况,必须被调查并采取合适的行动;只要有可能,必须预告潜在的事件,并且采取预防行动。
(5)连续性计划、联系列表和配置管理数据库在正常办公室访问被禁止时必须仍可使用。连续性计划必须包括对正常工作的恢复。
(6)连续性计划必须被测试,以保证与业务的需求一致。
(7)所有的连续性计划的测试必须被记录,对测试失败必须产生行动计划。

6.5.10 容量管理

容量管理须确保服务提供者在任何时间都有足够的能力来满足当前和未来的客户业务需求。在IT服务运营中应充分执行以下事项。

(1)必须产生、维护一个能力计划。
(2)容量管理必须满足业务需求,包括:▲

  • 当前的和未来的容量和性能需求。
  • 服务升级时间、阈值和成本。
  • 对计划的服务升级、变更请求、新技术和新技能对能力所产生的作用的评估。
  • 外部变更对容量可能产生的影响,比如法律的。
  • 提出用来进行预测分析的数据、流程和方法。

(3)监控服务能力、调整服务绩效、提供足够能力的方法、步骤和技术必须被明确。

--------------本文结束 感谢您的阅读--------------