问题管理是运维工作中不能回避的环节,系统产生的相关问题,都需要重视和解决。
方法/步骤
1、问题是引发一个或多个故障的位置原因,问题管理是负责对问题解决过程进行控制的流程。
2、应查找引起突发事件的根本原因,并通过变更管理彻底解决问题,防止同类突发事件的再次发生。
3、问题管理与故障管理、变更管理流程一起,都是运维中的重要流程,保证IT服务的可用性和服务质量的提升。
4、问题管理中涉及的几个关键概念包括:问题Problem,已知错误KnownError,已知错误数据库KnownErrorDB。
5、被动式的问题管理是问题引起的突发事件已经发生,需要彻底解决问题以防止同类突发事件再发生。
6、主动式的问题管理是通过趋势分析等方法主动找出问题,解决问题作为持续服务改进的活动。
7、问题管理的KPI包括:某个阶段内的问题数,SLA范围内解决问题的百分比,解决问题的平均成本等。