信息系统运维的组织和管理
2.1 信息系统运维的管理

- 管理主体
- 信息系统运维 外包商
- 信息系统运维 管理部门
- 信息系统运维 管理者
- 管理工具
- 资产管理
- 流程管理
- 监控管理
- 外包管理
- 综合管理
- 安全管理
- 管理流程
- 事件管理

- 事件管理负责记录、快速处理信息系统运维管理中的突发事件,并对事件进行分类分级,详细记录事件处理的全过程,便千跟踪了解事件的整个处理过程,并对事件处理结果统计分析。
- 事件管理流程通常涉及事件发生和通告、事件监测和录入、事件过滤、事件分类、事件关联、响应选择、事件关闭、事件评估。

- 事故管理:
- 事故管理包括对引起服务中断或可能导致服务中断、质量下降的事件的管理,这包括了用户提交或由监控工具提交的事故。
- 事故管理的流程包括事故识别和记录、事故分类和优先级处理、初步支待、事故升级、调查和诊断、解决和恢复、事故关闭等。

- 问题管理
- 问题管理包括诊断事故根本原因和确定问题解决方案所需要的活动,通过相应控制过程,确保解决方案的实施。
- 问题管理的流程包括问题检测和记录、问题分类和优先级处理、问题调查和诊断、创建已知错误记录、解决问题、关闭问题、重大问题评估等。

- 配置管理
- 配置管理包括负责识别、维护服务、系统或产品中的所有组件,以及各组件之间关系的信 息,并对其发布和变更进行控制,建立关千服务、资产及基础设施的配置模型。
- 配置管理的流程包括管理规划、配置识别、配置控制、状态记录和报告、确认和审核等。

- 变更管理
- 变更管理负责管理服务生命周期过程中对配置项的变更。具体对象包括管理环境中与执行、支持及维护相关的硬件、通信设备、软件、运营系统、处理程序、角色、职责及文档记录等。
- 变更管理的流程包括创建变更请求、记录和过滤变更请求、评审变更、授权变更、变更规划、协调变更实施、回顾和关闭变更等。
- 授权变更
- 标准变更:标准变更通常有预定的执行流程,不需要得到变更咨询委员会CAB和变更管理者的授权,而直接转交“请求实现“处理。
- 次要变更:次要变更无须提交CAB而直接由变更管理者批准实施。
- 实质性变更:针对实质性变更,变更管理者根据变更风险、紧急度和影响度来决定是否事先征求CAB成员的意见或召开CAB会议。
- 重大变更:大变更必须事先得到IT执行委员会的评审,再交由CAB讨论具体实施方案。

- 发布管理
- 发布管理负责规划、设计、构建、配置和测试硬件及软件,从而为运行环境创建分布组件的集合。
- 发布管理的流程包括发布规划、发布设计、构建和配置,发布验收,试营运规划,沟通、准备和培训,发布分发和安装等

- 知识管理
- 知识管理贯穿于整个服务管理生命周期。广义的知识管理涉及知识管理策略,知识的获取、存储、共享和创新等多个环节。本书仅规定与运维知识识别、分类、提交、过滤、审核、发布、维护等相关的流程细节。
- 知识管理的流程包括知识识别和分类、初始化知识库、知识提交和入库、知识过滤和审核、知识发布和分享、知识维护和评估等。

- 事件管理
- 管理职能
- 信息系统设施运维
- 信息系统软件运维
- 信息系统数据运维
- 信息系统安全运维
- 管理目标
- 安全可靠
- 可用可控
- 流程规范
- 低成本
- 管理对象
- 运维部门和人员
- 信息系统供应商
- 信息系统用户
- 信息系统数据
- 信息系统软件
- 信息系统硬件
- 管理制度
- 信息系统运维管理制度主要包括网络管理、系统和应用管理、安全管理、存储备份管理、故障管理、技术支待工具管理、人员管理及质量考核等制度。
2.2 信息系统运维的组织
- 信息系统运维的任务
- 信息系统的日常运行管理
- 数据资源管理
- 软件资源管理
- 硬件资源管理
- 系统安全管理
- 信息服务需求管理
- 信息系统运行日志记录
- 有关工作数量的信息
- 工作的效率
- 系统所提供的信息服务的质量
- 系统的维护修改情况
- 系统的故障情况
- 系统运行情况的检查于评价
- 系统是否达到了预定目标,目标是否需做修改
- 系统的适应性、安全性评价
- 系统的经济效益评价
- 信息系统的日常运行管理
- 信息系统运维管理职责(运维对象)
- 系统主管人员
- 数据收集人员
- 数据校验人员
- 数据录入人员
- 硬件和软件操作人员
- 程序员
- 信息系统运维管理职责(运维流程)
- 事件管理
- 事故管理
- 问题管理
- 配置管理
- 变更管理
- 发布管理
- 知识管理
- 运维人员管理的内容
- 明确各业务人员的任务及职权范围,尽可能确切地规定各类人员在各项业务活动中应负的责任、应做的事情、办事的方式及工作的次序。简单地说,要有
明确的授权。 - 对于每个岗位的工作要有定期的检查及评价,为此,对每种工作都要有一定的评价指标。即必须有
检查和评价。 - 要在工作中对工作人员
进行培训,以便使他们的工作能力不断提高,工作质最不断改善,从而提高整个系统的效率。
- 明确各业务人员的任务及职权范围,尽可能确切地规定各类人员在各项业务活动中应负的责任、应做的事情、办事的方式及工作的次序。简单地说,要有
- 运维人员管理的意识
- 服务意识
- 学习意识
- 创新意识
- 专业意识
- 主动意识
- 安全意识
- 团队意识
- 运行日记的内容
- 时间
- 操作人
- 运行情况
- 异常情况:发生事件、现象、处理人、处理记录文件名、在场人员等
- 值班人签字
- 负责人签字
- 信息系统的运行模式
- 自主运维模式
- 完全外包运维模式
- 混合运维模式:
增加了运维的复杂度,延长了运维流程
- 系统运行故障的种类
- 硬件故障
- 软件故障
- 网络故障
- 人为故障
- 由于不可抗力和自然灾害造成的故障
- 故障预防策略
- 故障约束
- 故障检测
- 故障恢复
- 服务器硬盘故障的解决方案
- 磁盘冗余阵列RAID
- 存储子系统
- 虚拟存储技术