本预案在发生通知停电与突发停电后启动,用于尽可能避免硬件损坏和数据丢失。
一、 应急原则
1、关机前做好相关备份,保证供电后恢复运行。
2、UPS电力耗尽前所有设备主动关机,尽量避免硬件受损。
3、根据停电时间执行预案等级以确保关键服务EDI, Exchange。
4、群集和按开关机操作步骤操作。
二、 设备分组
1、Device Group1: R3和R4机柜所有网络设备和防火墙
2、Device Group2: R1机柜所有服务器,S38及KVM等
3、Device Group3: R2机柜所有服务器
4、Device Group4: R10机柜网络设备,Avaya机柜设备
5、Device Group5: S61-S66, S13, S53,S06,S41,S34,N99,S40
6、Device Group6: R7机柜所有设备,S39,S21,S46
7、Device Group7: R8机柜所有设备
8、Device Group8: 26F交换机
三、 快速数据备份
1、网络设备配置备份,两份拷贝。
2、按重要性和耗时开始备份作业。
四、 应急处理等级—工作时间9:00AM-18:00PM
1、4级,适用情况:停电时间在1小时内,关闭DG6和DG7所列设备,备份网络设备配置。
2、3级,适用情况:停电时间在1-2小时之内,关闭DG4-DG7所列设备,备份网络设备配置.
3、2级,适用情况:停电时间超过2小时,先关闭DG4-DG7所列设备,备份网络设备配置,半小时后开始关闭DG3和DG2设备。
4、1级,适用情况:突发停电,了解停电原因,关闭DG6和DG7设备,再依据实际情况执行相应的应急等级。
五、 应急处理等级—非工作时间
1、4级,适用情况:停电时间在1小时内,关闭DG6和DG7所列设备,备份网络设备配置,通过查看UPS日志选择是否到现场。上班前1小时到达公司开机并测试功能。
2、3级,适用情况:停电时间在1-2小时之内,关闭DG4-DG7所列设备,备份网络设备配置。每15分钟观察一次UPS状态,根据实际情况决定是否关闭DG2和DG3设备,在上班前2-1.5小时抵达现场开机并测试功能。
3、2级,适用情况:停电时间超过2小时,先关闭DG2-DG7所列设备,备份网络设备配置。在上班前2-1.5小时抵达现场开机并测试功能。
4、1级,适用情况:突发停电!1小时内获知停电消息,并且电力没有恢复,立刻依次关闭DG3,DG2,DG4-DG7设备,上班前2-1.5小时抵达现场开机并测试功能。超过UPS支撑时间后得知停电,在电力恢复稳定后赶到现场开机检测硬件及应用程序功能,处理各种可能的结果。
六、 系统开机顺序
1、2个核心交换机启动
2、约5分钟左右开启其他网络设备,无特殊顺序。
3、6个SAS存储设备。
4、开启S01,登录后约5分钟再开启S07,S35,S61,S40。
5、开启S04和S10,完全启动后且距SAS盘柜开机约5分钟后开启S11,S11完全启动后开启S12,检测webmail.cn.dsv.com和Cluster。
6、距SAS盘柜开机约5分钟后开启S02,S02完全启动后开启S15,S17,S18,S22,检测EDI登录。
7、开启其他服务器,检测相应功能。
七、 人员组织
平时做好数据备份工作,停电时严格按应急预案处理各项工作,记录处理中的异常情况以备案。所有人员积极配合以应对可能的突发事件。