1、服务器宕机的处理,是系统维护工作中经常碰到的情况之一,需要建立应急预案。
2、首先,接手相关系统维护的时候,要清楚系统部署的架构和每一台服务器的作用。
3、对于每一台服务器宕机后对于业务产生的影响,应该要有详细的说明文档。
4、对于服务器本身停止和启动的操作,要建立明确的指引,让新手也能应对。
5、一旦服务器出现宕机,最重要的是先抢通业务,而不是抢修故障的服务器。
6、业务的抢通,可以通过负载均衡,服务切换,或者应急流程的启用,不应该依赖于服务器。
7、业务抢通后,定位服务器的故障原因,确定硬件故障还是软件故障后按相应流程进行处理修复。