异地容灾要求生产、容灾环境具备相同数量的服务器,按相同的方式进行服务的部 4.2iMaster NCE-Fabric安全、可靠性管理 4.2.1可靠性管理 4.2.1.1节点故障后业务恢复 当集群节点发生故障时,从节点的状态体现就是非在线状态:不可达或离线。不管是 处于哪种非在线状态,都预示着当前集群节点可能服务不可用,就需要对异常节点的 任务进行迁移恢复处理,尽最大可能发挥集群的可靠性。 当集群节点转化为不可达状态时,对已经建立了主备两条南向协议连接的网络设备, 并且当前处于不可达状态的故障节点与设备的南向连接为主连接,需要做主节点迁 移,将原来的备节点升为主节点,协议栈连接声明为主连接,这样便能够在秒级的时 间内恢复业务。 当集群节点转化为离线状态时,需要将该离线节点承担的所有任务分配到其他iMaster NCE-Fabric控制器节点,包括南向协议主、从连接等。