(参考)NWスイッチ障害時の復旧手順(Linux)

障害時に冗長化しているNICの接続が正常に切り替わらない場合に、手動で切り替える手順を以下に示します。前提として、以下のNICチーミング設定手順等に従って、NICが冗長化されている必要があります。

今回の例は、ベアメタルサーバーのデータ用NICとして、eth0/eth1で冗長化されていて、eth0側のネットワークスイッチが障害でダウンし、通信が不可となった時にeth1に手動で切り替える場合の例です。
お客さまの環境に応じて、適宜読み替えてご利用ください。

(障害復旧手順:RHEL/Cent OS)


1.対向NWスイッチ障害時


1)NIC リンクステータスを確認します。
※冗長化されたデバイス名をteam0、物理NICポート#1、#4のデバイス名をそれぞれeth0、eth1とします。
(コマンド例)teamdctl team0 state
(出力例)
setup:
  runner: activebackup
ports:
  eth0
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
       down count: 0
  eth1
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
       down count: 0
runner:
 active port: eth0

2)物理インターフェイスの管理リンクステータスを変更します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)ip link set eth0 down

3)NIC リンクステータスを確認します。
(コマンド例)teamdctl team0 state
(出力例)
setup:
 runner: activebackup
ports:
 eth0
   link watches:
     link summary: down
     instance[link_watch_0]:
       name: ethtool
       link: down
       down count: 0
 eth1
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
       down count: 0
runner:
 active port: eth1

4)eth1でネットワーク接続ができていることを確認します。

2.対向NWスイッチ復旧後


1)物理インターフェイスの管理リンクステータスを戻します。
アップリンク eth0 のリンク状態をUpに変更します。
(コマンド例)ip link set eth0 up

2)NIC リンクステータスを確認します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)teamdctl team0 state
(出力例)
setup:
 runner: activebackup
ports:
 eth0
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: down
       down count: 0
 eth1
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
       down count: 0
runner:
 active port: eth1

3)eth0/eth1でネットワーク接続ができていることを確認します。