(参考)NWスイッチ障害時の復旧手順(Linux)

障害時に冗長化しているNICの接続が正常に切り替わらない場合に、手動で切り替える手順を以下に示します。前提として、以下のNICチーミング設定手順等に従って、NICが冗長化されている必要があります。

今回の例は、ベアメタルサーバーのデータ用NICとして、eth0/eth1で冗長化されていて、eth0側のネットワークスイッチが障害でダウンし、通信が不可となった時にeth1に手動で切り替える場合の例です。
お客さまの環境に応じて、適宜読み替えてご利用ください。

(参考:LinuxのNICチーミング/NICボンディング設定手順)

RHEL/CentOS:

RHEL10 ネットワークボンディングの設定

RHEL9 ネットワークチーミングの設定

RHEL8 ネットワークチーミングの設定

RHEL7 ネットワークチーミングの設定

※RHEL10では、ネットワークチーミングが廃止されたため、ネットワークボンディングによる設定が必要です。


(障害復旧手順:RHEL7/8/9,Cent OSの場合)


1.対向NWスイッチ障害時


1)NIC リンクステータスを確認します。
※冗長化されたデバイス名をteam0、物理NICポート#1、#4のデバイス名をそれぞれeth0、eth1とします。
(コマンド例)teamdctl team0 state
(出力例)
setup:
  runner: activebackup
ports:
  eth0
   link watches:
...
  eth1
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
...
runner:
 active port: eth0

2)物理インターフェイスの管理リンクステータスを変更します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)ip link set eth0 down

3)NIC リンクステータスを確認します。
(コマンド例)teamdctl team0 state
(出力例)
setup:
 runner: activebackup
ports:
 eth0
   link watches:
     link summary: down
...
 eth1
   link watches:
     link summary: up
     instance[link_watch_0]:
       name: ethtool
       link: up
...
runner:
 active port: eth1

4)eth1でネットワーク接続ができていることを確認します。

2.対向NWスイッチ復旧後


1)物理インターフェイスの管理リンクステータスを戻します。
アップリンク eth0 のリンク状態をUpに変更します。
(コマンド例)ip link set eth0 up

2)NIC リンクステータスを確認します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)teamdctl team0 state
(出力例)
setup:
 runner: activebackup
ports:
 eth0
   link watches:
     link summary: up
...
 eth1
   link watches:
     link summary: up
...
runner:
 active port: eth1

3)eth0/eth1でネットワーク接続ができていることを確認します。

(障害復旧手順:RHEL10の場合)


1.対向NWスイッチ障害時


1)NIC リンクステータスを確認します。
※冗長化されたデバイス名をbond0、物理NICポート#1、#4のデバイス名をそれぞれeth0、eth1とします。
(コマンド例)cat /proc/net/bonding/bond0
(出力例)
Bonding Mode: fault-tolerance (active-backup)
Primary Slave: None
Currently Active Slave: eth0
...
Slave Interface: eth0
MII Status: up
...
Slave Interface: eth1
MII Status: up

2)物理インターフェイスの管理リンクステータスを変更します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)ip link set eth0 down

3)NIC リンクステータスを確認します。
(コマンド例)cat /proc/net/bonding/bond0
(出力例)
Currently Active Slave: eth1
...
Slave Interface: eth0
MII Status: down
...
Slave Interface: eth1
MII Status: up

4)eth1でネットワーク接続ができていることを確認します。

2.対向NWスイッチ復旧後


1)物理インターフェイスの管理リンクステータスを戻します。
アップリンク eth0 のリンク状態をUpに変更します。
(コマンド例)ip link set eth0 up

2)NIC リンクステータスを確認します。
アップリンク eth0 のリンク状態をDownに変更します。
(コマンド例)cat /proc/net/bonding/bond0
(出力例)
Currently Active Slave: eth1
...
Slave Interface: eth0
MII Status: up
...
Slave Interface: eth1
MII Status: up

3)eth0/eth1でネットワーク接続ができていることを確認します。