VeiL Bugzilla – Bug 285
штормом в сети при перезагрузке ноды
Last modified: 2022-12-02 09:43:58 MSK
Created attachment 275 [details] лог У заказчика несколько раз были проблемы в сети при перезагрузке хоста. На хосте собран бонд. Проблема была замечена еще на версии 5.1.6. Сейчас версия 5.1.8.
Created attachment 276 [details] bond
Created attachment 285 [details] логи
Настройка бонда: https://veil.mashtab.org/docs/latest/cli/bonds_cli/ Там как раз указан пример для LACP.
Настройка бонда: https://veil.mashtab.org/docs/latest/cli/bonds_cli/
Запросите, пожалуйста, у заказчика с каждого узла: ovs-vsctl show ip a И имеется ли виртуальная сеть со связностью с запущенными сетевыми службами.
Добрый день. Получил много скриншотов и ответы от заказчика. Скриншоты в архиве. "собрать LACP при такой схеме не получится, т.к. серверные линки идут в РАЗНЫЕ коммутаторы. Коммутаторы Cisco CBS3012 так же не поддерживают протоколы vLAG и vPC. Получается что если текущий режим balance-slb - режим простой балансировки на основе MAC и VLAN не поддерживается, то остается только такой аctive-backuр - режим резервирования. Резервный канал не используется
Created attachment 294 [details] скрины
Добрый день. Уже пробовали настроить active-backup и перезагрузиться с ним? У себя пробовал воспроизвести ситуацию со штормом. Получилось однократно, но надо было постараться, чтобы это случилось. При последущих перезагрузках узла всё было в порядке. Заказчик может показать конфигурацию портов на коммутаторах, куда подключены линки серверов?
Добрый день. Сегодня они обещали доделать конфигурацию active-backup и сообщат о результате.
Ответ от заказчика. "bond -ы переделал в active-standby ," перегрузили сервер 172.31.209.121 (на котором LUN не мапился) он подключен к GigabitEthernet0/11. Лог с одного из коммутаторов ниже ... Начало на коммутаторе блэйдцентра ba-b112-bc2-sw-b# Nov 16 11:07:46 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to down ba-b112-bc2-sw-b# Nov 16 11:07:50 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to up ba-b112-bc2-sw-b# Nov 16 11:13:24 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to down ba-b112-bc2-sw-b# Nov 16 11:13:27 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.c163 in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0014.c260.b25f in vlan 5 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 8851.fb65.cebb in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 001f.c6c6.cfcf in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.faa6 in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0019.aacb.a3c2 in vlan 313 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 38d5.477d.d699 in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 50e5.4941.7457 in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.56bf.2be7 in vlan 208 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.56b5.f517 in vlan 208 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0007.b400.ca04 in vlan 202 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0007.b401.ff01 in vlan 511 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 8851.fb6d.ded0 in vlan 1 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 5 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.536e in vlan 1 is flapping between port Gi0/10 and port Po1 Конец на нем-же Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 126 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 1 is flapping between port Gi0/10 and port Po1 ba-b112-bc2-sw-b# Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 78da.6eb7.4982 in vlan 125 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7cad.7421.f801 in vlan 12 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 124 is flapping between port Po1 and port Gi0/10 Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 123 is flapping between port Po1 and port Gi0/10 Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 163 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 78da.6eb7.4982 in vlan 123 is flapping between port Gi0/10 and port Po1 ba-b112-bc2-sw-b# Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 164 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:43 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.5690.6b7f in vlan 208 is flapping between port Gi0/10 and port Po1 Nov 16 11:13:43 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d80 in vlan 1 is flapping between port Gi0/10 and port Po1 ba-b112-bc2-sw-b# Nov 16 11:13:44 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 12 is flapping between port Gi0/10 and port Po1
Получается, что пока порты подключения перезагружаемого узла в статусе down, появляется mac flapping. В Gi0/10 какой узел подключен? Тогда получается, что перезагрузка узла приводит к петле на соседнем узле. Этого не может быть, т.к. агрегация этого не позволит. Возможно это не петля, а просто уведомление. В этом случае можно увеличить время ребаланса агрегации или отключить ребаланс, чтобы не начиналось перераспределение MAC+VLAN по портам. Команда в CLI: net conf bonds modify Справку по команде можно посмотреть там же. Запрашивали у заказчика конфигурацию портов?
Коллеги, добрый день. К сожалению, получил от нашего менеджера команду приостановить общение с этим заказчиком по причине "закупка будет проходить через его головную организацию, а она зарегана за другим партнером".
Тикет приостановлен, так как партнер сообщил что "закупка будет проходить через головную организацию Заказчика, а она зарегана за другим партнером"