Bug 285 - штормом в сети при перезагрузке ноды
штормом в сети при перезагрузке ноды
Status: IN_PROGRESS
Product: ECP VeiL
Classification: Unclassified
Component: Сети
5.1.8
: Normal Средняя
Assigned To: Андрей Цаган-Манджиев
Depends on:
Blocks:
  Show dependency tree
 
Reported: 2022-11-03 12:50 MSK by mhalkevich
Modified: 2022-12-02 09:43 MSK (History)
2 users (show)

Тип тикета: Ошибка
Решено в версии продукта::
Версия Veil-Connect: ---


Attachments
лог (13.60 KB, application/vnd.openxmlformats-officedocument.wordprocessingml.document)
2022-11-03 12:50 MSK, mhalkevich
Details
bond (27.85 KB, image/jpeg)
2022-11-03 12:50 MSK, mhalkevich
Details
логи (546.79 KB, application/x-7z-compressed)
2022-11-08 09:46 MSK, mhalkevich
Details
скрины (471.54 KB, application/x-7z-compressed)
2022-11-14 09:19 MSK, mhalkevich
Details

Note You need to log in before you can comment on or make changes to this bug.
Description mhalkevich 2022-11-03 12:50:28 MSK
Created attachment 275 [details]
лог

У заказчика несколько раз были проблемы в сети при перезагрузке хоста.
На хосте собран бонд. 
Проблема была замечена еще на версии 5.1.6. Сейчас версия 5.1.8.
Comment 1 mhalkevich 2022-11-03 12:50:51 MSK
Created attachment 276 [details]
bond
Comment 2 mhalkevich 2022-11-08 09:46:26 MSK
Created attachment 285 [details]
логи
Comment 3 Андрей Цаган-Манджиев 2022-11-08 09:58:14 MSK
Настройка бонда:
https://veil.mashtab.org/docs/latest/cli/bonds_cli/
Там как раз указан пример для LACP.
Comment 4 Андрей Цаган-Манджиев 2022-11-08 10:00:01 MSK
Настройка бонда:
https://veil.mashtab.org/docs/latest/cli/bonds_cli/
Comment 5 Андрей Цаган-Манджиев 2022-11-08 15:07:47 MSK
Запросите, пожалуйста, у заказчика с каждого узла:
ovs-vsctl show
ip a
И имеется ли виртуальная сеть со связностью с запущенными сетевыми службами.
Comment 6 mhalkevich 2022-11-14 09:18:48 MSK
Добрый день. Получил много скриншотов и ответы от заказчика. Скриншоты в архиве. 
"собрать LACP при такой схеме не получится, т.к. серверные линки идут в РАЗНЫЕ коммутаторы. Коммутаторы Cisco CBS3012 так же не поддерживают протоколы vLAG и vPC.
Получается что если текущий режим  balance-slb - режим простой балансировки на основе MAC и VLAN не поддерживается, то остается только такой аctive-backuр - режим резервирования. Резервный канал не используется
Comment 7 mhalkevich 2022-11-14 09:19:18 MSK
Created attachment 294 [details]
скрины
Comment 8 Андрей Цаган-Манджиев 2022-11-15 09:54:01 MSK
Добрый день.
Уже пробовали настроить active-backup и перезагрузиться с ним?
У себя пробовал воспроизвести ситуацию со штормом. Получилось однократно, но надо было постараться, чтобы это случилось. При последущих перезагрузках узла всё было в порядке.
Заказчик может показать конфигурацию портов на коммутаторах, куда подключены линки серверов?
Comment 9 mhalkevich 2022-11-15 10:04:59 MSK
Добрый день.
Сегодня они обещали доделать конфигурацию active-backup и сообщат о результате.
Comment 10 mhalkevich 2022-11-16 09:13:47 MSK
Ответ от заказчика.
"bond -ы переделал в active-standby ,"
перегрузили сервер 172.31.209.121 (на котором LUN не мапился) он подключен к GigabitEthernet0/11. Лог с одного из коммутаторов ниже ...
Начало на коммутаторе блэйдцентра 
 
ba-b112-bc2-sw-b# 
Nov 16 11:07:46 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to down 
ba-b112-bc2-sw-b# 
Nov 16 11:07:50 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to up 
ba-b112-bc2-sw-b# 
Nov 16 11:13:24 BRN: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/11, changed state to down 
ba-b112-bc2-sw-b# 
Nov 16 11:13:27 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.c163 in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0014.c260.b25f in vlan 5 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 8851.fb65.cebb in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 001f.c6c6.cfcf in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.faa6 in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0019.aacb.a3c2 in vlan 313 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 38d5.477d.d699 in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 50e5.4941.7457 in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.56bf.2be7 in vlan 208 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.56b5.f517 in vlan 208 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0007.b400.ca04 in vlan 202 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0007.b401.ff01 in vlan 511 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 8851.fb6d.ded0 in vlan 1 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 5 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:28 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.568a.536e in vlan 1 is flapping between port Gi0/10 and port Po1 
 
Конец на нем-же 
 
Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 126 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 1 is flapping between port Gi0/10 and port Po1 
ba-b112-bc2-sw-b# 
Nov 16 11:13:41 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 78da.6eb7.4982 in vlan 125 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7cad.7421.f801 in vlan 12 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 124 is flapping between port Po1 and port Gi0/10 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 123 is flapping between port Po1 and port Gi0/10 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 163 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 78da.6eb7.4982 in vlan 123 is flapping between port Gi0/10 and port Po1 
ba-b112-bc2-sw-b# 
Nov 16 11:13:42 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d82 in vlan 164 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:43 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 0050.5690.6b7f in vlan 208 is flapping between port Gi0/10 and port Po1 
Nov 16 11:13:43 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 7426.acdb.6d80 in vlan 1 is flapping between port Gi0/10 and port Po1 
ba-b112-bc2-sw-b# 
Nov 16 11:13:44 BRN: %SW_MATM-4-MACFLAP_NOTIF: Host 580a.208b.1f80 in vlan 12 is flapping between port Gi0/10 and port Po1
Comment 11 Андрей Цаган-Манджиев 2022-11-16 12:13:23 MSK
Получается, что пока порты подключения перезагружаемого узла в статусе down, появляется mac flapping.
В Gi0/10 какой узел подключен?
Тогда получается, что перезагрузка узла приводит к петле на соседнем узле. Этого не может быть, т.к. агрегация этого не позволит.
Возможно это не петля, а просто уведомление. В этом случае можно увеличить время ребаланса агрегации или отключить ребаланс, чтобы не начиналось перераспределение MAC+VLAN по портам.
Команда в CLI:
net conf bonds modify
Справку по команде можно посмотреть там же.
Запрашивали у заказчика конфигурацию портов?
Comment 12 mhalkevich 2022-11-18 08:40:44 MSK
Коллеги, добрый день.
К сожалению, получил от нашего менеджера команду приостановить общение с этим заказчиком по причине "закупка будет проходить через его головную организацию, а она зарегана за другим партнером".
Comment 13 Станислав 2022-12-02 09:43:58 MSK
Тикет приостановлен, так как партнер сообщил что "закупка будет проходить через головную организацию Заказчика, а она зарегана за другим партнером"