刘贝,某局点 S7503X 下挂终端互访卡顿
组网及说明
7503X作为leaf,开启网关代理,下挂access
告警信息
%Mar 27 22:02:06:768 2023 H3C DRVPLAT/4/SOFTCAR DROP: -Chassis=1-Slot=2;
Cos=15, Drop at Stage=0, StageCnt=183024, TotalCnt=249052, possible protocol ARP/RARP/VSI_ARP/VSI_RARP/ARP_DAI/ARP_DAI_VLAN/IPV6_RA_GUARD/IPV6_RAGUARD_ROLE/VSI_ARP_PROXY/MDNS/SADP/MDNS_GATE_WAY/ARP_DAI_PORT
%Mar 27 22:12:21:331 2023 H3C DRVPLAT/4/SOFTCAR DROP: -Chassis=1-Slot=2;
Cos=15, Drop at Stage=0, StageCnt=358106, TotalCnt=607158, possible protocol ARP/RARP/VSI_ARP/VSI_RARP/ARP_DAI/ARP_DAI_VLAN/IPV6_RA_GUARD/IPV6_RAGUARD_ROLE/VSI_ARP_PROXY/MDNS/SADP/MDNS_GATE_WAY/ARP_DAI_PORT
%Mar 27 22:22:33:884 2023 H3C DRVPLAT/4/SOFTCAR DROP: -Chassis=1-Slot=2;
Cos=15, Drop at Stage=0, StageCnt=355840, TotalCnt=962998, possible protocol ARP/RARP/VSI_ARP/VSI_RARP/ARP_DAI/ARP_DAI_VLAN/IPV6_RA_GUARD/IPV6_RAGUARD_ROLE/VSI_ARP_PROXY/MDNS/SADP/MDNS_GATE_WAY/ARP_DAI_PORT
问题描述
现场反馈业务迁移到这个leaf下后,话机终端互相打电话会有一段时间听不到对面的声音,怀疑是设备丢包导致
过程分析
1. S7503X作为leaf,开启了网关代理,话机是同网段,但是在设备上三层转发,查看设备上对应终端的ARP表项正常
2. 由于电话终端挂在同一个access下,则流量进到leaf和发出去都是走的同一个口,在该接口上入出方向同时镜像抓包发现,交换机转发无延迟,但是发现有一段时间一端话机会发送arp请求对端话机的arp,但是没有及时收到leaf网关的代理应答,导致一段时间没有这个话机没有发出去流量。怀疑是leaf设备回应arp慢导致
3. 查看leaf设备上有arp超限速日志,故通过debugging arp packet查看,在vsi 4094管理网内,频繁收到某些access的管理ip来请求同网段其他access的管理地址,由于vsi4094也开启了代理,所以交换机上需要反复处理这些arp,导致arp超限速。
%Mar 27 22:02:06:768 2023 H3C DRVPLAT/4/SOFTCAR DROP: -Chassis=1-Slot=2;
Cos=15, Drop at Stage=0, StageCnt=183024, TotalCnt=249052, possible protocol ARP/RARP/VSI_ARP/VSI_RARP/ARP_DAI/ARP_DAI_VLAN/IPV6_RA_GUARD/IPV6_RAGUARD_ROLE/VSI_ARP_PROXY/MDNS/SADP/MDNS_GATE_WAY/ARP_DAI_PORT
4.找到对应的access,发现这些access上有大量TC报文,来源于leaf,leaf设备查看全局关闭了stp,说明是透传了TC报文,由于access较多,不好排查来源,现场开启leaf的全局stp,关闭接口stp,避免TC透传导致access上频繁收到TC报文刷新arp。后续access上配置边缘端口,避免出现TC报文
解决方法
优化现网的TC报文后解决
内容来源:知了社区,基于知识共享署名-相同方式共享3.0中国大陆许可协议CRM论坛(CRMbbs.com)——一个让用户更懂CRM的垂直性行业内容平台,CRM论坛致力于互联网、客户管理、销售管理、SCRM私域流量内容输出5年。 如果您有好的内容,欢迎向我们投稿,共建CRM多元化生态体系,创建CRM客户管理一体化生态解决方案。,某局点 S7503X 下挂终端互访卡顿