董智敏,某局点S7506E交换机 bfd会话震荡问题
1676540290,
问题描述
现场一台S7506E交换机在运行过程中发生了大量BFD会话down问题,大概35min后陆续恢复
过程分析
1.分析设备诊断信息,发现设备硬件和软件层面未见异常。
2. 设备所有的bfd报文都是要上送主控板cpu去处理的,我们设备的bfd会话规格是64个,看现场配置,大概建了300多的bfd会话,且超时时间是500ms*3,这样的话可能1秒中会有大约700个bfd报文上送主控cpu处理,很容易导致cpu处理不及时从而丢弃bfd报文引起bfd震荡。
interface Vlan-interface2401
description 鞍山站前新兴支行
ip address 10.248.83.233 255.255.255.252
ospf cost 1000
ospf network-type p2p
ospf bfd enable
bfd min-transmit-interval 500
bfd min-receive-interval 500
bfd detect-multiplier 3
另外,查看设备历史日志信息,每天都有 bfd会话震荡,这也反映了现场 bfd会话数目太多了,达到了设备 bfd会话处理的瓶颈。 导致主控cpu无法及时处理大部分的bfd报文。
解决方法
本次故障是因为现场配置 bfd会话数目超过了设备侧建议的规格导致的。建议现场优化 bfd会话数目为 64个左右。如果无法减少,那建议现场调整超时时间 2s*5,尽量调大,减少 bfd报文的发送频率。
CRM论坛(CRMbbs.com)——一个让用户更懂CRM的垂直性行业内容平台,CRM论坛致力于互联网、客户管理、销售管理、SCRM私域流量内容输出5年。 如果您有好的内容,欢迎向我们投稿,共建CRM多元化生态体系,创建CRM客户管理一体化生态解决方案。本文来源:知了社区基于知识共享署名-相同方式共享3.0中国大陆许可协议,某局点S7506E交换机 bfd会话震荡问题