柯辉,某局点S6813堆叠 设备重启丢包问题
1676540091,
组网及说明
两台S6813 堆叠,同时上行建立路由邻居
告警信息
暂无
问题描述
现场进行可靠性测试,主备倒换,备升主很慢导致bgp超时震荡了,导致三层丢包比较多:
1、 堆叠主备切换丢包时间长,从logbuf 中分析完成主备倒换,备升主的时间为 23 S 左右,后出现 bgp 震荡:
2、查看bgp的配置为存活时间间隔为3秒,保持时间为9秒,因此在进行主备倒换,NSR平滑时,超过9秒,引起bgp超时:
bgp 4212102004
non-stop-routing
router-id 10.24.1.134
compare-different-as-med
bestroute compare-med
group IPV4_IC external
peer IPV4_IC route-update-interval 0
peer IPV4_IC timer keepalive 3 hold 9
group IPV6_IC external
peer IPV6_IC route-update-interval 0
peer IPV6_IC timer keepalive 3 hold 9
过程分析
关于主备切换,备升主时间长问题:经过家里复现测试分析, 当进行主备倒换时,有其他口(比如 mad 口)与堆叠口几乎同时 down ,因消息处理任务需顺序执行,堆叠口 down 消息可能靠后处理,引起备升主慢。实验室经过优化,当前优化后的时间为 6S 左右
解决方法
在 R6615P05H02 补丁合入解决