刘倩,某局点S9820-8C四个接口同时down
组网及说明
不涉及组网
设备及版本:S9820-8C F6619
告警信息
不涉及
问题描述
如题所述,设备同一子卡上四个接口同一时间down
过程分析
1/1/4、1/1/5、1/1/7、1/1/9驱动记录同一时间出现fault:
===============debug port link-diag slot 1 1 4 0===============
==============================================================================
[99]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=07/02/2022 12:19:03:808
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
==============================================================================
===============debug port link-diag slot 1 1 5 0===============
==============================================================================
[99]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=07/02/2022 12:19:03:632
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
[98]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=01/02/2015 19:58:16:794
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
==============================================================================
===============debug port link-diag slot 1 1 7 0===============
==============================================================================
[99]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=07/02/2022 12:19:03:495
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
[98]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=03/14/2022 18:55:53:129
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
==============================================================================
===============debug port link-diag slot 1 1 9 0===============
==============================================================================
[99]: Line=1454 val[0]=8221 val[1]=0 val[2]=0 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=07/02/2022 12:19:03:493
linkinfo=0x201d:down.readphy.pma.pcs.xgs.
[98]: Line=1454 val[0]=189 val[1]=0 val[2]=2 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=05/02/2022 06:04:12:266
linkinfo=0xbd:down.pma.pcs.xgs.fault.rmtfault.
[97]: Line=1454 val[0]=125 val[1]=0 val[2]=1 SdL[0]=0x0 SdL[1]=0x0 SdL[2]=0x0 Time=03/14/2022 18:55:53:178
linkinfo=0x7d:down.pma.pcs.xgs.fault.localfault.
==============================================================================
这4个端口在同一个PHY芯片上:
===============debug port mapping slot 1===============
[Interface] [Unit] [Port] [Name] [Combo?] [Active?] [IfIndex] [MID] [Link][PipeNum]
===============================================================================
HGE1/1/4 0 5 ce4 no no 0x6 0 down 0
HGE1/1/5 0 6 ce5 no no 0x7 0 down 0
HGE1/1/7 0 8 ce7 no no 0x9 0 up(shut) 0
HGE1/1/9 0 7 ce6 no no 0xb 0 up(shut) 0
===============bcm slot 1 chip 0 phy/info===============
Phy mapping dump:
port id0 id1 addr iaddr name timeout
ce0( 1) 600d 8770 81 81 TSCBH-16/00/0-1 250000
ce1( 2) 600d 8770 81 81 TSCBH-16/00/2-3 250000
ce2( 3) 600d 8770 81 81 TSCBH-16/00/4-5 250000
ce3( 4) 600d 8770 81 81 TSCBH-16/00/6-7 250000
ce4( 5) 600d 8770 89 89 TSCBH-16/01/0-1 250000
ce5( 6) 600d 8770 89 89 TSCBH-16/01/2-3 250000
ce6( 7) 600d 8770 89 89 TSCBH-16/01/4-5 250000
ce7( 8) 600d 8770 89 89 TSCBH-16/01/6-7 250000
local logbuffer也记录了芯片底层失败:
Slot01 2022/07/02 12:19:03:494771 [LINE:0-TASK:bLK0-FUNC:(null)]:<{FILE}>: _plp_millenio_get_phy_id: Line:248
Slot01 2022/07/02 12:19:03:495060 [LINE:3487-TASK:bLK0-FUNC:0:_bcm_esw_linkscan_update_port]:Port ce6: bcm_port_info_get failed: Operation disabled
解决方法
如上说明触发firmware跑飞问题,可以先进行插拔子卡看是否能恢复,如果可以恢复,后续建议升级到R6635版本或者安装F6619H09补丁,版本和补丁里做了子卡相关的优化。如果不能需要更换子卡。
CRM论坛(CRMbbs.com)——一个让用户更懂CRM的垂直性行业内容平台,CRM论坛致力于互联网、客户管理、销售管理、SCRM私域流量内容输出5年。 如果您有好的内容,欢迎向我们投稿,共建CRM多元化生态体系,创建CRM客户管理一体化生态解决方案。本文来源:知了社区基于知识共享署名-相同方式共享3.0中国大陆许可协议,某局点S9820-8C四个接口同时down