首页 科技问答 林宇阳,某局点百G光模块转发正常但读数错误

林宇阳,某局点百G光模块转发正常但读数错误

科技问答 280
1685599951,

组网及说明

非特定组网

百G光模块型号QSFP-100G-LR4-WDM1300

告警信息

HundredGigE3/2/1 transceiver diagnostic information:

  Current diagnostic parameters:

[module]  Temp.( Voltage(V) 

          17         0.00       

[channel] Bias(mA)  RX power(dBm)  TX power(dBm) 

    1     0.00      -3.61          -40.00        

    2     0.00      -40.00         -40.00        

    3     0.00      -40.00         -40.00        

    4     0.00      -40.00         -1.86         

  Alarm thresholds:

          Temp.( Voltage(V)  Bias(mA)  RX power(dBm)  TX power(dBm) 

    High  75         3.63        55.00     5.50           7.50          

    Low   -5         2.97        25.00     -9.60          -8.30         

HundredGigE3/2/1 transceiver information:

  Transceiver Type              : 100G_BASE_LR4_QSFP28

  Connector Type                : LC

  Wavelength(nm)                : 1300

  Transfer Distance(km)         : 10(SMF)

  Digital Diagnostic Monitoring : YES

  Vendor Name                   : H3C

  Ordering Name                 : QSFP-100G-LR4-WDM1300

问题描述

设备运行中发现光模块收发光功率和电压是指均异常异常。

过程分析

当前异常功率示数模块所在接口正常UP且业务流量转发正常无报障。基于此现象,推测有两种可能:

1、光模块寄存器数据上报错误,但转发模块功能无异常——光模块问题;

2、路由器读取或处理光模块上报数据有误——路由器问题。

通过probe视图的寄存器读取命令收集故障模块的寄存器信息:

  display hardware internal transceiver register int port-type port-number dev 0 add 0 len 128         显示光模块第0页低128字节的寄存器信息        此命令行需要连续读2遍以上,第一遍为无效结果需要被读清;
display hardware internal transceiver register int port-type port-number dev 0 add 80 len 128         显示光模块第0页高128字节的寄存器信息        
display hardware internal transceiver register int port-type port-number dev 3 add 80 len 128        显示光模块第3页高128字节的寄存器信息     QSFP28光模块的寄存器读取相关命令如上,由于结果需要研发使用特殊工具解析,本处对完整的读取结果不做展示。

[probe]display hardware internal transceiver register int h3/2/1 dev 0 add 0 len 128

HundredGigE3/2/1 transceiver device 0 register information:

  0000:    11    07    00    00    00    00    00    00

  0008:    00    00    00    00    00    00    00    00

  0010:    00    00    00    00    00    00    19    60

  0018:    00    00    83    c4    00    00    00    00

  0020:    00    00    41    14    46    a5    3f    52

  0028:    37    84    4d    3e    4b    b1    49    f7

  0030:    4b    a4    2f    51    3c    85    33    fd

……

3、根据读取的寄存器信息,光模块研发判断光模块的上报数据为正常值,而非异常的异常功率值-40,因此怀疑是路由器软件有问题。

-------------------------Real Time DDM(page00h[22-81])--------------------------

<Free side monitoring values(page00h[22-33]): >

Temperature(C)              : 25.38

VCC(V)                      : 3.37

<Channel monitoring values(page00h[34-81]): >

                              Lane1     Lane2     Lane3     Lane4

Rx power(dBm)               : 2.22      2.57      2.1       1.53

Tx bias(mA)                 : 39.55     38.75     37.87     38.73

Tx power(dBm)               : 0.83      1.9       1.24      1.48

4、协调路由器研发远程定位,发现路由器读取同板卡其它光模块的寄存器计数均正常,内部也无异常报错,怀疑还是光模块有异常。

尝试按偏移位读取指定的寄存器读数,此时发现无论偏移多少位,读数固定从00位对应的“11    07……”开始显示。

  0000:    11    07    00    00    00    00    00    00

因此可定位当前实际问题现象为:光模块内部存储的寄存器数值无误,但偏移位读取功能出现问题,而相关命令回显实际即是通过读取寄存器数值对应到结果显示,当前所有偏移读数的寄存器数值都存在问题,路由器无法正常识别该模块显示属于正常现象。


解决方法

当前光模块存在寄存器偏移读取异常问题,不排除后期出现其它故障可能,需要进行备件替换。

替换光模块后,各项示数均恢复正常。

内容来源:知了社区,基于知识共享署名-相同方式共享3.0中国大陆许可协议
CRM论坛(CRMbbs.com)——一个让用户更懂CRM的垂直性行业内容平台,CRM论坛致力于互联网、客户管理、销售管理、SCRM私域流量内容输出5年。 如果您有好的内容,欢迎向我们投稿,共建CRM多元化生态体系,创建CRM客户管理一体化生态解决方案。,某局点百G光模块转发正常但读数错误