• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN3500设备N1EFT8以太网单板上报T_LOSEX告警问题处理

发布人:华讯佳 更新时间:2024-01-07 点击数:

问题描述

某局点OSN3500设备N1EFT8以太网单板上报T_LOSEX告警,放在5、13槽位时不上报告警(目前在5槽位),放在14、15、16槽位会上报(当前插放在14槽位上)。参数0X01、00、01、02、08。


告警信息

T_LOSEX


处理过程

1、T_LOSEX告警表示单板检测到背板业务总线信号丢失告警。如果单板检测到背板业务总线为LOS状态时,就上报此告警。

2、单板放在5槽位或是13槽位告警消失,判断单板正常。

3、放在14、15、16槽位会上报T_LOSEX告警,多个槽位故障的可能性较小,检查槽位也是正常的。

4、按照T_LOSEX告警指导,告警参数3为0X01,表示为小槽位交叉单板故障,判断为9槽位交叉单板SXCS故障。

5、复位9槽位交叉单板SXCS,告警不消失;更换9槽位SXCS单板,告警还是存在;拔出9槽位,告警还是上报。排除9槽位单板故障。怀疑9槽位对应母板槽位故障。

6、检查9槽位母板槽位槽,确实存在槽位边缘存在倒针现象,但是分析此倒针不影响以太网单板上报T_LOSEX告警,且将倒针掰回正常状态后,告警还是不消失。(注意:对母板针脚操作是高危操作,带电操作可能烧毁母板,必须严格在设备掉电情况下操作,且操作后也不能保证母板针脚正常,一般建议直接更换母板)

7、更换母板,告警还是上报。排除母板故障。至此怀疑是否其它槽位单板引起的总线故障。

8、实验室分析,发现资料对于N1EFT8单板上报T_LOSEX告警的参数分析描述是错误的,(T_LOSEX告警的参数分析对其它以太网单板有效)。

目前所有NGSDH设备N1EFT8单板T_LOS_EX告警参数实际含义应该为:

参数名称 参数含义

参数1、固定为0x01,无意义。

参数2、参数3 固定为0x00 0x01,无意义。

参数4 当前SSN1EFT8单板当前选收的交叉单板总线

0x01表示当前选收的ID小槽位的交叉单板

0x02表示当前选收的ID大槽位的交叉单板

参数5 每位代表一根背板总线好坏。

bit[0]为1表示ID小槽位交叉送来的第1根总线坏

bit[1]为1表示ID大槽位交叉送来的第1根总线坏

bit[2]为1表示ID小槽位交叉送来的第2根总线坏

bit[3]为1表示ID大槽位交叉送来的第2根总线坏

9、根据结论,参数4是0X02,表示选收10槽位的交叉总线;参数5为0X08,转换为二进制1000, bit[3]为1表示ID大槽位交叉送来的第2根总线坏

,判断为10槽位交叉单板故障

10、现场更换10槽位交叉单板SXCSA后,N1EFT8单板T_LOSEX告警消失。


根因

1、N1EFT8单板故障

2、交叉单板故障

3、母板故障


建议与总结

1、对于告警,一般按照资料描述处理即可,但是对于需要更换设备母板的操作一定要慎重,要多提出疑惑点。比如此次操作前期怀疑母板故障时,但是检查母板槽位确实是正常的,那这个时候更换母板是否正确,是否还有其它原因导致?

2、后续推动N1EFT8单板代码改写,使其T_LOSEX告警参数和资料描述一致。(N1EFT8没有严格按照告警参数开发)