• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

主用交叉板工作状态异常导致备用交叉板上报BUS_ERR

发布人:华讯佳 更新时间:2024-01-06 点击数:

问题描述

OSN7500设备,10-UXCSA主用,备用9-UXCSA单板上报BUS_ERR、HSC_UNAVAIL告警;

业务正常。

单板版本9-UXCSA:8.13;10-UXCSA:8.13;

主机版本:5.21.18.50

9-UXCSA单板告警参数:

1、HSC_UNAVAIL0X040X010X090XFF0XFF

2.BUS_ERR0X040X030X130X020XFF

3.BUS_ERR0X040X040X130X020XFF


处理过程

1、详细查询BUS_ERR告警的参数:para1表示逻辑板位,本例para1数值为0x04,交叉板监测4-SLO1板位发给自己的业务总线存在问题;para2表示该板位中的总线序号本例中数值为0x03/04;para3的数值不同的bit为表示不同的告警存在状态,将返回值换算成16进制数然后对照查询;如果para4=0x01则表示交叉板检测业务板过来的总线,如果para4=0x02则表示两个交叉板握手检测到的。

2、根据以上,确认为4-SLO1发给交叉板的信号,两个交叉板握手信息有问题。


根因

主用交叉板未插好。


解决方案

1、更换9-UXCSA,问题依旧;

2、更换4-SLO1,问题依旧;

3、怀疑主用交叉有问题,但是由于有HSC_UNAVAIL,交叉无法网管倒换,硬切换有风险;

4、经过咨询公司研发,对于SLO1单板,仅需要2根总线,也就是说如果真是SLO1或者备用交叉板故障,bus_err告警参数的第二位应该是0X01或者0X02,本次为0X023/OX04,为没有使用的总线,应该是交叉误报,可以强行切换,不影响业务;

5、经过强行插拔10-UXCSA,进行交叉倒换到9-UXCSA,告警消失,观察半天消失未重现;将单板手动切换回10-UXCSA,问题不重现。


建议与总结

1、BUS_ERR为NGSDH的常见告警,该问题可能为交叉板收总线、也可能为业务槽位发总线故障,实际定位中无法准确定位到具体单板,最好带齐板件,一次解决问题;

2、本次故障比较少见,为主备交叉板握手信号故障,且为主用故障,更换备用交叉无法解决问题。但是由于备用存在告警,无法软倒换交叉尝试定位问题,需要硬拔插主用交叉才能触发倒换,定位问题。