• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN7500上报HARD-BAD告警,所带非网关网元全部脱管处理

发布人:华讯佳 更新时间:2023-12-09 点击数:

问题描述

1、网关网元OSN7500设备的N2SCC主控板上报HARDBAD告警,告警参数为0xff,0xff,0xff,0x08,0x00,告警参数含义为z80007坏.
2、当前主机版本为5.21.13.46,查询ecc通道状态为正常,但是下挂网元脱管,进行查询操作都提示后台忙。

告警信息

HARD-BAD,告警参数为0xff,0xff,0xff,0x08,0x00,告警参数含义为z80007坏

处理过程

1、软复位主控板,HARD-BAD告警不消失,硬复位主控板,HARD-BAD告警消失,但是非网关网元还是脱管;
2、更换主控板非网关网元还是脱管,查询ECC路由表,发现出现距离为57以上,ID类似为157-563的奇怪网元,通过命令行无法登陆;
3、关闭OSN7500设备带的所有环的ECC通道,再一个一个打开,发现当打开其中一块SLQ4光板的3或者4光口的ECC通道,就会出现网元脱管,并且ECC路由会出现距离为57以上,ID类似为157-563的奇怪网元;
3、关闭有问题的SLQ4光板的3和4光口的ECC通道,网元能正常登陆,距离为57以上,ID类似为157-563的奇怪网元在ECC路由表里也消失了。
4、更换此SLQ4单板,网元不再脱管,问题原为SLQ4板ECC形成了环路,导致ECC表出现距离为57以上的距离路由信息,出现ECC阻塞,OSN7500处理ECC不过来;

根因

1、当设备主控出现HARD-BAD告警,查询案例其中《OSN7500上报HARD-BAD告警所带非网关网元脱管》-SC0000378364故障现象很相似。通过硬复位主控告警消除,但是非网元关网元还是处于脱管状态;
2、关闭OSN7500设备带的所有环的ECC通道,再一个一个打开,发现当打开其中一块SLQ4光板的3或者4光口的ECC通道,就会出现网元脱管;
3、关闭有问题的SLQ4光板的3和4光口的ECC通道,网元能正常登陆;
4、更换此SLQ4单板,网元不再脱管;

建议与总结

1、大量网元脱管有很多原因,有主控问题,版本问题,线路板问题导致也有可能。
2、可以通过告警和ECC路由表的现象去定位,通过更换主控,或者关闭ECC把问题定位到单板。