• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN3500设备升级到5.21.19.31版本后主备主控上报告警

发布人:华讯佳 更新时间:2023-12-28 点击数:

问题描述

OSN3500设备新发货版本有5.21.18.50P01还有5.21.19.31版本,用户要求统一版本,从5.21.18.50P01升级到5.21.19.31,升级完成后,一台OSN3500设备主备主控板都上报hard_bad告警,主备主控频繁倒换、设备主控板为SSN1GSCC01单板;


告警信息

截取网元部分告警如下:

17 HARD_BAD CR end  2011-06-04 09:53:26  2011-06-04 09:54:25  0xff   0xff   0xff   0x01   0x00   

17 HARD_BAD CR end  2011-06-04 09:54:36  2011-06-04 09:55:45  0xff   0xff   0xff   0x01   0x00   

18 HARD_BAD CR end  2011-06-04 10:28:50  2011-06-04 10:28:55  0xff   0xff   0xff   0x01   0x00   

18 HARD_BAD CR end  2011-06-04 10:40:34  2011-06-04 10:40:38  0xff   0xff   0xff   0x01   0x00   

18 HARD_BAD CR end  2011-06-04 10:52:00  2011-06-04 10:52:14  0xff   0xff   0xff   0x01   0x00   


处理过程

1、核实升级动作,一共加载了7个站点都没有问题,软件包问题排除;工程师严格按照指导书操作,升级过程无错误提示,升级顺利,和升级过程没有关系;

2、两块单板都上报hard_bad告警,同时故障的可能性不大,因上报告警后主备主控板频繁发生倒换,所以单板告警不可能是误报;

3、现场全量采集数据返回分析,核实结果如下(详细分析过程见附件):

SSN1GSCC01主控在V100R009C04SPC200版本(19.31)下底层dwReadV36接口实现错误,读取到了3.3V电压的值,从而概率性上报hard_bad告警。

4、出现此问题可以考虑:

A、版本降级到R8主流版本V100R008C02SPC200或者V100R008C02SPC300,或升级到R10版本。

B、更换为非N1GSCC01单板,如N1GSCC02,N4GSCC等单板;现场更换为N4GSCC单板问题解决;


根因

1、主机软件升级过程有问题,没有正确加载软件;

2、主控板硬件故障;

3、主机软件和主控板配合问题;

4、告警误报;


建议与总结

如果有升级需求,建议核实下发布的设备版本策略,因为5.21.18.50P01版本就是主流维护版本,现网运行稳定,而5.21.19.31版本是针对有数据特性特殊需求局点而使用的版本,此问题站点现网实际没有升级必要;