• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN3500设备N2EFS4单板频繁上报COMMUN_FAIL告警

发布人:华讯佳 更新时间:2023-12-19 点击数:

问题描述

OSN3500设备N2EFS4单板上报COMMUN_FAIL告警,涉及多块单板,故障现象一样,版本一致。告警参数为0x03,表示板间以太网通信故障。2小时左右上报一次,每次上报时间10S左右自动恢复。

主控版本:5.21.17.31

N2EFS4单板版本为5.30

AUX单板版本为3.13


告警信息

频繁上报COMMUN_FAIL告警。


处理过程

1、查看单板复位记录,单板有大量复位记录。

2、所单板均为狗复位,从错误记录上来看是申请内存失败。

3、查看发现EFS4单板对接的M500EFT单板端口均存在ETH_LOS告警。

4、核实为EFS4单板对接的M500EFT单板端口ETH_LOS告警,不断向EFS单板发送GFP客户信号丢失帧,导致EFS单板GFP管理帧处理任务申请内存后没有处理释放,最终导致单板内存耗尽复位,上报COMMUN_FAIL告警。

5、排查对接单板情况,消除其端口ETH_LOS告警可以规避此问题。根本解决该问题需要升级单板软件到V1R8C01B01c或以后版本。


根因

1、单板复位引起通信失败。

2、主控单板和以太网单板间通讯故障

3、告警误告。


建议与总结

对于涉及多块单板相同现象故障的处理,需要找到共同点,不仅是单板本身,和其对接的单板,环境因素等都需要考虑。