• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN3500设备N1EFT8单板误报HARD_BAD告警

发布人:华讯佳 更新时间:2023-12-22 点击数:

问题描述

某局OSN3500设备15槽位N1EFT8单板上报HARD_BAD告警,告警参数:0x130xff0xff0xff0xff,单板上承载业务一直未受任何影响。主控版本是5.21.13.47P01,N1EFT8单板版本3.16


告警信息

HARD_BAD


处理过程

1.更换15槽位N1EFT8单板告警依旧,将更换下来的单板插在16槽位没有上报HARD_BAD告警,之后将15槽位业务割接至16槽,16槽位N1EFT8单板又开始上报HARD_BAD告警,15槽位HARD_BAD告警在删除业务后结束。怀疑是告警误报。

2、咨询研发,得知EFT8单板为了规避9785的断流缺陷,使用了9785缺陷规避方案,该方案的原理大致如下:PHY9785提供了寄存器用于指示PHY是否接收到报文和PHY是否发送报文。因此EFT8软件通过检测PHY是否接收到报文,以及MAC是否接收到报文来判断接收侧是否断流;通过检测PHY是否发送报文,以及MAC是否发送报文来检测发送侧是否断流;检测到端口断流后,软件会复位9785芯片,尝试恢复业务,如果复位8次业务都没有恢复的话,则不再尝试复位,且上报HARD_BAD告警。

3、怀疑是9785缺陷规避方案误检测导致误报HARD_BAD告警。按照附件的采集指导采集数据,研发分析确认是告警误报。升级单板软件至7.54及以后版本可以彻底解决。


根因

1、单板硬件故障;

2、版本缺陷导致告警误报。


建议与总结

附件的指导书适用于N1EFT4、N1EFT8和N1EFT8A