问题描述(故障现象)
中兴ZXCTN6500-16一台L2/L3设备主用NCPA单板故障,设备除两块主控与拖带线卡外,其余线卡均上报“单板脱位”告警。此时业务未受影响。
当路径发生中断后需要触发隧道倒换,倒换失效导致业务中断。
原因分析
大部分线卡均上报“单板脱位”,但是业务未受影响,可以判断机电管理单元故障上报了“单板脱位”的误告警。
同时从大量线卡上报误告警判断NCPA自身故障可能性高。
因为主控故障,主控板的FPGA会负责倒换的决策导致倒换失效。
需要进行主控板主备倒换或更换主控板槽位。
解决方案
进行NCPA单板的主备倒换,倒换后“单板脱位”告警消失,且隧道保护倒换正常触发。
返修后测试NCPA单板的local bus故障导致时钟失锁,进而影响NCPA的保护倒换与机电管理模块。