问题描述(故障现象)
一台中兴ZXMP S385 16#槽位支路板下承载的信令中断,更换16#槽位EPE1单板后业务恢复。
原因分析
16#槽位EPE1单板上报端口“77”的背板帧失步(OOF),此告警表明16#槽位的EPE1单板至交叉板的2.5G业务总线故障,业务无法转发。16#槽位EPE1单板上报端口“216”的背板帧失步(OOF),此告警表明16#槽位EPE1单板至交叉板的“HW”总线故障,交叉时钟板无法与EPE1单板进行心跳及就绪状态检测。
16#EPE1单板上报S口通讯错误,结合8#、9#CS均检测16#EPE1业务总线与“HW”总线异常,可以判定此时16#EPE1存在硬件故障。
同时,复位1#槽位的保护板EPE1后,1#也产生了业务总线与“HW”总线的背板帧失步(OOF)告警。
解决方案
ZXMP S385系统的1:N保护控制信息由背板硬连线直接控制,1:N保护状态信息由HW线传递。
故障发生时,16#槽位EPE1的“HW”总线状态异常,交叉时钟板检查状态异常后发起1:N保护倒换,将业务切换至1#槽位EPE1,而1#槽位EPE1自身异常(复位后可见业务总线与“HW”总线告警),导致倒换后业务依然中断,更换16#槽位EP1单板后业务恢复。