问题描述(故障现象)
某网络上一台中兴ZXMP S385网元,9槽位CSAZ交叉板上报S口通信错误告警,请点对其实施更换,更换过程中,先后换上3备件,业务总线切换到9槽位,业务均不能恢复。
原因分析
可能原因:
1、3个备件都有故障。此概率极低。
2、9槽位背板总线有故障。
3、还有其它原因。
解决方案
按常规思维,3个备件都有问题的概率极低,只能怀疑背板总线有问题。但考虑到更换子架非常复杂,风险极大,决定冒险尝试所有方法,以确定是否还有其它原因。现场将9槽位交叉板拔出,将8槽位交叉板复位,发现8槽位启动后,业务也不恢复,由于8槽位原本正常承载业务,说明单板和槽位都没问题,说明还有其它未查明原因。将主用主控板从18槽切换到19槽位,执行一次时隙增量下发,业务恢复。后实施19槽主控板向18槽位同步数据,同步几次后一直上报主备数据不一致,说明18槽位ENCP单板故障,将其替换,再执行同步,同步后主备数据比较一致。分别以18、19槽位ENCP单板为主用,依次复位8、9槽位交叉板做倒换测试,均正常。
注意事项
SDH设备的交叉数据存放在三个地方,网管数据库内,主控板内,交叉板内。交叉板数据复位后即丢失,需由主控板向其下发交叉数据。主控板内数据下电不丢失,网管数据库内和主控板内的数据可通过网管上载比较功能验证是否一致。主控板由于故障导致数据丢失或错误,如果交叉板没有复位过,其内部一直保留着正确的交叉数据,这个问题看不出来,但交叉板一旦复位,复位后从主控板取不到正确的交叉数据,业务就会中断。故障处理中,如果更换多块交叉板都不行,可怀疑主控板是否有问题。