问题描述(故障现象)
某局点,交叉板异常导致业务全阻18分钟,后自动恢复。
原因分析
业务全阻时,网元处于脱管状态,周边所有站点光板都上报不可用时间,并伴随复用段倒换事件,怀疑为交叉板工作异常。
解决方案
1.现场更换整框及核心单板,包括ENCP,交叉板、光板等,避免不明原因的再次中断。
2.对换下来的机框、交叉板、光板做离线拷机测试,仍存在不定期业务全阻现象,且造成网元脱管。
3.逐块单板进行检查,发现拔出一块OL4光板存在电容脱落,针脚弯曲的异常状态,拔出此版拷机,设备长时间运行正常,插入该板则短期内又出现全阻现象。
4.最后将故障定位为该OL4单板导致的整框业务全阻。
注意事项
中兴ZXMP 385虽然采用了分散型双总线结构,最大程度保证业务可靠性,但在极端情况下,某块业务单板的异常状态,会导致承载该业务总线的交叉板工作异常,由于整个网元的是时钟总线集中承载在一块交叉时钟板,一但该异常状态交叉板正好承载了时钟总线,由于异常状态导致未及时倒换的话,就会造成整个网元业务、甚至监控的瘫痪。
所以我司的设备在设计上虽然相对完善,但不可避免极端情况下意外状况的发生,尤其是一些人为疏漏,例如单板明显的损坏,会对整个设备稳定运行造成极大隐患。