问题描述(故障现象)
网管反馈:设备所有单板不定期上报“单板脱位”告警,所有业务中断,但几分钟后还可以自动恢复。
原因分析
分析故障现象,由于所有单板都上报单板脱位告警,可能存在整机掉电或NCP复位的情况,登录NCP板查询复位记录。telnet到网元,用a-get-reset命令查询NCP的历史复位记录。发现NCP单板有过几次掉电复位的记录:
Board ResetType Time
0x10901 0x2 20091021102312
但局方说近期并没有人为的拔插或掉电操作,后来经查询这些站点最近有过几次停电的记录,初步判断与停电有关系。通过断开市电进行测试,发现在断开市电切换到电池供电的瞬间站点内的所有设备都会掉电再重新上电。这时的ZXMP S200也发生了掉电重启,重启后网管上可以查到单板脱位告警。
解决方案
同样也对另一个上报单板脱位告警的站点进行了测试,也出现同样问题,最后判断这几个站点的配电柜存在问题,导致电源切换不正常。更换配电柜后问题解决。
注意事项
在设备出现告警时除了考虑设备自身的原因外,也不要忽视外界的环境因素。