问题描述(故障现象)
某运营商站点站点中兴ZXMP S385设备NCP报S口通讯错导致全网网元不能监控。随后经过在现场对NCP进行多次复位问题依然存在,更换NCP监控恢复正常。
原因分析
分析判断可能原因:
1、其他单板与NCP S口通讯
2、NCP槽位故障;
3、NCP单板故障。
解决方案
原因排查:
1、其他单板与NCP S口通讯
问题发生后,对其他单板的S口通讯进行测试发现全部不通,再对NCP自己进行S口通讯测试结果通讯正常。
2、NCP槽位故障
排查NCP的槽位有问题。S385设备有18,19两个NCP槽位,于是将NCP从之前的18槽位换到19槽位,然后再次进行测试,结果问题还是存在。
3、NCP单板故障
进一步推断会不会是NCP本身有问题,造成NCP报S口通讯错和全网网元不能监控,但是经过NCP拔插后问题依然存在。所以该故障的原因排查需要现场进行问题的复现。
设备其他业务板都要与NCP通讯,由于本台S385为接入网元其他网元路由也要经过本端设备NCP进行监控。于是在现场可以通过对NCP进行复位的方式对故障现象进行定位。
随后在现场对NCP进行插拔的方式进行复位,复位后NCP问题依然存在,以往处理问题的经验来看可以初步判断为NCP故障的可能性很大。于是更换一块NCP进行观察,全网监控恢复和S口通讯错也全部消失,判断 NCP单板故障。
注意事项
接入网元NCP报S口通讯错导致全网网元不能监控问题处理过程来看。由此故障的排查我们可以得到经验,在某些情况下我们可以通过其他的方式来复现故障现象而减少故障处理过程对现网的影响。