问题描述(故障现象)
某SDH网络中有一套中兴S320设备脱管,但业务正常。
组网环境
单链网络拓扑连接关系为:"……A网元<--->B网元<--->C网元"
其中A网元、B网元网元监控正常,C网元脱管(业务正常)
“A网元”IP地址:154.8.72.18 设备型号ZXMP S325
“B网元”IP地址: 154.8.80.18 设备型号ZXMP S325
“C网元”IP地址:154.8.23.18 设备型号ZXMP S320,为末端网元。
原因分析
该传输链末端的中兴S320设备出现了脱管,脱管问题通常会与光路连接或者设备单板(主控板NCP及光板)等有关。
由于业务正常,说明光路未发生严重衰耗或中断,初步判断是设备单板出现异常,但需要定位是哪一端设备单板出现问题,以便能够针对性的进行处理。
解决方案
1、telnet登陆到B网元设备,通过"if -a"命令进行观察,发现中兴325B至中兴325A及中兴320C两端的ECC通道端口均为UP状态,链路正常;
2、telnet登陆到A网元,从A网元进行ping测试,发现能够ping通 B网元,但ping不通C网元;
3、通过网管服务器cmd命令行窗口操作,进行链路追踪C网元IP地址检测,通过命令“tracert 154.8.23.18”,看到如下结果:
发现当链路追踪到A网元后,下一跳到了B网元,然后又返回到A网元,再到B网元……一直循环,但就是不能到达C网元。结合脱管的现象进行分析,认为B网元单板可能存在问题;
4、对B网元NCP板进行复位操作,几分钟后C网元脱管问题恢复正常。
注意事项
排除光路问题后,脱管问题通常与DCC通道处理相关的光板和主控板有关。本次问题处理中,由于网管服务器到C网元的ECC路由到达B网元以后又返回到A网元,所以判断是B网元的ECC信息处理相关的器件出现问题,通过复位、重启NCP板后恢复了正常运行。