问题描述(故障现象)
某地市全A县网元突然全部脱管,ping也无法ping通,只剩下县局网元正常监控。
组网环境
环形组网
原因分析
托管问题可能的原因
1、网元配置存在问题;
2、设备NCP故障;
3、设备掉电;
4、设备光路中断;
5、设备地址冲突;
6、非骨干域同一段不连续。
解决方案
现场对问题进行分析
1、A县分配的是196.0.0.0段,县局网元分配的是192段,这个地市的网络管理方式是市局某台中兴5800设备做接入网元,各个县县局中兴S385设备用192骨干域段,各个县再分配不同的非骨干域段;
2、由于是整个县的网元脱管,设备脱管可能原因中的前五个都是针对单网元的,因此都可以排除;
3、现场查看这个县的域配置,未发现断开现象,全部是连续的,ping这个县的网元都无法ping通;
4、对A县的某几个网元进行tracert跟踪,发现均跟踪到B县的中兴S385的某个光口便中断;
5、经过检查核对,确认了跟踪到B县的中兴S385的具体光口为622M光口,经过检查发现这个光口有收光,且无任何告警;
6、经询问B县维护人员,原来他们在这个光口扩容了一台中兴S200,这台中兴S200是从A县借用的,是A县掉电的设备,拿到了B县,但是没有进行修改IP地址;
7、问题已经找到,原来是因B县新开的ZXMP S200域与A县非骨干域网元在同一个域,造成了非骨干域的不连续;
8、让B县维护人员将ZXMP S200断开,A县网元监控正常,让B县在接入ZXMP S200前先更改IP地址,再接到ZXMP S385上,结果全部网元监控正常。
注意事项
近来很多地方MSTP网元下电重新利用,在此过程中容易产生类似的问题,因此我们维护过程中一方面要提醒局方利旧设备时要及时修改IP地址;另一方面在突然出现某个非骨干域网元突然全部脱管问题时可以考虑利旧这个问题。