问题描述(故障现象)
某运营商中兴ZXMP S385设备组成的一个4点的10G环,站点顺时针分别为A、B、C、D四个网元,B-C之间的光缆发生中断,B网元发生了复用段倒换,但是C网元发生倒换后立即返回,导致业务中断。拓扑图如下:
原因分析
1、数据配置问题。
2、交叉板问题。
3、光板问题。
4、版本问题。
解决方案
1、查看保护组配置数据,发现均正常。
2、检查环上其他段落均未存在异常告警。
3、恢复B-C段落光缆后,业务恢复。
4、检查K字节,发现D网元交叉板接收到的K字节异常,查询A网元发给D网元的K字节是正常的,故障原因定位到A-D段落。
5、对B-C段落进行倒换演习,通过寄存器分别查询B-C段落倒换演习状态下,D网元对A网元方向的光板接收到的K字节及D网元交叉板接收的K字节,发现D网元的光板接收到的K字节正常,但是D网元自身交叉板接收到的K字节出现了异常,问题可以定位到是D网元的光板再向交叉板发送的K字节出现了问题,可以判断是D网元的光板出现故障。
6、现场更换了D网元的光板后,重新倒换测试,均正常,故障解除。
7、单板寄回研发分析发现,D网元的光板内部硬件出现问题,导致改变了K字节,从而导致倒换异常。