• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

  • 15088181811
您当前所处位置: 首页 > 新闻资讯 > 中兴案例

ZXMP S385-MSTP设备复用段错连导致业务中断故障一例

发布人:华讯佳 发布时间:2021-12-29 浏览数:

问题描述(故障现象)

DBN01-CORE2、DBN03、SLA-TT2-CORE2、SLA03、DBN04五个站点组的两纤双向复用段保护环。DBN01-CORE2、DBN03、SLA-TT2-CORE2、GVM_TB1_T4_2_V2、A、B、C等站点组两纤单向通道保护环。

业务配置如下:

SNCP.jpg

A、B、C站点的业务配置的通道保护,业务在Non-ZTEequipment站点落地。业务的一个方向经过MSP环上的DBN01-CORE2、DBN03、SLA-TT2-CORE2站点。DBN03到SLA-TT2-CORE2站点在10月16日08:40:21光缆发生中断,这时候A、B、C站点到Non-ZTEequipment站点部分业务发生中断。此前SLA03-DBN04之间已经存在PSE告警,且一直未恢复;

问题:既然经过DBN03站点和SLA-TT2-CORE2站点业务在该跨度既有MSP保护又有PP保护,业务怎么会中断?我们首先来看看业务是怎么恢复的,通过现场和局方工程师以及通过网管的操作日志查询,我们发现客户通过网管查询业务在中断时业务走的路径是经过DBN03站点和SLA-TT2-CORE2站点的路径,客户手动将业务通过网管倒换到走另外一个方向路径后,业务恢复。


组网环境

问题原因分析

我们首先来看一下DBN03到SLA-TT2-CORE2站点在光缆发生中断后,该MSP环是怎么倒换的。通过在网管上查询历史告警我们发现该MSP环在DBN03到SLA-TT2-CORE2站点在光缆发生中断之前就存在倒换事件,我们发现DBN04站点和SLA03站点在(时间)因为(事件)发生了倒换,但是在该跨段恢复正常后,这两个站点的倒换并没用恢复,也就是该环一直处于倒换状态,由于两个站点同时处于倒换状态,经过该跨段的业务倒换到保护通道,所以业务不受影响。在DBN03到SLA-TT2-CORE2站点在光缆发生中断后,DBN03站点和SLA-TT2-CORE2站点发生倒换,我们看在DBN03到SLA-TT2-CORE2站点在光缆发生中断后,DBN03站点和SLA-TT2-CORE2站点发生倒换A站点业务是怎么走的:

2222.jpg

解决方案

我们假设A站点的业务在到达DBN03站点10号槽位OL64光板使用的是第一个AUG的第一个TU12时隙,因为此时DBN03站点发生倒换,根据复用段倒换原理,我们知道这时候A点的业务返回来走7号槽位的OL64光板的第三十三个AUG的第一个TU12时隙,然后业务在DBNO1-CORE2站点进行穿通,穿通后到达DBN04站点,因为此时DBN04站点也发生倒换,根据复用段倒换原理,我们知道业务会返回到7号槽位OL64光板的第一个AUG的第一个TU12时隙。因为业务都是双向的,同理我们知道A站点这时候收的业务也是原来发往DBN04站点7号槽位OL64光板的第一个AUG的第一个TU12时隙的业务,我们发现DBN03站点10号槽位OL64光板使用的第一个AUG的第一个TU12时隙的业务和DBN04站点7号槽位OL64光板的第一个AUG的第一个TU12时隙的业务原来是两条不同的业务,现在发生了错误连接到一起。通过以上分析我们发现,A站点在DBN03到SLA-TT2-CORE2站点在光缆发生中断,DBN03站点和SLA-TT2-CORE2站点发生倒换后,错误接收了原来发到DBN04站点7号槽位OL64光板的第一个AUG的第一个TU12时隙的业务,所以这时候该站点不会有任何告警上报,该站点的业务不会倒换到从另外一个方向收业务,所以该站点的业务会中断。


注意事项

通过上面的分析,我们总结发现此次故障是因为MSP环在DBN03到SLA-TT2-CORE2站点在光缆发生中断之前DBN04站点和SLA03站点就存在倒换事件,在DBN03到SLA-TT2-CORE2站点在光缆发生中断后,这两个站点也发生倒换,导致A、B、C站点部分配置了PP保护的经过该跨段的业务在DBN03到SLA-TT2-CORE2站点在光缆发生中断后也发生倒换后,业务产生了错连,所以这些业务虽然还配置了PP保护,但是收不到触发业务倒换的任何告警,所以业务也不会倒换到从另外一个方向收业务,而是最终通过人为在网管上将业务倒换到从另外一个方向收业务,业务才恢复正常。