问题描述
OSN8800设备组网A站点TOA单板至D站点TOA单板有一条GE业务,客户申告在客户侧数据设备观察发现该条业务有严重丢包情况。网管查询该业务单板无任何告警,查询D站点TOA单板WDM性能发现该GE业务端口上存在ODU0的PM段不可用秒及PM段背景误码块。
处理过程
一、网管查询A-B、B-C、C-D三个段落各方向NS2单板WDM性能,四个站点6块NS2单板性能均正常,光功率性能高正常,FEC纠错前误码率、纠错后误码率全部为零。
二、调整A站点与D站点客户侧TOA单板端口。A站点将业务由TOA单板5口调整至7口,D站点将业务由TOA单板2口调整至4口,联系机房人员随之将客户侧尾纤调整。网管观察D站点调整后端口误码依然存在,客户反馈丢包现象仍旧存在。由此判断故障原因并非由支路板引起。
三、再次排查网管上A-D所有涉及业务,该段落上除A-D的GE业务外,C-D还承载一条STM-16级别业务。查询该业务性能未发现异常性能事件,无异常告警。
四、分别在A-B、A-C、B-C开通一条GE级别业务进行测试,查询支路板TOA单板WDM性能。A-B之间GE业务正常,未产生
PM段误码。查询A-C与B-C之间GE业务,在C点支路TOA单板端口上均发现ODU0的PM段不可用秒及PM段背景误码块,由此判断B站点到C站点线路板NS2存在问题。
五、工程师更换B站点NS2单板(C方向)后故障未恢复,再次更换C站点NS2单板(B方向)后,故障恢复。受影响GE业务性能恢复正常,数据用户反馈丢包现象恢复。
根因
NS2线路板故障导致业务中断,但WDM性能正常
建议与总结
对于类似支路板误码故障,可以从以下几方面进行故障排查:
1、更换支路板接口,是否支路板故障导致
2、查询业务所经过线路板性能,是否存在严重误码
3、逐段落开通测试业务,定位故障原因