问题描述
某客户主要由Metro3000设备组成,业务为集中型,主要在A站下业务,承载业务量较大,某日H站和G站之间光缆中断,其他站点部分至A站的E1业务中断。
告警信息
R_LOS TU_AIS
处理过程
1、收集信息,初步判断故障原因,业务中断时间与光缆中断的时间吻合,无其他异常告警,基本确认业务中断由客户光缆故障引起
2、数据配置不完整问题,查询中断业务有完整的路径,并且是激活状态,排除漏配的可能
3、分析中断业务的特点,所有中断的业务都是在A站落地,并且都配置在同一个VC4,进一步缩小故障的范围
4、查看B站的SNCP保护组状态,为正常态,未发生倒换,并且对应VC4的SNCP组为VC4级别,其余站点该VC4的配置都是VC12级别的穿通或者上下,H站和G站光缆中断时下插的是TU_AIS告警,而B站配置为VC4级别的穿通,TU_AIS不会触发VC4级别SNCP倒换。
根因
配置问题导致SNCP倒换失败,其余站点配置的是VC12级别的交叉,H站和G站光缆中断时下插的是TU_AIS告警,而B站配置为VC4级别的穿通,不会对VC12级别的业务进行监视,能触发VC4级别SNCP倒换的告警是AU_AIS,而不是TU_AIS告警,所以B站的VC4级别SNCP保护组为正常状态,不会发生倒换,导致业务中断。
解决方案
将3052-D站的VC4级别的SNCP保护改为VC12级别,SNCP正常倒换,业务恢复正常。
建议与总结
1、合理规划使用网络资源,可提高资源的利用率
2、熟练掌握网络保护的实现原理以及触发保护倒换的条件
3、维护人员要善于收集信息并加以综合分析,找出故障的共性和特性