服务热线
189-2347-0832

中兴S385 您当前所处位置: 首页 > 新闻资讯 > 行业技术

OSN3500支路板告警处理导致MSP倒换后上报V5_VCAIS

发布时间:2019-09-04

OSN3500支路板V5_VCAIS告警表示低阶通道VC-12中V5字节的第5比特到第7比特全为“1”。该告警会造成单板TU通道业务传输异常。告警V5_VCAIS产生的可能原因如下:业务上游单板存在PLL_FAIL、CHIP_FAIL等硬件故障告警。本支路单板硬件故障。


问题描述

某日客户对网络10个OSN3500组成的STM-64MSP环进行清理光纤操作时,发生MSP倒换,此时一站点部分支路板上报V5_VCAIS和TU-AIS告警。客户检测用户侧业务无任何影响,告警在3分钟内逐渐消失。次日晚,随客户一起做MSP倒换测试,告警依旧,业务正常。


告警信息

V5_VCAIS,TU-AIS


处理过程

根据结论将设备的主控和单板升级至V1R7版本配套。倒换测试后无任何异常告警。


根因

检查此OSN3500设备主机版本为:5.21.13.47p01.此设备带扩展子架,共计各类单板72。

1.查看资料V5_VCAIS告警表示低阶通道VC-12中V5字节的第5比特到第7比特全为“1”。此告警将影响业务。

2.分析单板黑甲子bb4.log和bb9.log。

3.当单板通过单板方式同时上报给主机的告警条数过大时(超过1024),就会有告警队列溢出的现象,在主机上有告警队列ID溢出的打印,导致部分告警的end消息丢弃掉(由于当时复用段倒换的时候,单板会有瞬间的业务中断,并上报大量告警,但实际的业务只是瞬断,没有影响到业务和倒换测试。另外就是此网元单板非常的多,告警队列溢出的可能性非常大)。4.此告警必须靠主机的1分钟校验事件校验,通过3分钟后将告警结束掉(所以看到上报的告警都在3分钟内结束,就是有主机在3分钟的校验检测后,把其滤掉的)。

5.定位分析,提出单板用多包方式上报告警给主机,单板将打包成64告警为一包上报给主机,而主机的消息队列是1024的长度,可以将主机的处理能力大大提高,通过测试该现象消失,能正常产生也能正常结束。

6.结论:因R1~R6未修改单板软件用多包方式上报告警的版本,而V1R7软件版本已经解决单板多包方式上报。所以需要将单板升级到V1R7版本且主机配套。