• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

OSN3500因支路板告警处理问题导致发生MSP倒换后上报V5_VCAIS的说明

发布人:华讯佳 更新时间:2023-12-05 点击数:

问题描述

客户对网络10个OSN3500组成的STM-64MSP环进行清理光纤操作时,发生MSP倒换,此时一站点部分支路板上报V5_VCAIS和TU-AIS告警。客户检测用户侧业务无任何影响,告警在3分钟内逐渐消失。次日晚,随客户一起做MSP倒换测试,告警依旧,业务正常。


处理过程

根据结论将设备的主控和单板升级至V1R7版本配套。倒换测试后无任何异常告警。


根因

检查此OSN3500设备主机版本为:5.21.13.47p01. 此设备带扩展子架,共计各类单板72 。
1.查看资料V5_VCAIS告警表示低阶通道VC-12中V5字节的第5比特到第7比特全为“1”。此告警将影响业务。
2.采集单板黑甲子bb4.log和bb9.log 经研发分析。
3.当单板通过单板方式同时上报给主机的告警条数过大时(超过1024),就会有告警队列溢出的现象,在主机Telnet上有告警队列ID溢出的打印,导致部分告警的end消息丢弃掉(由于当时复用段倒换的时候,单板会有瞬间的业务中断,并上报大量告警,但实际的业务只是瞬断,没有影响到业务和倒换测试。另外就是此网元单板非常的多,告警队列溢出的可能性非常大)。4.此告警必须靠主机的1分钟校验事件校验,通过3分钟后将告警结束掉(所以看到上报的告警都在3分钟内结束,就是有主机在3分钟的校验检测后,把其滤掉的)。
5.定位分析,提出单板用多包方式上报告警给主机,单板将打包成64告警为一包上报给主机,而主机的消息队列是1024的长度,可以将主机的处理能力大大提高,通过测试该现象消失,能正常产生也能正常结束。
6.结论:因R1~R6未修改单板软件用多包方式上报告警的版本,而V1R7软件版本已经解决单板多包方式上报。所以需要将单板升级到V1R7版本且主机配套。