• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

关于N2PQ1多板ID在掉电测试时引起业务问题的处理

发布人:华讯佳 更新时间:2022-11-20 点击数:

问题描述

在进行OSN3500掉电单站测试的时候存在N2PQ1的业务不能正常恢复,导致业务中断,N2PQ1在管网上显示灰色(未开工状态),解决的方法是再软复位一下PQ1单板。
版本配置:主控版本是:5.21.13.47p01,N2PQ1版本是4.13


处理过程

1、临时解决办法是再次复位一下PQ1单板,但这不能解决根本问题。
2、用R7版本的N2PQ1版本,升级到 NGSDH V100R007C02B017(5.21.17.31)+N2PQ1(5.30)版本,这个版本解决了这个问题。


根因

1、R3版本主机代码的消息队列和多板ID单板申请开工存在配合问题。
2、N2PQ1支持双ID,N2和N1,在主机R6版本以下只能使用N1 ID。N2PQ1单板支持“单板兼容替换功能”,其物理板ID为SSN2PQ1,逻辑板ID可以配置为N1/N2两种;
3、R6以下版本,配置有N2PQ1单板的设备在掉电时可能会存在问题:设备掉电时,N2PQ1将先于GSCC起来,这是N2PQ1无法从GSCC上获取配置,将自动使用N2PQ1的ID,当GSCC启动时,这是PQ1的逻辑单板是N1的,但是物理单板是N2的,这样的话业务就会断了。
4、咨询研发后,给出的解释是:多板ID在老主机上的一个匹配过程,以如下面所讲的N2PQ1为例,设备掉电时,的确N2PQ1会将先于GSCC起来,首先N2PQ1会以N2PQ1开工,但这时主机还没有完全起来,这个时候的确是不会匹配成功,但我们单板软件会发现以N2PQ1开工长时间(12×3s)不能开工,就会更换为N1PQ1开工,如果以N1PQ1开工还是长时间(12×3s)不能开工,就更换为N2PQ1进行开工,依次这样循环更换板类型(N1PQ1和N2PQ1)进行开工,对R6版本,对这个循环更换板类型的板类型的次数做了限制,N2PQ1单板就为10次,如果匹配次数到达了这个极限值,就不会轮巡匹配了,由于主机起来的时间比较长,如果这个时间超过了轮巡10次的时间,那么这时有可能是以N2PQ1申请开工,也有可能N1PQ1申请开工,现网这个现象是以N2PQ1开工的,所以物理板检测的是乱码。对R7及后续版本就没有这个限制,一直都是轮巡匹配,直到匹配成功。


建议与总结

1、对于紧急恢复措施:
   当现网使用R3及以前版本的网元在掉电重启时遇到该问题,请对单板主动进行软复位,就可以解决。 
   对出现该问题的现场具体判断如下:    
   1)、确定单板为多板ID单板;
   2)、网管上看不到物理板类型或在Navigator上显示的物理板类型为乱码(数字代号);
   3)、查询告警存在WRG_BD_TYPE告警;
2、了解OSN的多板ID技术可以帮助此类问题的理解和解决