问题描述(故障现象)
某地区桥接设备进行版本升级,从1.10版本升级至2.10版本后,无线反馈部分基站无法建链。因当天晚上无线无操作,仅承载6500设备进行过升级。
组网环境
地市的三对桥接设备承载近4000个LTE基站,其中无线包括中兴LTE 与诺西 LTE
原因分析
问题分析:
1、升级后,设备或线卡异常,导致业务受影响;
2、升级后,配置存在异常,导致某个地址段业务异常;
3、其他问题等
解决方案
问题分析:
1、导出无线网元断链的告警,发现告警重要集中在0:15分及2:20分 两个时间节点,从晚上操作记录来看,与PTN6500设备重启的时间较为匹配。0:15分左右升级的为桥接及L3落地的备用设备,2:20分左右升级的桥接及L3落地的主用设备。但从理论上来说,原本业务正常,升级备用桥接及备用L3设备时并不会影响业务;
2、获取全部无线无法建链的网元ip,发现并不是某一个区域,或者某一地址网关下的基站,基本排除设备异常导致;从桥接及L3落地上进行基站管理ip的ping检测,无论从桥接或者L3落地均能正常ping通,ping测大包6000以上,也正常,无丢包情况;
3、同时全部桥接承载的LTE基站数为4000左右,反馈问题的为我们自己的LTE基站,让无线的配合,从OMC网管服务器ping测基站管理地址,反馈不通;从OMC网管服务器tracert基站管理地址,反馈可以到达。
4、PTN侧尝试重新新建基站的管理业务,未解决;
5、同时无线派人前往站点进行现场测试,发现基站上网、电话、下载均正常;
6、基本定位是无线问题,无线通过相关处理后网元正常建链。
注意事项
因告警是升级后产生的,我们需全力进行配合检查,检查的步骤需按照一定步骤。
1、首先确定业务范围,这次无线无法建链的网元较多,通过分析IP,不集中某一桥接点或某些子接口下。
2、同时进行基本的ping检测及路由检测;
3、与客户核实其他厂家的无线是否受到影响,此次故障诺西的并未受到异常;
4、不同专业相互配合检查,及时沟通进展,可以缩短定位时间。