问题描述(故障现象)
客户反馈,某汇聚节点下挂区域的基站频繁中断,每次中断10分钟左右。
原因分析
区域性基站发生中断,可能的原因有:
1、链路故障,如汇聚层中断,接入层也存在中断,或链路上存在大误码,导致基站闪断;
2、检查是否为同地址段业务,桥接设备存在异常等;
2、单板或设备故障,导致下挂接入环业务不发生倒换;
3、其他问题
解决方案
查询网管发现,中断基站的区域链路存在大量的隧道告警,随后部分节点发生网元脱管
1、检查接入环的路由,发现中断业务的区域接入环,虽然是环,但为单汇聚节点接入,汇聚到同一设备,分别接入在该节点的11#和16#;
2、查询历史告警,发现11# 16# 单板均有不同程度反复重启的历史告警;
3、查询单板运行时间,发现除11# 16#单板外其余单板并未发生重启;
4、查询设备的历史告警发现,从几天前开始设备上报部分单板温度越限告警;
5、让代维前往机房,进行机房检查,清理防尘网。
6、待温度降下来后设备运行正常。
注意事项
1、现网组网存在一定隐患,接入环单节点成环;
2、虽然现在是3月份,但天气反常温度较高,慢慢邻近夏天,需重点关注机房及设备温度越限告警,需及时进行防尘网清理及机房温度检查。