问题描述(故障现象)
10月7日20时左右,某地市反映由于OTN网络某环单芯不通,导致12个2G业务、12个4G业务中断。
原因分析
1、10月7日20时左右,某地市移动监控班值守人员反馈由于OTN网络环三单芯不通,导致12个2G业务、12个4G业务中断。根据监控班提供断站清单,使用故障聚焦诊断工具进行公共路径分析,分析定位故障站点集中下挂在三十里铺ZXCTN6500设备11槽位板卡。
2、结合断站清单和故障公共路径分析,故障站点都经过三十里铺ZXCTN6500设备的11槽位16口PGEA板卡。
3、检查该三十里铺ZXCTN6500设备11槽位,发现下挂接入环网元全部断链,隧道不通。使用中兴6500健康检查工具检查后发现,该单板可能存在硬件故障。在网管上复位该单板后,板卡启动异常。
4、当晚21时10分,OTN环三光缆恢复后,OTN侧恢复正常,基站业务陆续恢复。
5、当晚23时17分更换三十里铺中兴PTN6500设备11槽位该单板后,下挂接入环链路均恢复正常。
解决方案
1、本次故障原因在镇安环三至米粮环三单芯不通的同时汇聚设备三十里铺6500设备下挂接入环的11槽位16口PEGA板卡硬件故障,导致业务工作方向中断后,倒换到保护方向时,保护方向单板故障,致使这些基站业务工作和保护同时故障,引起业务中断。
2、完成该槽位板卡更换后,故障消失。
注意事项
1、在日常维护中,需要加强对设备故障信息的感知,按周或按月对汇聚层设备做相应的硬件、软件检查,发现异常情况,及时处理。
2、定期进行倒换测试,暴露问题及故障点,并按要求整改。