问题描述(故障现象)
某市移动客户于报2G基站频繁闪断的问题
组网环境
设备类型:ZXCTN 6500-8
版本:V2.10R3B87
业务单板:PCGA
光模块类型:40km,10通道,CFP
原因分析
2G基站频繁闪断的原因来自于业务所经的100G光链路上存在CRC误码,CRC误码较高引起断站
解决方案
1. 现场随机抽取几条闪断的2G业务做分析,检查历史告警,检查业务路径后确认共性,发现其经过一条100G链路,100G链路上存在告警,
告警码1:物理接口接收丢弃帧越限;告警码2:物理接口接收校验帧越限。
2. 现场检查100G光链路上承载近100条2G业务,2G业务出现部分闪断,但是同时承载的4G业务不受影响
3. 将100G链路上的2G业务做隧道迁移,迁移至另一条路径,2G不再出现闪断
4. 性能检查,以15分钟粒度,近两天8511节点100G端口上存在大量的CRC误码,误码远超门限值1000
5. 65健康检查工具未能检查出异常
根据以上测试,基本可以推断光链路误码致2G业务出现闪断
注意事项
1. 2G业务较4G业务敏感,链路CRC误码、丢包、时钟频率不同步、光功率不达标等均有可能导致2G业务出现闪断,现场遇到2G业务闪断而4G不断的情况下应优先考虑是否为此类问题
2. 现场可以通过临时迁移路径的测试方法来判断具体故障路径
3. 光功率过强和过弱均有可能出现CRC误码,光功率统计时应重点关注每通道收光
附100G光模块光功率值:
100G 10KM 4通道光模块接收光功率指标要求:
Average receiver power per lane Rpow -10.6 4.5 dBm 单通道光功率为-10.6db到4.5db
100G 40KM 4通道光模块接收光功率指标要求:
Average receiver power per lane Rpow -20.9 4.5 dBm
100G 10KM 10通道光模块接收光功率指标要求:
Average receiver power per lane Rpow -10.8 3.5 dBm
100G 40KM 10通道光模块接收光功率指标要求:
Average receiver power per lane Rpow -17.9 -6.0 dBm
4. CRC误码的端口可通过自环确认,自环时应注意加光衰,避免烧光模块,通过自环去发现端口CRC误码是否增加,最终确认到光模块存在硬件隐患,更换后即可解决