问题描述
FIU,ITL和VA4同时上报COMMUN_FAIL告警,单板都能查询到物理板,但无法查询单板制造信息,无法对单板进行管理。网元版本为5.51.4.13SPH105
告警信息
COMMUN_FAIL
告警参数均为:0x01 0x00 0x03 0xff 0xff
处理过程
1 、更换AUX,故障现象依旧
2 、主控板主备倒换后,故障现象依旧
3 、更换FIU和ITL单板,COMMUN_FAIL告警依然不消失,且FIU无法查询到物理板。将换下来的单板插到其他子架上能够正常添加物理板,无任何异常。将新单板插到出故障的子架的空槽位后,依然无法看到物理板。
4 、经过最终分析认为由于上报告警三块单板均为无CPU单板,其软件运行在主控上,通过更换单板的操作可以确认几块单板本身没有问题,而其它的空槽位插上新的FIU后依然无法看到单板,故障原因可能是主控挂死导致的问题或是背板故障,更换槽位可以排除母板问题,因而主控挂死可能性较大。
5、删除SPH105补丁后,打上研发提供的SPH602补丁,软复位主控后,COMMUN_FAIL告警全部消失,恢复对FIU,ITL和VA4三块单板的管理,问题解决,问题可确认为主控挂死导致。但由于SPH105补丁规避了很多问题,所以问题解决后,删除SPH602补丁,重新打上了SPH105补丁。
根因
1 、AUX故障
2 、SCC故障
3 、单板故障
4 、软件问题
5 、背板问题
建议与总结
5.21.4.13SPH105等老版本有很多遗留问题,建议升级到5.51.5.35SPH810。