问题描述(故障现象)
某站点ZXMP S330设备异常掉电,重新加电后,除NCP运行状态正常外,其它单板全部运行不正常。表现为2M支路板、SFE以太网板、SC时钟板RUN灯常亮,CSB交叉板状态灯显示不断自检复位。
原因分析
1、由于故障引起原因为异常掉电,一开始怀疑电压不够,导致单板供电电压异常,现场测试两路直流电为53.5V,供电正常;
2、根据单板状态灯,怀疑是否NCP数据丢失,重新对NCP进行初始化故障依旧,更换NCP后仍未解决;
3、将所有单板拔出后,只保留NCP单板,待NCP单板正常从网管上监控后,只插入某一块单板,仍然无法自动发现也检测不到单板类型;
4、仔细分析网管NCP告警对2M支路板、SFE以太网板、SC时钟板、CSB交叉板上报板类型未知,对OW上报软件运行不正常,查询所有单板实安板为未知单板。通过TELNET到NCP单板后,查询各槽位单板版本,无法获取。
5、进一步分析NCP对各单板的通信及检测机制,要保证所有单板正常和NCP通信,必须保证时钟板SC首先能够正常运行,故最后只保留SC单板和NCP单板插入,但是仍然无法正常工作。
6、难道两块SC时钟板都有故障,还是背板总线出现了问题。为进一步确认是否和背板有关系,对SC时钟板进行了更换,更换时钟板后,所有单板恢复运行正常,NCP可以正常检测通信。
解决方案
通过以上对故障的处理过程,定位故障原因是两块SC时钟板故障,导致NCP单板对所有单板无法正常通信。通过更换时钟板SC后故障解决。