问题描述(故障现象)
本月对某运营商本地网中兴ZXMP S385网元做系统软件版本升级,先远程升级C2网元主控板NCP程序,当执行d-try 1 18 1 –p命令后C2网元一直是灰的(正常几分钟应该变绿),与之连接的接入网元A2上报12#OL16的DCC连接失败告警,E300服务器客户端网管ping不通该网元。
组网环境
C2为中心局A2网元(扩架)支链点
原因分析
可能的原因有
1、C2网元NCP单板升级过程中内存出问题
2、C2网元某槽位单板影响了ECC总线
3、C2网元NCP软件或硬件故障
4 、C2网元与A2网元互连的光板问题导致ECC不通
解决方案
1、首先查看C2网元与A2网元互连的光板(有2块光板直连,C2的7#-A2的12#,C2的10#-A2的15#)是否做了DCC端口屏蔽,发现A2的15#和C2的10#端口是屏蔽了DCC的,只打开了C2的7#和A2的12#OL16。考虑到是中心局的扩架带有大量业务,没有去复位A2的12#OL16光板。由于网管远程ping 不通,只好到C2机房现场处理。
2、在C2机房现场,将NCP拔出,拨码到download状态进行初始化,然后用笔记本电脑本地做软件版本升级,进行到d-try 1 18 1 –p NCP复位后,从E300服务器客户端网管看C2网元还是灰的,ping C2网元IP地址不通。本地电脑可以ping通,但telnet上去很缓慢,决定对NCP进行格式化。格式化NCP后重新上传程序,等待NCP跑起来,本地电脑顺利telnet网元,用d-get-status查看状态正常,但E300客户端网管仍ping不通该网元。
3、这时怀疑NCP软件或硬件故障,让用户找一块NCP备件更换。更换NCP并初始化后还是在本地进行版本升级,同样是本地可以telnet上去而客户端网管ping不通网元。
4、启动本地电脑E300恢复服务器备份的数据,登录GUI,看到C2网元变绿,下载数据库后发现该点NCP上报所有槽位单板脱位或板类型未知以及7#光板DCC连接失败的告警,面板上单板指示灯全部是黑点。根据以前经验,感觉是某单板槽位影响了ECC总线。先试着拔插NCP旁边的OW单板(这样操作不会影响客户业务),结果不一会儿单板脱位(板类型未知)、DCC连接失败等告警全部消失,E300服务器客户端网管也可以正常监控C2网元了。
注意事项
在ZXMP S385网元NCP版本较低时有时会出现上述故障现象,建议升级NCP/ENCP到最新版本。