问题描述(故障现象)
某运营商地市公司本地网SDH设备ZXMP S385进行版本升级,升级主控NCP单板,下载网元信息表报失败。
原因分析
关于主控Ncp程序升级成功后,下载网元信息表失败的情况,从来没有遇到过,分析怀疑主控单板CPU冲高或其它原因。
解决方案
首先NCP试运行是成功的,激活也是成功的,因此可以排除程序文件出错的可能性,一般程序大小或错字节的问题,在试运行就会失败。其次用网管ping测试网元地址,也能ping通,通讯是正常的。
然后分析下载仅仅是网元信息表,其内容相当小,网管提示是下载超时,也就是说设备没有反馈成功的信息。在下载失败,网元有短暂脱管,上线后再进行下载仍然失败。
为了查明原因,通过对比下载成功的网元和失败的网元,在telnet的表现,发现下载失败的网元,telnet后,响应非常慢,几分钟才回显字符。这种情况要么是设备CPU满负荷了或网络传送问题。我们进行故障网元和正常网元ping测试,发现了故障网元ping回应延时非常大,在几千毫秒,而正常网元在0点几毫秒,因此判断网络存在较大延时,导致下发超时。
网络延时,是在客户DCN网上,网管到设备之间的通讯是由DCN负责的,所以是客户DCN出现的故障。在等了一段时间,ping测试延时恢复正常。再进行下载就成功了。
注意事项
在网元主控升级后,下载数据库,通讯网络的延时导致下载失败,也是一个比较少见的原因。希望对大家在遇到类似问题提供一个分析的思路。往往我们会忽略了网络没有中断,但较大的时延会导致设备和网管通讯故障。