• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

  • 15088181811
您当前所处位置: 首页 > 新闻资讯 > 中兴案例

ZXMP S385基础网接入网元数据无法上载等异常问题

发布人:华讯佳 发布时间:2022-05-07 浏览数:

问题描述(故障现象)

设备调试过程中发现,

1)通过DCN互联的芜湖网元无法上载数据,提示“由于命令锁已被获取,尚未释放,该命令暂时无法下发”,网元能够正常PING通;

2)尝试TELNET到网元查看数据,能telnet进去,但是无法执行操作命令;

3) 另外,接入网关网元“1140芜湖”,不时上报断链告警,网管做网元时钟配置查询,网元时间管理查询,数据比较等操作基本都是超时;但拼该网元一直正常,且其他非网关网元做各项查询都正常。


组网环境

网管服务器在上海,通过DCN网络与芜湖的中兴ZXMP S385设备互联,芜湖中兴S385下挂各个方向的网元。


原因分析

前期分析:

1、怀疑是接入网元NCP单板问题,现场通过网管接入到设备能够正常上载数据和监控,说明NCP单板没有问题;

2、原先设置了网关网元,取消了网关网元和NCP单板设置的静态路由,网管服务器能够PING通该网元,无法上载数据

3、与该网元互联的所有设备(即非接入网元)都监控正常,上载数据都正常;

4、怀疑服务器问题,在网管中心用笔记本连接上去故障现象一样;

5、怀疑是DCN通道问题,但是其他网元能够正常监控,只有接入网元不能监控,咨询用户该DCN通道只给我们SDH使用,没有做任何的端口屏蔽设置。

本次分析:

首先,我们抓取了接入网元出现异常时的网管日志信息,并反馈给网管研发。经过网管研发的分析,“获取锁失败”错误提示是由于网元建链后触发刷新同步命令84212,下发命令后设备无应答,一直卡住,其他要获取线程互斥锁的命令也无法执行。从日志中看,网管没有收到设备方面发来的应答,并且也没有收到设备发来的ping包。因而,超过一段时间后网管断链重连,不断重复。因此,网管研发的结论是:肯定不是网管问题,需要排查设备及DCN网络问题。但前期已做过设备端的测试,是正常的。因此,我们将重点放在了与设备对接的DCN网络方面。

其次,通过与设备研发的沟通,我们制定了测试抓包方案。

从上海网管侧抓包来看,收到设备的序列号为0xc0814877的报文后,再也没有收到该设备任何报文,等待4分钟后网管断链。


解决方案

从接入网元和非接入网元抓的报文比较,发现非接入网元发送的980字节的包,都会发送成功,而接入网元在发送1460字节的包时,每个包都会发送失败,应该是DCN转发不了1460的包,需要排查一下DCN网络,看允许通过的最大包是多少。

通过本次的抓包及测试分析,我们可以得出结论:网管在对接入网元进行操作出现异常的原因是接入网元发出的1460字节包在DCN网络上转发出现了异常。

从华三数据工程师处了解,DCN网络的路由器间转发数据设置的MTU值为1492,且路由器不具备分片帧功能。从抓包和ping包测试的结果来看,当我司设备发送的大包通过DCN路由器封装后转发,其帧长度很可能超过了1492,这就可能导致被丢弃。

因此,需要华三设备工程师再分析排查:

1) 我司发送的1460大包在华三设备是如何传递的,请抓包分析;

2) 华三路由器是否可以提供分片帧功能;若路由器不能提供该功能,可以考虑在接入网元接入DCN路由器前增加一台支持分片帧功能的交换机,也能解决这个问题;

华三路由器的MTU是否可以进行调整;(与华三工程师交流,了解到华三的路由器之间是通过我司的数据板对接的。之所以设置为1492,是因为我司设备的数据板不支持超长帧。但我司设备的数据板是支持超长帧的,若有需要可以进行单独测试。)