• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

  • 15088181811
您当前所处位置: 首页 > 新闻资讯 > 中兴案例

ZXMP S385网元查询不到光板在某个时间段的收发光功率

发布人:华讯佳 发布时间:2022-05-10 浏览数:

问题描述(故障现象)

某U31网管管理了很多承载网设备,有MSTP设备、DWDM设备、PTN设备、R10设备。日常维护时,检查MSTP设备光口的收光功率,发现有一端中兴S385设备在一天内总有一个或者两个历史15分钟性能查询不到。

例如,查询该网元的11#OL64的端口1在4月4日的历史15分钟的收光/发光功率,发现9:00~9:15、9:15~9:30的这两个15分钟历史性能查询不到。


原因分析

中兴S385设备光板的收发光功率等15分钟性能首先保存在主控NCP板的内存里。该网元配置的主控板是ANCP板,其内存是512M,内存容量是有限的。因此NCP板采用绕接的方式保存历史15分钟性能,即当内存存满了数据以后,后续时间的15分钟性能数据将覆盖先前时间的15分钟性能数据。

U31网管(12.14及之前版本)从服务器正常运行开始后,每隔2小时会主动从设备的主控板NCP板上采集历史15分钟性能。U31网管(12.15及之后版本)每隔1小时会主动从设备的主控板NCP板上采集历史15分钟性能。

U31网管上查询不到该中兴ZXMP S385设备光板的某个时间段的15分钟性能,有两个可能:一是ANCP板在那个时间段发生了复位,导致内存中的性能数据丢失,这样U31网管肯定采集不到了。二是U31网管还没有来得及从NCP板上采集性能数据,该时间段的15分钟性能数据在NCP板的内存里就被后续时间段的15分钟性能数据给覆盖了。

Telnet上该ZXMP S385的ANCP板,输入a-get-resetall,查询所有单板的复位记录,发现在性能丢失的时刻,ANCP板并未复位。

运行GDownload软件,连接到该S385设备上进行抓包,成功抓到了15分钟性能丢失时的数据包。经过研发分析,发现在那个时间段,ANCP板的内存接收到了大量的15分钟性能数据,导致U31网管还没有来得及从ANCP板上采集15分钟性能,该时刻的15分钟性能数据就在ANCP板的内存里被后续时间的15分钟性能数据给覆盖了。

该端S385设备上配置了6块SEE板,设备的面板图如下,每块SEE板启用的的以太网用户口、VCGEOS端口都会上报15分钟性能项,这样6块SEE板上报给ANCP内存的15分钟性能数据就会很多。


解决方案

通过屏蔽业务板上报的15分钟性能项,减少业务板上报给ANCP板的15分钟性能的数据量,尽量延长ANCP板内存里的15分钟性能被绕接的时间间隔,从而保证U31网管能够及时的采集到该网元所有时间段的15分钟性能数据。

由于SEE板上报的15分钟性能项很多,因此对SEE板设置性能屏蔽。但是SEE板的哪些性能数据可以被屏蔽呢?这是一个矛盾的选择。因为性能数据对以太网业务故障的分析判断至关重要。通过对SEE板上报的性能数据进行分析,和研发沟通后,确定下列性能项可以被屏蔽。

SEE板以太网用户口可以屏蔽的性能项(共10项)

接收长度128-255字节帧数

接收长度256-511字节帧数

接收长度512-1023字节帧数

发送长度128-255字节帧数

发送长度256-511字节帧数

发送长度512-1023字节帧数

接收绿色业务字节数

接收黄色业务字节数

发送绿色业务字节数

发送黄色业务字节数

SEE板VCGEOS端口可以屏蔽的性能项(共10项)

接收长度128-255字节帧数

接收长度256-511字节帧数

接收长度512-1023字节帧数

发送长度128-255字节帧数

发送长度256-511字节帧数

发送长度512-1023字节帧数

接收绿色业务字节数

接收黄色业务字节数

发送绿色业务字节数

发送黄色业务字节数


这些性能项可以被屏蔽的理由是:

1.长度为128-255字节的帧、长度为256-511字节的帧、长度为512-1023字节的帧都是业务数据的帧,不是协议帧,这些帧对以太网故障的分析判断作用不大。

2.性能项中已经包括有“接收/发送绿色/黄色业务帧数”、所以“接收/发送绿色/黄色业务字节数”可以被屏蔽。在对故障做分析处理时,关注绿色/黄色业务的帧数即可,绿色/黄色业务的字节数可以忽略掉。

现场对这6块SEE板中的已经开通业务的以太网用户口、VCGEOS端口逐一屏蔽上述10项性能项后,经过几天的观察,该网元再也没有出现历史15分钟性能丢失的情况,故障解决。


注意事项

对于中兴S325/S330/S385/S390/设备,主控板保存的历史15分钟性能记录数最大为5000条。如果所有业务板一次性上报的性能数超过了5000条,就会覆盖掉主控板上一个15分钟保存的性能项。