服务热线
189-2347-0832

中兴S385 您当前所处位置: 首页 > 新闻资讯 > 行业技术

SSN2EGS2数据调度器锁死导致业务中断问题分析

发布时间:2018-05-11

问题描述

现网ssn2egs2配置EVPL点对点业务,在不同的端口配置不同优先级的数据业务流,port1端口配置高优先级数据业务,在业务持续运行一段时间以后,port1端口业务出现中断。

问题主机版本软件:v1r6c01b01d(5.21.16.12)

单板软件版本:

单板BIOS:2.14

单板软件:3.12

逻辑版本:

(u5)300

(u41)210

(u42)210


处理过程

采集信息后立刻进行分析,具体分析结果如下:

采集脚本在5分钟之内共查询单板剩余信元数12次,查询值都没有变化,怀疑交换网堵塞。

ethn-debug:$bid#,"np3454fabric_reg_readCDCNT"

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc

:CDCNT[1]=0x00000cdc


进一步查询单板入端口数据库,发现RGGI1端口占用大量信元InPort[0x3].IPECNT=0x017e

且STREAMID=2,具体信息如下:

InPort[0x3].IPCP=0x0c52

InPort[0x3].IPCO=0x0000

InPort[0x3].IPHP=0x0c52

InPort[0x3].IPECNT=0x017e

InPort[0x3].IPSID=0x0002

InPort[0x3].IPPCCNT=0x0001

InPort[0x3].IPST=0x0000

InPort[0x3].IPTYPE=0x0002

InPort[0x3].IPLOAD=0x0000


STREAMID=2所表示具体含义如下:

1>业务方向为RGGI1->PORT1

2>业务为单播业务或(广播业务学习成单播)

3>业务等级为高优先级,端口采用SP(绝对优先级)调度器


根因

SN2EGS2单板由于PORT1口存在高优先级业务,且该业务将采用绝对优先级调度,使得其它低优先级业务无法得到调度,持续一段时间,端口调度器锁死,该端口信元无法被释放,业务不能及时得到调度,导致交换网拥塞,进一步导致该端口业务中断,该问题是由单板软件BUG所导致。


建议与总结

首先确定交换网络是否存在拥塞风险,利用研发提供的查询命令如下:

:ethn-debug:bid,"np3454fabric_reg_readCDCNT"//bid表示槽位号

:CDCNT[1]=0x00000cdc//返回值

连续下发上述命令,正常情况下,返回值为0xffc或者在0xffc附件抖动,或者是一个不断变化的值如果返回值长时间为0或者某个固定值(非0xffc),表明交换网异常。

如果存在异常:

1.提供规避方案,具体方案为:不配置任何COS,所有端口只存在一种业务等级(低优先级)。

2.根据研发建议,在新版本v1r7c02b016(5.21.17.30)中解决,配套升级单板软件版本如下:

单板bios:2.14/2.2.19

单板软件:5.3

逻辑版本:

(u5)310

(u41)210

(u42)210