• 您好!欢迎进入深圳市华讯佳科技有限公司官网!

    15088181811
您当前所处位置: 首页 > 新闻资讯 > 华为案例

网元光口通过的网元数目过大导致部分网元频繁脱管

发布人:华讯佳 更新时间:2023-12-21 点击数:

问题描述

城域网A,B,C3个网元组MSP环。ECC组网情况是A网元OSN7500是网关网元,下带另一个OSN7500网元为B网元,C网元虽然与A网元光口互连,但属于另一个ECC子网,A,C之间ECC通道关闭。某日B网元,以及B网元下挂的其中几十台网元M1000V3,OSN1500等设备频繁脱管,脱管后在网管上点右键登陆,网元又能正常登陆,但约5分钟后又脱管。网关网元正常。


告警信息

网元脱管


处理过程

1、由于头天晚上凌晨对A,B,C三个网元做过升级操作,因此首先怀疑升级后将ECC打开,未能关闭,造成了ECC互通,引起ECC震荡,仔细检查ECC端口,并将ECC关断处理后,设备依然脱管,在ECC链路网元数里查看目标网元数恒定270个,刷新也不发生变化,排除ECC震荡的可能。

2、分别对A,B网元的主控单板进行软复位操作,故障依旧,采用便携导入数据库监控网元,现象依旧,排除网管问题。

3、观察ECC链路网元数发现A网关网元下挂的非网关网元除了几个网元之外,其余网元都通过B网元转发,怀疑B网元光口通过的ECC流量过大,因为A,B网元ECC通信仅通过一个光口,与案例号:SC0000550287所诉类似。准备照案例方法处理,但仔细核查发现A网元下带的网元ECC通信仅能通过B网元转发,通过C网元虽然也能转发部份网元,但C网元属于另一个ECC子网,如果将A-C之间ECC打开又怕引起ECC风暴,后将A-C之间的对应光口做D1-D3字节的ECC透传,网元ECC路由根据跳数重新刷新,一部份网元通过C网元转发,分担了B网元的光口负荷,网元脱管问题解决,观察半个小时,网元不再脱管。


根因

1、网关网元下挂的网元数过多,造成ECC震荡。

2、网管问题。

3、设备故障,网元ID重复。

4、其他


建议与总结

现网设备规模越来越大,ECC划分的不合理容易导致ECC风暴,网元脱管,需要注意某个光口管理的网元数目,一般应该是100以内,遇到ECC关断不能立即解决的问题,可考虑ECC透传临时解决。