问题描述(故障现象)
某移动本地网网元某日出现一个汇聚环子网除网头一台中兴S385网元以外,其他网元全部断链的故障。网管通过交换机和网头ZXMP S385直连,可以ping通并能正常telnet,但其它网元都不通。
原因分析
1、telnet到这台中兴S385,if -a查看所有光接口都学习不到对端网元接口IP,route -a查询不到一条路由。
2、复位和更换这台中兴S385的NCP,故障依旧。
3、怀疑这台ZXMP S385其它光接口单板有故障,影响了ZXMP S385的ECC开销总线。但是从当前告警和历时告警均看不出任何光接口板有异常告警,业务也是正常的。
4、采用a-get-reset命令发现12槽位OL1*8板近期有反复自动复位的记录,而其它单板没有这种现象。将这块单板进行硬复位,结果待这块OL1*8重启完成后,该网元ECC通道恢复,所有网元监控都恢复正常。
解决方案
ZXMP S385光接口板故障引起网元ECC通道的故障比较罕见,但也会发生。发生后往往不知道是哪块单板引起的。这时可以采用以下方法来识别:
1、首先排除没有ECC通道功能的电口板、MSTP单板。
2、使用a-get-reset检查单板的状态是否有反复复位的情况。
3、如果还是找不到原因,只有一块一块的插板单板,直到监控恢复,一般情况光接口数量较多的单板,出现ECC通道故障的概率会大一些可以考虑先复位。