问题描述
客户新部署若干个OSN6800站点,在网管上无法进行这几个站的WDM业务查询,网管上报“Path does not exist, error code 1090592809”。也不能配置TN11TOM到TN12ND2的板间交叉业务,上报“invalid port ID”。网管版本T2000V2R7C03。
处理过程
1、从网管上来看,其他网元的业务查询均正常,只有这个几个新网元有问题。怀疑是网管上配置与实际网元不一致。对这几台网元做数据上载后,问题仍然存在。
2、怀疑网管数据库异常,尝试重启网管服务器后,问题仍然存在,排除网管问题。
3、重新审视该问题现象,发现有问题的网元均有TN11TOM板,而且TOM板和ND2板的板间业务配置失败,但是工作正常的网元都没有这种单板。可见该问题和TN11TOM有一定的联系。
4、通过命令行查询问题网元的交叉,发现TOM板内部存在大量的板内交叉(见附件)。这就可以解释为什么TOM板到ND2板的交叉不能配置,因为交叉资源已经被占用。那么为什么在网管上查询交叉配置失败呢?
5、通过波分和网管的研发联合定位,发现原因。网管的TN11TOM单板光口模型和主机的TN11TOM单板模型不一样。主机支持ODU1LPx.1和ODU1LPx.2的通道,而网管只支持ODU1LPx.1的通道,不支持ODU1LPx.2的通道,在网管上查询和配置涉及到有ODU1LPx.2的交叉时,网管U2000V1R2C00之前的版本需要校验交叉资源,由于网管上不存在ODU1LPx.2的通道,所以校验失败,上报“Path does not exist, error code 1090592809”的错误。
6、附件中TN11TOM板内部的交叉是单板作为级联模式时的内部交叉,这些交叉是生产过程发货环节测试后没有删除而留下的。从中我们可以看到ODU1LPx.2到ODU1LPx.2的OTU1级别的交叉,而当前网管不能识别,这就是问题所在。
7、经过网管开发确认,网管从U2000V1R2C00之后就不再校验交叉资源,使用此网管之后的版本查询odu1lpx.2的通道都不存在问题。在实验室做现网相同的交叉配置,使用网管U2000V100R002C01SPC003版本可以正常查询。
根因
定位思路:
1、是否是网管问题?
2、是否是网元问题?
3、是否是网元和网管的配合问题?
常用定位手段:查看配置是否正确(网管和命令行采集)、配置复现问题(网管和命令行)、上载、重启网管,重启网管电脑,命令行查看网元日志等等。如果是产品配合问题,需要联合不同产品的研发共同定位。
建议与总结
1、问题定位要保持思路清晰。
2、建议生产测试环节避免板内有交叉残留。