服务热线
189-2347-0832

中兴S385 您当前所处位置: 首页 > 新闻资讯 > 行业技术

OSN6800设备数据库异常处理方法

发布时间:2018-04-10

问题描述

OSN6800设备,主机版本5.51.4.24,网元上报DBMS_ERROR告警,告警参数为0x070x000x000xff0xff,业务配置为ODU1SNCP保护业务。


告警信息

网元上报为DBMS_ERROR,告警参数为0x070x000x000xff0xff


处理过程

1、使用工具上载数据库包,备份当前的网元配置,以备如下操作出现异常后能够尽快恢复配置

2、禁止周期备份,使用命令:dbms-set-cyclebackup:disable,:dbms-set-autobackup:disable

3、先删除主板的fdb数据库,使用命令:dbms-delete-data:fdb0,:dbms-delete-data:fdb1

4、打开周期备份,使用命令:dbms-set-cyclebackup:enable,:dbms-set-autobackup:enable

5、设置周期备份时间为5分钟,等待5分钟后,周期备份完成,使用命令:dbms-set-backupperiod:dbms,5

6、使用命令查看/dbms/db/下面是否拷贝了数据库过去,使用命令:sftm-show-dir:bid,”ofs1/dbms/db”:sftm-show-dir:bid,”ofs2/dbms/db”

7、如果发现周期备份,拷贝数据库到FDB中,再将周期备份时间设置为30分钟,命令:dbms-set-backupperiod:dbms,30

8、先将内存数据库拷贝到fdb0,:dbms-copy-all:drdb,fdb

9、检查校验数据库,dbms-auto-inspection

10、比较2个区的数据库:dbms-compare-all:fdb0,fdb1

完成上述操作后,数据库恢复正常,告警消失


根因

通过告警参数可以知道:数据库校验时,FDB0列表文件获取失败,从而上报DBMS_ERROR告警,获取fdb0列表文件失败是因为:当时正在周期备份数据库,周期备份时,首先会删除fdb0的列表文件,再将数据库文件备份到fdb0,最后生成fdb0的列表文件;然后再以同样的流程备份fdb1。在校验fdb0区域数据库时,遇到周期备份也在备份fdb0区域,此时fdb0区域列表文件被删除,使得区域校验获取列表文件信息失败,导致数据库校验失败。

综上所述,问题原因为巡检时使用命令dbms-auto-inspection校验数据库,而此时好遇到数据库周期备份,导致校验失败上报告警。


建议与总结

在巡检校验数据库前,请先关闭数据库的自动备份开关,数据库巡检完成后再打开即可

关闭备份:

:dbms-set-autobackup:disable

:dbms-set-cyclebackup:disable

打开备份:

:dbms-set-autobackup:enable

:dbms-set-cyclebackup:enable