问题描述
国内某项目内G局点OSN8800 T32(版本为5.51.08.32)子架上21和23槽TQX单板多次出现无故上报BD_STATUS告警,导致客户侧业务中断。
告警信息
TQX单板上报 BD_STATUS告警
处理过程
1. 如果是AUX单板和所有业务单板均上报BD_STATUS告警,且业务正常,SCC单板工作正常,则可能是AUX单板故障。此次故障现象为其中两块业务单板出现离线告警,且业务中断,故首先排除AUX单板故障。
2. 工程师赶往局点后发现从外观看单板插放在子架导轨内正常,但是单板状态指示灯异常。
3. 将21-TQX插到空闲31槽位,能正常开工,长时间观察无问题。说明21-TQX单板硬件无问题。
4. 将23-TQX插到29槽位,能正常开工,长时间观察无问题。说明23-TQX单板硬件无问题。
5. 将27-TQX插到21槽位,开工不久后也报BD_STATUS告警。说明该问题跟背板槽位有关。
6. 通过Navigator 登陆设备后,导出log日志,查看21-TQX单板 EQPT日志,发现单板在上报BD_STATUS告警的时间点,检测到多个背板状态异常:总线故障、交叉板38M时钟异常、主控38M/2K时钟异常。说明当时背板状态出现异常
7. 同时查看23-TQX单板的 EQPT日志,也发现单板检测到多个背板状态异常:总线故障、交叉板38M时钟异常、主控38M/2K时钟异常,且由于AFB_TYPE变化导致单板软件主动复位,说明背板状态出现异常或者AUX转发背板类型异常。
8. 经查看单板原理图,以上状态线均来自单板最下方连接器。出问题的信号线均在同一个连接器上。故判断此问题为背板连接器异常,经OTN硬件研发确认为背板最下方连接器导致。
9. 查看其他槽位25、27的日志,也发现背板总线异常的记录,进一步确认背板存在问题。
10. 重新更换子架后,问题得以解决。
根因
单板不在位告警,导致与该单板有关的功能失效。
可能由如下原因造成:
1. AUX单板故障。
2. 已经配置逻辑单板,物理单板未插入对应槽位;
3. 单板插头与背板插座间松动;
4. 单板故障。
5. 背板故障。