建议联系办事处协助
备份失败提示 "PostgreSQL backup script execution failed" 的可能原因及处理建议如下:
主要原因及解决方案
1. License授权异常
影响:控制器未获取有效授权时,备份功能会失败。
操作:
登录AD-Campus,进入 系统 > License管理,检查以下三个License的状态和授权数量:
UCENTER-UCENTER-EIP-NLIC
UCENTER-UCENTER-EIA-LIC
UCENTER-UCENTER-EIA
确认License Server连接正常(参考 表1-4 检查License Server状态)。
案例参考:现场因License Server连接异常导致备份失败,修复后恢复正常。
2. 备份文件损坏或版本不匹配
影响:传输过程中的文件损坏或跨版本恢复会导致脚本执行失败。
操作:
重新生成备份文件,确保传输完整(校验MD5值)。
确认备份文件版本与当前环境严格一致(参考案例:版本不一致或文件异常会导致恢复失败)。
3. 数据库状态异常
影响:数据库空间不足、表损坏或进程异常会中断备份。
操作:
检查PostgreSQL日志(路径通常为/opt/postgresql/log),定位具体错误。
若日志提示空间不足,清理磁盘或扩容(参考 表1-2,确保备份目录空间≤50GB)。
若存在数据库质疑(如日志提示ERROR: could not access file),尝试修复:
sql
-进入紧急模式
ALTER DATABASE [数据库名] SET EMERGENCY;
-执行修复(可能丢失数据)
DBCC CHECKDB ([数据库名], REPAIR_ALLOW_DATA_LOSS);
4. 集群或POD状态异常
影响:后台POD异常会导致备份进程无法启动。
操作:
执行命令检查POD状态:
kubectl get pods -A | grep -E "postgres|backup"
若有POD状态非Running或重启次数过高(>10次),根据日志排查组件故障(参考 表1-3)。
重启异常POD:
kubectl delete pod [POD名称] -n [命名空间]
快速自检步骤
1. License检查 → 2. 备份文件校验 → 3. 数据库日志分析 → 4. 集群POD状态确认
若按上述步骤仍无法解决,请提供以下信息进一步定位:
PostgreSQL错误日志片段
kubectl get pods 输出结果
License管理页面截图
注意:涉及数据库修复操作可能导致数据丢失,建议在H3C工程师协助下执行。
PostgreSQL备份脚本执行失败时,可按照以下步骤排查和解决:
1. **检查备机自动恢复脚本是否已关闭**
主机故障期间,若备机正在运行,需先关闭自动恢复脚本,防止冲突。
操作:进入 `/root/cold_dr.v3` 目录,执行 `sh undo_cold_dr.sh`,关闭定时恢复任务。
2. **检查 Manager HA 状态及 pingCheck**
确认备用节点正常启动且网络通畅后,检查 HA 状态:
- 若 `pingCheck` 异常,执行 `sudo crm resource cleanup pingCheck` 清理资源状态。
- 若仍异常,检查网络连通性。
3. **重建 PostgreSQL 主从复制备份**
在备用节点执行修复脚本:
```bash
sudo /.hde/cls_rebuild_slave.sh <masterIP>
```
其中 `<masterIP>` 为当前 Manager 主节点 IP,以重建 PostgreSQL 流复制基础备份。
4. **验证 PostgreSQL 状态**
重新检查 Manager HA 状态,确认 PostgreSQL 复制关系已恢复正常。
完成上述步骤后,再次尝试执行 PostgreSQL 备份脚本。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论