知

CloudOS单机故障，备份系统文件重装恢复

CloudOS

2018-08-24 发表

0关注
0收藏 1563浏览

祁成文

祁成文六段

粉丝：4人关注：0人

组网及说明

标准云网融合解决方案，本次恢复以CloudOS E1138H02为例，故障状况为CloudOS操作系统可用，但由于Docker元数据损坏导致所有容器无法启动，无法正常进入容器备份数据，且现场没有可用的通过安装部署平台进行的CloudOS备份，只能通过在操作系统中备份文件来手动恢复。

配置步骤

· 备份数据

备份以下4个目录下的所有文件

PGSQL（/var/lib/pgsql/data）

Glance（/var/lib/glance）

Param-etcd （/param-etcd.etcd）

所有的yaml文件（/opt/bin/confFile）主要需要计算节点的yaml文件，用于新建RC

使用“tar -zcvpf XXX.tar.gz 文件夹”归档压缩备份，以免出现文件所属和权限变更。

· 重新安装CloudOS服务器

使用相当版本镜像重装CloudOS操作系统，并在安装部署界面完成安装部署（不配置计算节点）

· 恢复Glance

直接将备份的镜像拷贝到重新安装的节点的/var/lib/glance路径下

· 恢复Param-etcd参数容器

a. 将节点的param-etcd服务停掉

systemctl stop param-etcd.service

b. 将备份的参数容器文件拷贝至根目录

c. 主节点修改参数容器启动脚本etcd-param.sh内容（注意添加时上一行的末尾有换行符\）

vim /opt/bin/shell/etcd-param.sh中添加--force-new-cluster

[Service]

Type=notify

EnvirOnmentFile=-/etc/sysconfig/kube-etcd-cluster-param

ExecStart=/opt/bin/etcd \

--name=\${ETCD_NAME} \

--initial-advertise-peer-urls=\${ETCD_INITIAL_ADVERTISE_PEER_URLS} \

--listen-peer-urls=\${ETCD_LISTEN_PEER_URLS} \

--listen-client-urls=\${ETCD_LISTEN_CLIENT_URLS} \

--advertise-client-urls=\${ETCD_ADVERTISE_CLIENT_URLS} \

--initial-cluster-token=\${ETCD_INITIAL_CLUSTER_TOKEN} \

--initial-cluster=\${ETCD_INITIAL_CLUSTER} \

--initial-cluster-state=\${ETCD_INITIAL_CLUSTER_STATE} \

--force-new-cluster

Restart=always

RestartSec=10

d. 执行参数容器启动脚本etcd-param.sh：

sh /opt/bin/shell/etcd-param.sh

· 恢复Postgresql

a. 关停所有pod

for rc in `/opt/bin/kubectl --server 127.0.0.1:8888 get rc |grep -v CONTROLLER | awk -F ' ' '{print $1}'| tr -d '\r'`;do /opt/bin/kubectl --server 127.0.0.1:8888 scale --replicas=0 rc $rc;done

b. 替换/var/lib/pgsql/data下所有文件，注意替换前后的文件权限和所属，如不一致将导致Postgresql容器启动失败

c. 按照顺序启动Postgresql、rabbitmq、其他所有服务

/opt/bin/kubectl --server=127.0.0.1:8888 scale rc postgresqlrc --replicas=1

· 恢复计算节点

a. 将备份的/opt/bin/confFile目录下对应的计算节点的yaml文件拷贝到重装后的CloudOS对应路径下

b. 分别执行命令恢复所有计算节点

/opt/bin/kubectl --server=127.0.0.1:8888 create -f XXXX.yaml

· VCFC插件升级

按照开局指导进行VCFC插件升级操作，并进行容器固化

配置关键点

重装系统后，在替换文件时候注意替换前的文件路径和权限一致，否则会导致恢复后Docker无法启动的问题。例如数据库路径/data下的文件，所属用户为“26”

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

作者在2019-06-11对此案例进行了修订

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 知了APP下载; 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

CloudOS单机故障，备份系统文件重装恢复

组网及说明

配置步骤

配置关键点

编辑评论

提出建议