副本:将原始数据复制多份,每一份称为一个副本。副本是分别存放在不同存储节点的不同磁盘上。当磁盘出现故障时,只要其余健康磁盘中任一个磁盘拥有副本,用户就可以获取该数据。副本个数越多,安全性越高,但存储数据所需空间也成倍增长。
纠删码:通过算法将原始数据进行编码得到冗余,并将数据和冗余一起存储,以达到容错的目的。例如,将n块原始数据通过一定计算得到m块冗余元素(校验块);对于这n+m块的元素,当其中任意的m块元素出错(包括原始数据和冗余数据)时,均可以通过对应的重构算法恢复出原来的n块数据。生成校验的过程称为编码,恢复丢失数据块的过程称为解码。
纠删码相比副本而言,具有较高的磁盘利用率,但数据恢复和更新的代价更高。当硬盘故障重建数据时,消耗的CPU资源和网络负载较高,数据恢复所需时间长;数据更新相当于将原始数据重新编码,因此纠删码常用于只读数据或冷数据,比如虚拟化环境中的虚拟机备份文件、虚拟机模板等。
(0)
分布式分纠删码和多副本。多副本坏了就让数据重新均衡到剩下的副本中,空间越来越小。纠删码就是有纠错功能。类似1+x=5,推出x=4。换了物理盘会做数学把数据重新推到新盘。
(0)
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论