你好 ,CSA ,共享存储ocfs2 对于IOPS有什么优化的手段吗? 目前onstore 存储iops性能瓶颈,我们针对ceph 优化,那么对于cvk 的ocfs2 文件系统有什么优化的文档或者建议吗? 我记得对于该文件系统也是可以调优优化的。
(0)
最佳答案
看一下是如下吗
功能需求
从CAS5.0版本开始,CAS支持ocfs umount功能。之前版本当主机访问存储中断或者共享文件系统心跳网络(默认管理网,可在主机池视图修改)发生中断时,就会触发主机fence重启,不满足部分客户的需求。使用该功能后,当部分存储网断开,CVK服务器不再重启,暂停异常的共享文件系统存储池,正常访问存储的共享文件系统上的业务不受影响。同样,共享文件系统心跳网络断开,CVK服务器不再重启,对于不使用共享文件系统的业务不受到影响。
配置步骤
详细实现机制见下:
1、某台CVK上的某个共享文件系统存储池不能正常访问存储
正在使用共享文件系统的CVK,当CVK访问存储阵列出现异常,CVK无法连接存储阵列或LUN无法访问的时间超过120秒,CVK会自动暂停该故障LUN对应的OCFS2共享文件系统。在CVM上观察该存储池会处于暂停状态。同时,运行在该CVK对应共享存储池的虚拟机会被关机离线迁移到其它可用的CVK主机上去。
CAS通过暂停故障共享文件系统来隔离故障CVK,以此替代fence重启CVK的故障隔离方式。
如果对LUN的访问在120秒内恢复,则不会触发CVK暂停共享文件系统存储池。
当访问存储恢复正常后,存储池会自动拉起。但是,虚拟机可能不会马上迁移回到该主机,会在配置的策略下适当迁移。
2、某台CVK的共享文件系统心跳网络异常
共享文件系统也支持当共享文件系统心跳网络故障的异常处理。共享文件系统心跳网络故障或通信异常导致CVK间无法通过该网络通信和发送keep alive消息的时间超过216秒,之前的处理是Fence重启,现在也可配置成不再重启主机。
在第一个阶段,90秒内没有给本节点发送过keep alive消息或者任何handle消息的节点都会与本节点逻辑上断开。
在第二阶段,在126秒中如果连接没有恢复,会启动选举裁决。在这个过程中,本节点通过考虑当时与其他节点的TCP连接情况和其所能侦测到的其他节点的磁盘心跳的情况决定本节点是否进行暂停共享文件系统的动作。
如果在选举裁决过程中决定本节点退出集群,暂停共享文件系统的动作,那么本节点上,已经启动的所有共享文件系统都会被暂停。同时,其上的虚拟机可能被迁移到其他主机。
当共享文件系统心跳网络恢复后,存储池会被重新拉起,虚拟机可能会适当的迁移,均衡资源的使用。
配置步骤比较简单:可以从CVM界面上配置Fence不重启处理策略。进入“系统管理” --> “参数配置”—〉“共享存储故障隔离”, 在下拉菜单中选取“不重启主机” 既可。
配置关键点及注意事项
一般配置该功能的应用场景有,比如说客户的主机与存储阵列组网的时候有多个存储阵列或者多个存储交换机,交换机之间没有冗余关系。
(0)
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论