物理磁盘计数器
1)
测量“物理设备”的性能
2)
硬件RAID,磁盘虚拟化,以及分布式I/O可能导致测量结果难以评估
3)
是Partition Manager的组件
逻辑磁盘计数器
1)
测量具有盘符的磁盘的性能
2)
逻辑磁盘通常与应用和服务更有相关性
3)
是Volume Manager的组件
1.1.2.1.
主要计数器:
Average Disk sec
/ Read
Average Disk sec
/ Write
以上计数器显示了磁盘延迟时间,即数据访问究竟耗费了多长时间。是磁盘性能的最本源的标志。响应时间超过15 ms(基于平均/O尺寸为64KB或更小)通常被认为影响性能。响应时间性能图示中偶发的大延迟现象是正常现象
存储问题排查常规操作:
1)
检查硬件故障
2)
检查I/O尺寸是否超过64 KB
3)
如果硬件是共享的,考虑使用专有硬件
4)
如果使用的是旋转型介质,考虑做碎片整理
5)
调整硬件缓存
6)
考虑使用更快的介质
7)
减少没有必要的 I/O
1.1.2.2.
辅助计数器
磁盘带宽和队列计数器:
1)
Disk Transfers / sec :磁盘读写操作的IRPS(I/O请求包数量)速率。
2)
Disk Bytes / sec :磁盘读写操作带宽速率。
3)
Avg. Disk bytes / read (write) :磁盘读写操作平均带宽,可判断I/O尺寸。
4)
Average Disk Queue Length :磁盘上排队等待处理的读/写请求平均数。
5)
Current Disk Queue Length:当前磁盘排队等待处理的读/写请求数。
6)
以上计数器测量了磁盘的动作量,究竟访问了多少数据。
进程I/O计数器:
1)
\Process(*)\IO Read Operations/sec
和\Process(*)\IO Write
Operations/sec 分别代表了特定进程发出读/写 I/0操作的速率
2)
它包括文件,网络,和其他设备的 I/0s
3)
用作判断进程是否发送磁盘I/0 操作的辅助数据
磁盘剩余空间计数器:
1)
% Free Space 检查磁盘驱动器上可用空间的百分比,一般大于10%为正常。
2)
Free Megabytes 显示磁盘上可用空间的大小
3)
如果剩余磁盘空间低,可能导致碎片整理失败或写入失败这些计数器只是逻辑磁盘计数器对象的一部分.不能衡量LUN的剩余空间
4)
如果磁盘将要用满寻道时间也会增长,因为读写时磁头运转更多.
5)
再次提示,这个计数器不能检查硬盘的实际剩余空间.它检查的是磁盘分区
1)
HBA可能需要调整Queue Depth
2)
光纤交换机可能出现流量饱和(congestion)
3)
HBA的缓存设置需要修正
4)
光纤卡端口可能是公用的,无法处理本服务器和其他服务器使用同一块卡时出现的流量高峰(congestion)
5)
SAN 上的RAID可能无法提供充分的IOPs 来保证可接受的延迟下的工作负载
要判断是否遇到磁盘问题,可以使用下述问题:
1)
是否出现了磁盘延迟?(Average Disk sec / Read 或Average Disk sec /Write 是否超过0.015?)
判断结果:如果没有延迟现象则无需进一步调研
2)
是否所有磁盘都有延迟?
判断结果:如果只有1块盘有延迟,可能是磁盘架构层面存在瓶颈;如果所有磁盘都有延迟,可能是链路层面的瓶颈导致的
3)
是否存在大量队列?(Avg. Disk Queue Length 超过32)是否你的HBA已经难以处理请求?
判断结果:排队暗示着架构上的瓶颈。
4)
对比磁盘在延迟时的吞吐和最大吞吐时的延迟
判断结果:如果磁盘的
transfers/sec 在其他时段数值很大而延迟却不高,则说明是架构问题
5)
I0Ps多大? 你的动器能够提供足够的 MB/sec?
判断结果:如果磁盘的transfers/sec数值低,则需要检查
6)
系统工作负载是否恒定抑或是延迟恰逢高峰时段?
判断结果:检查磁盘的
transfers/sec确认是否存在高峰期导致磁盘负载加大,还是工作负载一致甚至减少时磁盘同样出现。