海光四号相比海光三号,在内存控制器上有重大升级:
海光三号:通常支持 8通道 DDR4-3200 MHz 内存。
理论峰值带宽计算:8 channels * 3200 MT/s * 8 Bytes/Transfer ≈ 204.8 GB/s
。
您测得的 ~40 GB/s 是一个非常典型且合理的实际应用级带宽。它远低于理论峰值的原因是:
内存访问模式:真实负载(包括 iperf)无法达到理想的、连续的大块拷贝。
CPU 缓存效率、内存控制器调度、NUMA 架构等因素都会导致实际带宽低于理论值。
海光四号:升级为 8通道 DDR5-4800 MHz 内存控制器。
理论峰值带宽计算:8 channels * 4800 MT/s * 8 Bytes/Transfer ≈ 307.2 GB/s
。
这是海光三号理论带宽(204.8 GB/s)的 1.5 倍。
与海光三号的情况类似,实际应用中无法跑满理论峰值。根据第三方评测机构(如企事录等)对海光四号服务器的专业测试:
使用 Stream Benchmark(一个专门用于测试内存持续带宽的工具)进行测试,海光四号单路节点可以稳定达到 270~280 GB/s 的量级。
这个数值同样受限于具体的主板设计、内存条数量、频率和时序配置等因素,但 270+ GB/s 是一个可靠的参考值。
您提到的“iperf需要三倍于流量的内存带宽”是一个非常重要的点,它解释了为什么网络流量无法超过内存带宽的瓶颈。
数据路径:iperf 发送数据时,数据需要经历 用户态缓冲区 -> 内核态网络栈 -> 网卡驱动
的拷贝过程。接收数据则反之。这确实会产生多次数据拷贝,极大地消耗内存带宽。
瓶颈分析:
在海光三号上,40 GB/s 的内存带宽大约能支撑 40 / 3 ≈ 13.3 GB/s
的网络流量,即约 106 Gb/s 的网络速率。这已经超出了单口100G网卡的能力,说明在海光三号上,单节点瓶颈更可能出现在网卡而非内存。
在海光四号上,270 GB/s 的内存带宽大约能支撑 270 / 3 = 90 GB/s
的网络流量,即 720 Gb/s 的网络速率。这意味着单个海光四号节点理论上可以为多张200G或400G网卡提供足够的内存带宽支持,网络瓶颈将转移到网卡和PCIe通道上。
指标 | 海光三号 (C86 8635/8639) | 海光四号 (C86 8645/8649) | 提升比例 |
---|---|---|---|
内存支持 | 8通道 DDR4-3200 | 8通道 DDR5-4800 | - |
理论峰值带宽 | 204.8 GB/s | 307.2 GB/s | +50% |
典型实测带宽 | ~40 GB/s | ~270 GB/s | ~6.75倍 |
结论:海光四号单节点的内存带宽得到了质的飞跃,实测带宽预计可达 270+ GB/s,能极大地缓解 iperf 等网络测试工具中内存拷贝带来的瓶颈,为高性能网络应用提供坚实的基础。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论