知

【MVS】clockdiff is down 问题分析

性能分析和调优

2025-11-20 发表

0关注
0收藏 1104浏览

吴成井

吴成井九段

粉丝：2人关注：8人

问题描述

测试环境中clockdiff 命令执行经常出现 ”is down“，严重影响OceanBase安装和运行。

报错如下：

[root@rocky95 ~]# clockdiff -o 192.168.169.41

...........................clockdiff: 192.168.169.41 is down

解决方法

一：clockdiff命令介绍

clockdiff可以测量两个主机之间系统时间的差异

命令选项：

默认使用 ICMP 时间戳报文 -o：使用ICMP ECHO 的 IP 四跳时间戳（需目标主机支持）。 -o1：使用三跳IP时间戳（对某些系统更有效，如旧版本Solaris）。

列说明：

host 192.168.1.1 目标主机的ip地址，测量本机与ip地址为192.168.1.1的机器之间的系统时差 rtt 750(187)ms/0ms 平均往返时延(多次往返时延的标准差)/最小的往返时延 delta 1ms/1ms delta=目标主机系统时间−本机系统时间，两种测量方式计算出的系统时间差 (ms)

二：报错情况

clockdiff命令

正常返回情况如下：

[root@rocky95 ~]# clockdiff -o 10.165.7.181 .................................................. host=10.165.7.181 rtt=50(4)ms/43ms delta=1ms/0ms Thu Nov 20 09:57:23 2025[root@rocky95 ~]# [root@rocky95 ~]# clockdiff -o 127.0.0.1 .................................................. host=127.0.0.1 rtt=0(0)ms/0ms delta=0ms/0ms Thu Nov 20 10:20:41 2025

因搭建的NTP服务器，测试经常出现clockdiff check failed报错，检查为clockdiff 如下报错，严重影响OB Server部署和日常运维操作。

[root@rocky95 ~]# clockdiff -o 192.168.169.41 ...........................clockdiff: 192.168.169.41 is down

偶然返回如下结果

[root@rocky95 ~]# clockdiff -o 192.168.169.41 ................................................... host=192.168.169.41 rtt=0(0)ms/0ms delta=0ms/0ms Thu Nov 20 10:07:32 2025

三：测试分析过程

测试123端口

[root@rocky95 ~]# nc -uvz 192.168.169.41 123 Ncat: Version 7.92 ( ***.***/ncat ) Ncat: Connected to 192.168.169.41:123. Ncat: UDP packet sent successfully Ncat: 1 bytes sent, 0 bytes received in 2.03 seconds. [root@rocky95 ~]# nc -uvz 10.165.7.181 123 Ncat: Version 7.92 ( ***.***/ncat ) Ncat: Connected to 10.165.7.181:123. Ncat: UDP packet sent successfully Ncat: 1 bytes sent, 0 bytes received in 2.02 seconds.

tcpdump网络抓包

[root@rocky95 ~]# tcpdump -i any -nn -vv udp port 123

ping 命令判断

[root@rocky95 ~]# chronyc tracking Reference ID : C0A8A929 (192.168.169.41) Stratum : 6 Ref time (UTC) : Thu Nov 20 08:06:52 2025 System time : 0.000007659 seconds fast of NTP time Last offset : +0.000008557 seconds RMS offset : 0.000027306 seconds Frequency : 8.509 ppm fast Residual freq : +0.000 ppm Skew : 0.028 ppm Root delay : 0.070013240 seconds Root dispersion : 0.003589844 seconds Update interval : 517.5 seconds Leap status : Normal [root@rocky95 ~]# chronyc sources MS Name/IP address Stratum Poll Reach LastRx Last sample =============================================================================== ^* 192.168.169.41 5 9 377 206 +25us[ +34us] +/- 39ms [root@rocky95 ~]# ping -T tsandaddr 192.168.169.41 -c 2 PING 192.168.169.41 (192.168.169.41) 56(124) bytes of data. 64 bytes from 192.168.169.41: icmp_seq=1 ttl=64 time=0.382 ms TS: 192.168.169.53 29439298 absolute <==绝对时间戳：表示从系统启动（或某个固定时间点）到生成数据包时的累计时间。转换为小时：29439298 ms ÷ 1000 ÷ 3600 ≈ 8.17 小时。 192.168.169.41 0 <== 这个值代表node之间的时间差，单位是ms 192.168.169.41 0 192.168.169.53 0 64 bytes from 192.168.169.41: icmp_seq=2 ttl=64 time=0.390 ms TS: 192.168.169.53 29440346 absolute 192.168.169.41 1 192.168.169.41 0 192.168.169.53 0 --- 192.168.169.41 ping statistics --- 2 packets transmitted, 2 received, 0% packet loss, time 1048ms rtt min/avg/max/mdev = 0.382/0.386/0.390/0.004 ms --- 192.168.169.41 ping statistics --- 2 packets transmitted, 2 received, 0% packet loss, time 1026ms rtt min/avg/max/mdev = 0.356/0.459/0.563/0.103 ms [root@rocky95 ~]# ping -T tsandaddr 10.165.7.181 -c 2 PING 10.165.7.181 (10.165.7.181) 56(124) bytes of data. 64 bytes from 10.165.7.181: icmp_seq=1 ttl=58 time=45.9 ms TS: 192.168.169.53 9625625 absolute 192.168.169.254 26769471 10.12.172.1 -1842441 10.12.191.2 -24927031 Unrecorded hops: 11 64 bytes from 10.165.7.181: icmp_seq=2 ttl=58 time=45.8 ms TS: 192.168.169.53 9626626 absolute 192.168.169.254 26769471 10.12.172.1 -1842441 10.12.191.2 -24927030 Unrecorded hops: 11 --- 10.165.7.181 ping statistics --- 2 packets transmitted, 2 received, 0% packet loss, time 1001ms rtt min/avg/max/mdev = 45.833/45.859/45.885/0.026 ms

使用 strace 命令来判断

命令语法： strace clockdiff 10.165.7.181 strace clockdiff 10.165.7.181 [root@rocky95 ~]# strace clockdiff 10.165.7.181 execve("/usr/bin/clockdiff", ["clockdiff", "10.165.7.181"], 0x7fff9703c998 /* 42 vars */) = 0 ………………………… ppoll([{fd=3, events=POLLIN|POLLHUP}], 1, {tv_sec=1, tv_nsec=0}, NULL, 8) = 0 (Timeout) sendto(3, "\r\0:\356\6\371\v\0\0\231\245\177\0\0\0\0\0\0\0\0", 20, 0, {sa_family=AF_INET, sin_port=htons(0), sin_addr=inet_addr("10.165.7.181")}, 16) = 20 ppoll([{fd=3, events=POLLIN|POLLHUP}], 1, {tv_sec=1, tv_nsec=0}, NULL, 8) = 0 (Timeout) write(2, "clockdiff: ", 11clockdiff: ) = 11 write(2, "10.165.7.181 is down", 2010.165.7.181 is down) = 20 write(2, "\n", 1 ) = 1 close(1) = 0 close(2) = 0 exit_group(1) = ? +++ exited with 1 +++ strace clockdiff 192.168.169.41 [root@rocky95 ~]# strace clockdiff 192.168.169.41 execve("/usr/bin/clockdiff", ["clockdiff", "192.168.169.41"], 0x7fff35277da8 /* 42 vars */) = 0 ………………………… sendto(3, "\r\0\350r;\3712\0\0\232\233\371\0\0\0\0\0\0\0\0", 20, 0, {sa_family=AF_INET, sin_port=htons(0), sin_addr=inet_addr("192.168.169.41")}, 16) = 20 ppoll([{fd=3, events=POLLIN|POLLHUP}], 1, {tv_sec=0, tv_nsec=0}, NULL, 8) = 1 ([{fd=3, revents=POLLIN}], left {tv_sec=0, tv_nsec=0}) recvfrom(3, "E\0\0(\203\365\0\0@\1#0\300\250\251)\300\250\2515\16\0\256K;\3712\0\0\232\233\371"..., 1024, 0, NULL, 0x7ffe6c68f1c8) = 40 write(1, ".", 1.) = 1 openat(AT_FDCWD, "/etc/localtime", O_RDONLY|O_CLOEXEC) = 4 fstat(4, {st_mode=S_IFREG|0644, st_size=561, ...}) = 0 fstat(4, {st_mode=S_IFREG|0644, st_size=561, ...}) = 0 read(4, "TZif2\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0"..., 4096) = 561 lseek(4, -342, SEEK_CUR) = 219 read(4, "TZif2\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0"..., 4096) = 342 close(4) = 0 write(1, "\n", 1 ) = 1 write(1, "host=192.168.169.41 rtt=0(0)ms/0"..., 73host=192.168.169.41 rtt=0(0)ms/0ms delta=0ms/0ms Thu Nov 20 10:48:52 2025) = 73 close(1) = 0 close(2) = 0 exit_group(0) = ? +++ exited with 0 +++

查看系统参数

[root@obocp4 ~]# sysctl -a |grep icmp net.ipv4.icmp_echo_enable_probe = 0 net.ipv4.icmp_echo_ignore_all = 0 net.ipv4.icmp_echo_ignore_broadcasts = 1 net.ipv4.icmp_errors_use_inbound_ifaddr = 0 net.ipv4.icmp_ignore_bogus_error_respOnses= 1 net.ipv4.icmp_msgs_burst = 50 net.ipv4.icmp_msgs_per_sec = 1000 net.ipv4.icmp_ratelimit = 1000 net.ipv4.icmp_ratemask = 6168 net.ipv6.icmp.echo_ignore_all = 0 net.ipv6.icmp.echo_ignore_anycast = 0 net.ipv6.icmp.echo_ignore_multicast = 0 net.ipv6.icmp.ratelimit = 1000 net.ipv6.icmp.ratemask = 0-1,3-127

修改sysctl测试-结果无效

修改参数后，测试无效；

sysctl原配置：
[root@obocp4 ~]# sysctl -a |grep net.ipv4.icmp_msgs_burst net.ipv4.icmp_msgs_burst = 50 [root@obocp4 ~]# sysctl -a |grep net.ipv4.icmp_msgs_per_sec net.ipv4.icmp_msgs_per_sec = 1000
修改sysctl并重启：
net.ipv4.icmp_msgs_burst=200 net.ipv4.icmp_msgs_per_sec=10000

作用介绍：

1. 突发流量处理： ○ 若瞬间收到 200 条 ICMP 请求，所有请求会被立即处理（令牌桶初始有 200 个令牌）。 ○ 超出 200 条后的请求将被丢弃，直到令牌按每秒 10,000 个的速率补充。 2.持续流量控制： • 令牌补充速率为每秒 10,000 个，即长期平均处理速率为 10,000 条/秒。 • 若持续流量超过 10,000 条/秒，超出部分会被丢弃。

抓包分析

[root@rocky95 ~]# tcpdump -i any -vvv -w clockdi555.pcap

使用wireshark分析抓包文件，可见最后的十几包出现堵塞，最后timeout。

四：解决方案

clockdiff程序bug问题，2023年4月解决的。

Bug简述：局域网延时低，则clockdiff自动调整轮询间隔1ms内；但系统来不及回包，就出现超时现象。

Rocky95 自带clockdiff版本为20210202，外网下载高版本替换测试正常。 [root@rocky95 soft]# ./clockdiff -V clockdiff from iputils 20240117 libcap: yes, IDN: yes, NLS: no, error.h: yes, getrandom(): yes, __fpending(): yes

BUG情况见：

[Clockdiff host is down #326](https://github.com/iputils/iputils/issues/326)

五：参考

[clockdiff: xx.xx.xx.xx is down](***.***/knowledge-base/oceanbase-database-1000000000207674)

[Wireshark TS | Linux 系统对时问题](https://blog.csdn.net/weixin_47627078/article/details/136270996)

总结该文：思科区域核心网关交换机疑似不识别 IPv4 Options 里的 TimeStamp 字段，从而造成丢包。

[Clockdiff host is down #326](https://github.com/iputils/iputils/issues/326)

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

【MVS】clockdiff is down 问题分析

问题描述

解决方法

一：clockdiff命令介绍

二：报错情况

三：测试分析过程

测试123端口

tcpdump网络抓包

ping 命令判断

使用 strace 命令来判断

查看系统参数

修改sysctl测试-结果无效

抓包分析

四：解决方案

五：参考

编辑评论

提出建议