• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

主机时钟源告警

2021-10-11 发表
  • 1关注
  • 1收藏 2058浏览
吴铖 六段
粉丝:7人 关注:1人

组网及说明

问题描述

一、现场一台服务器存在时钟源告警


过程分析

一、进入告警cvk后台,使用命令当前系统正在使用时钟源:cat /sys/devices/system/clocksource/clocksource0/current_clocksource ,发现当前系统确实不是使用TSC时钟。

二、进入该cvk后台,使用命令查看当前系统可用时钟源:cat /sys/devices/system/clocksource/clocksource0/available_clocksource ,发现可用的时钟已经没有TSC了。


三、正常的命令回显应该如下:TSC时钟为保持系统时间的精确性,位于CPU中。


四、现场重启服务器,发现该CVK恢复了TSC时钟,但是过段时间,再次出现TSC消失。

五、通过分析系统日志message或者kernel日志。系统检测到CPU10的TSC时间不精确了,自动切换到acpi_pm模式。 (其他日志段也有CPU 80等核心)


解决方法

一、协调服务器侧查看硬件CPU是否存在告警,后续确定华为服务器CPU和主板存在问题,进行了更换恢复正常。

二、 后续遇到类似问题,可以后台使用命令dmesg | grep tsc 或者查看message日志搜索关键字tsc。

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

作者在2021-10-28对此案例进行了修订
1 个评论
levy 知了小白
粉丝:0人 关注:0人

这个问题不是硬件问题属于内核缺陷:

内核相关的提交,修复tsc时钟切换成hpet造成修通下tsc时钟不可用问题。

***.***/pub/scm/linux/kernel/git/tip/tip.git/commit/?id=b50db7095fe002fa3e16605546cba66bf1b68a3e

***.***/pub/scm/linux/kernel/git/tip/tip.git/commit/?id=c7719e79347803b8e3b6b50da8c6db410a3012b5

***.***/pub/scm/linux/kernel/git/tip/tip.git/commit/?id=c86ff8c55b8ae688

 其他的内核:4.145.1-rc2 也可能有问题。

***.***/lkml/20190516090651.1396-1-harry.pan@***.***/

Bug 203183 tsc marked unstable after entered PC10 on Intel CoffeeLake

***.***/show_bug.cgi?id=203183


根据资料和反馈4.14到5.1内核有问题,内核在5.17修复。

内核里面有关于tsc时钟不稳的问题描述:

***.***/pub/scm/linux/kernel/git/tip/tip.git/commit/?id=c86ff8c55b8ae688

clocksource: Avoid accidental unstable marking of clocksources
Since commit db3a34e17433 ("clocksource: Retry clock read if long delays detected") and commit 2e27e793e280 ("clocksource: Reduce clocksource-skew threshold"), it is found that tsc clocksource fallback to hpet can sometimes happen on both Intel and AMD systems especially when they are running stressful benchmarking workloads. Of the 23 systems tested with a v5.14 kernel, 10 of them have switched to hpet clock source during the test run.(非常普遍)

原因是
  * This delay could be due to SMIs, NMIs, or to VCPU preemptions. Used as
* a lower bound for cs->uncertainty_margin values when registering clocks.
*/
-#define WATCHDOG_MAX_SKEW (50 * NSEC_PER_USEC)
+#define WATCHDOG_MAX_SKEW (100 * NSEC_PER_USEC)

主要是时钟判断的阈值有关,有问题的内核判断时间过短50 * NSEC_PER_USEC 导致误认为不准。

临时解决规避办法:内核参数添加 tsc=reliable解决

根本解决办法,更新内核或者backport以上对应的内核commits





backport开头三个commits

levy 发表时间:2023-03-01

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作