登录 UCenter Web 界面。
进入 监控 > 采集任务管理(或类似菜单,不同版本名称略有差异)。
找到对应资源类型或资源组的采集任务,确认:
任务状态:是否为“启用”。
调度周期:是否设置了合理的采集周期(如 5 分钟)。
关联资源:确认该任务确实包含了那些“未探测”的资源。
如果发现任务被禁用或周期为空,重新启用并保存。
常见情况:手动同步后,自动任务被意外停用。
虽然 Pod 显示 Running,但内部进程可能因特定资源报错而停滞。
SSH 登录 UCenter 的 Master 节点。
列出所有采集器相关的 Pod(名称通常包含 collector、iom 或 probe):
查看出现问题的资源所属采集器 Pod 的日志(例如 iom-collector-java-xxx):
搜索日志中与“未探测”资源 IP 或名称相关的错误信息。常见错误如:
SNMP timeout → 检查资源侧 SNMP 配置或防火墙。
connection refused → 协议端口不通。
authentication failed → 凭证错误。
如果日志显示持续报错,可尝试重启该采集器 Pod(会短暂中断采集,但通常能恢复):
Pod 会自动重建,重建后观察状态是否恢复。
即使“资源访问和连接测试正常”,但采集时使用的协议(如 SNMP、SSH、JMX 等)可能与测试时不同。
在 UCenter 中,进入 资源管理 > 资源列表,找到目标资源。
检查其“协议参数”:
SNMP 版本、community、端口是否正确。
如果使用了 SSH,确认用户名/密码或密钥是否仍有效。
检查该资源的 管理 IP 是否变更。
如果有 VPN 实例,确认采集器是否正确关联了该 VPN。
采集器与资源之间时间相差过大,可能导致认证或数据包被丢弃。
在 UCenter 服务器上执行 date 查看系统时间。
在被管资源上(如交换机、服务器)执行 date 或 display clock。
若时间不一致,通过 NTP 服务同步。
有时采集状态在数据库中卡死,导致任务无法重新调度。
方式一:在 UCenter Web 界面中,尝试“取消监控”再“重新添加”该资源(注意会丢失历史数据)。
方式二:通过数据库工具(需技术支持协助)清理采集状态表,但普通用户不建议直接操作数据库。
方式三:重启整个采集器的管理服务(风险较高,建议在业务低峰期执行):
登录 UCenter Web。
进入 系统 > 日志管理 > 系统日志。
筛选时间范围为问题发生时段,关键字为 collect、probe、failed 或对应资源 IP。
查看是否有“采集器心跳丢失”、“任务调度失败”等异常。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
毫无相关性