问

H3C SR8804-X路由器上报ldp日志是什么原因导致的？

LLDP

2025-08-06提问

0关注
0收藏，1663浏览

贺兰君

贺兰君零段

粉丝：0人关注：0人

问题描述：

%Aug 6 13:25:54:477 2025 R1 LDP/5/LDP SESSION_CHG: Session (64.3.5.1:o, public instance) is down (hello hold timer expired)

组网及组网描述：

无

最佳答案

zhiliao_东方老赢

zhiliao_东方老赢九段

粉丝：43人关注：3人

根据提供的日志信息“LDP/5/LDP_SESSION_CHG: Session (64.3.5.1:0, public instance) is down (hello hold timer expired)”，结合信息中的故障分析逻辑和案例，该问题发生在H3C路由器（可能是CR19000、SR66/88/6608/6616系列）上，属于 LDP会话中断的典型故障。原因和解决方案如下：

---

### 故障原因
1. 链路质量差（最常见原因）
- 物理链路存在CRC/FCS错误、接口震荡或告警（如案例中的FCS-Error、Abort计数增长），导致Hello报文丢失。
- 传输层TCP连接异常（如干扰、误码率过高），无法维持LDP会话。

2. 设备资源异常
- CPU占用过高（日志中显示CPUUsage=19%），导致协议报文处理延迟。
- 内存达到临界状态（MemoryState=Critical），影响LDP进程运行。

3. 配置或兼容性问题
- 两端Hello定时器未协商一致（默认15秒），一端未及时回应导致超时。
- 设备软件版本存在缺陷（如CR16K与Juniper互通时因TLV兼容性导致会话震荡）。

---

### 解决步骤
1. 检查链路质量
- 执行 display interface [接口名]，重点检查以下字段：
- Input(Bad)：是否存在CRC/FCS-Error、Abort等错包（如案例中错包持续增长）。
- Line protocol current state：接口协议状态是否稳定（排除震荡）。
- 物理层告警：查看是否有CPET/4/CPET_LOG_WARN告警（如信号丢失、帧丢失）。
- 处理建议：
- 更换故障光模块/电缆，检查传输设备。
- 启用链路误码检测（如loopback test）。

2. 检查设备资源状态
- 执行 display cpu-usage 和 display memory-usage：
- 若CPU持续高于70%或内存达Critical状态，关闭非关键服务或升级硬件。
- 执行 display mpls ldp session verbose：
- 确认会话两端Hello Hold Time是否一致（如15s vs 45s）。

3. 验证LDP定时器配置
- 执行 display mpls ldp discovery verbose，比对两端参数：
- Hello Hold Time（默认15秒）
- Keepalive Hold Time（默认45秒）
- 处理建议：
- 两端配置相同的Hello定时器（接口视图下mpls ldp timer hello-hold 15）。

4. 升级软件版本
- 若存在已知版本缺陷（如SR66的R2604P02前版本存在TTL处理问题），升级至推荐版本。

5. 收集诊断信息
- 保存以下信息后联系厂商技术支持：
- display mpls ldp troubleshooting
- display logbuffer（过滤LDP/OSPF日志）
- display interface统计信息

---

### 关联日志说明
- hello hold timer expired 表明LDP邻接体未能按时收到Hello报文，通常由链路或资源问题触发（非配置错误）。
- 在SR8812案例中，该日志伴随大量OSPF重传和接口错包，最终定位为链路质量导致。

> ⚠️ 注：若问题间歇性出现，优先排查物理链路和硬件故障，再分析协议配置。