这很可能不是典型的二层广播风暴(ARP环路),而是典型的“路由黑洞”或“ARP响应被丢弃”问题。
简单来说:对端(聚合链路的另一端)收到了你的ARP请求,并且知道你的IP,但它的回复(ARP Reply)被某种策略丢弃了,或者它没有路由回指给你。
以下是详细分析和排查步骤:
问题分析
现象确认:
- 你在设备
<HZDYW-D-3F-ACC-WiFi-146> 上 ping 对端 10.10.180.4。 - Debug 证据:截图3中显示了大量的
ARP_SEND 日志,且 target MAC: 0000-0000-0000。这说明设备一直在发 ARP 请求(询问“10.10.180.4 的 MAC 是多少?”),但没有收到任何 ARP Reply。 - 表项证据:
- 对端(核心/汇聚交换机)的 ARP 表里有你的设备(截图1:
10.10.180.146 学到了 MAC)。 - 你的设备(截图2:
dis arp)里是空的,没有学到对端 10.10.180.4 的 MAC。
核心矛盾:
- 为什么对端能学到你,你却学不到对端?
- 原因推断:对端收到了你的 ARP Request 并记录了你的 IP/MAC(所以它表里有你)。但当你 ping 对端时,对端回复 ARP Reply 给你,这个回复包没有到达你的设备。或者,对端根本不想回复你(因为没有回程路由或 ACL 拦截)。
排查步骤(按优先级)
1. 检查对端(上联交换机)的回程路由(最关键)
你的设备是二层设备,配置 IP 通常是为了管理。对端(上联设备)需要知道如何把数据包发回给你。
- 检查点:登录到对端交换机(即截图1中的设备),检查其路由表。
- 命令:
display ip routing-table - 验证:确保对端交换机有到达
10.10.180.146/32 或者该网段的路由,且出接口是你们互联的链路聚合组(LACP/聚合口)。 - 常见陷阱:如果对端是三层接口,它可能默认不响应非直连网段的 ARP,或者需要配置代理 ARP(Proxy ARP)。
2. 检查链路聚合(LACP)配置一致性
虽然你说链路正常,但二层环路或协商问题可能导致单向通信。
- 检查点:确认两端的 LACP 模式(主动/被动)、速率、双工、允许通过的 VLAN(Access 还是 Trunk)是否完全一致。
- 命令:在你的设备上执行
display link-aggregation verbose。 - 关键:确保聚合口状态是
Selected(选中状态)。如果对端是 Unselected,可能会导致流量不转发。
3. 检查 ACL / 安全策略(最常见原因)
很多企业网为了安全,会在核心交换机上配置 ACL,禁止核心设备响应终端设备的 ICMP 或 ARP。
- 检查点:检查对端交换机的物理接口或 VLAN 接口上是否有
inbound 方向的 ACL。 - 现象:如果对端有 ACL 拦截了
icmp 或 arp 报文,就会出现你学不到对端 MAC 的情况。 - 临时测试:尝试在对端交换机的接口上暂时取消 ACL(或增加一条 permit 规则),看能否 ping 通。
4. 检查 VLAN 配置(Access vs Trunk)
- 情况 A(Access 模式):如果你的设备和对端都是 Access 模式,且 PVID 一致,通常没问题。
- 情况 B(Trunk 模式):如果你的设备配置 IP 在 VLANIF 接口上,而对端是 Trunk 口,需要确保:
- 对端 Trunk 口允许该 VLAN 通过。
- 对端是否有该 VLAN 的 SVI 接口 IP?如果没有,它可能不会响应 ARP。
5. 物理层与 STP(生成树)
- 检查点:虽然业务正常,但可以检查一下生成树状态。
- 命令:
display stp brief - 现象:如果聚合口被 STP 阻塞了(Blocking 状态),会导致单向通信。
结论与建议
这不是 ARP 环路。 ARP 环路会导致设备 CPU 飙升、端口流量跑满,而你这里只是单纯的 ping 不通。
最可能的原因是:对端交换机上配置了 ACL 或者没有配置回程路由,导致它收到了你的请求,但“装作没看见”或者“不知道怎么回”。
暂无评论