H3C_IRF

时间:2023-03-09 05:49:50
H3C_IRF

1.IRF的优点:

  跨设备负载均衡

  规避环路

  强大的网络扩展能力

  带宽/可靠性增加

2.IRF域编号存在的意义:

域是一个逻辑概念,一个 IRF 对应一个 IRF 域

  如果IRF 1 和IRF 2 之间有MAD检测链路,则两个IRF各自的成员设备间发送的MAD检测报文会被另外的IRF接收到,从而对两个IRF的MAD检测造成影响。这种情况下,需要给两个IRF配置不同的域编号,以保证两个IRF互不干扰

 

3.   访问IRF

  IRF 的访问方式如下:
    • 本地登录:通过任意成员设备的 Console 口登录。
    • 远程登录:给任意成员设备的任意三层接口配置 IP 地址,并且路由可达,就可以通过 Telnet、SNMP 等方式进行远程登录。
  不管使用哪种方式登录 IRF,实际上登录的都是主设备。用户所进行的任何配置,都会记录到主设备的当前配置文件中,主设备会将相关配置同步给从设备,以便保证主设备和从设备配置的一致性。

4.接口命名规则
  对于单独运行的设备(即没有加入任何 IRF),接口编号采用设备编号/子槽位编号/接口序号的格式

  缺省情况下,设备编号为 1。
  如果设备曾经加入过 IRF,则在退出 IRF 后,仍然会使用在 IRF 中时的成员编号作为自身的设备编号。

  对于 IRF 中的成员设备,接口编号仍然采用成员设备编号/子槽位编号/接口序号的格式

5.文件系统命名规则:

  对于 IRF 中的成员设备,直接使用存储介质的名称可以访问主设备的文件系统,使用“slotMember-ID#存储介质的名称”

  例:创建并访问 IRF 中从设备(成员编号为 3)存储介质 Flash 根目录下的 test 文件夹,可参照以下步骤:
  <Master> mkdir slot3#flash:/test
  Creating directory slot3#flash:/test... Done.
  <Master> cd slot3#flash:/test
  <Master> pwd
  slot3#flash:/test

6.工作原理:

  IRF系统将经历 物理连接、拓扑收集、角色选举、IRF的管理与维护四个阶段。

 6.1物理连接

  本设备上与IRF-Port1 口绑定的IRF物理端口只能和邻居成员设备IRF-Port2 口上绑定的IRF物理端口相连,本设备上与IRF-Port2 口绑定的IRF物理端口只能和邻居成员设备IRF-Port1 口上绑定的IRF物理端口相连,否则不能形成IRF。

  一个 IRF 端口可以与一个或多个 IRF 物理端口绑定,以提高 IRF 链路的带宽以及可靠性。

  IRF的连接拓扑有两种:链形连接/环形连接

 6.2拓扑收集

  每个成员设备和邻居成员设备通过交互 IRF Hello 报文来收集整个 IRF 的拓扑。IRF Hello 报文会携带拓扑信息,具体包括 IRF 端口连接关系、成员设备编号、成员设备优先级、成员设备的桥 MAC等内容

 6.3角色选举

  确定成员设备角色为主设备或从设备的过程称为角色选举。角色选举会在以下情况下进行:IRF 建立、新设备加入、主设备离开或者故障、两个 IRF 合并等。
  角色选举规则如下:
    (1) 当前主设备优先,IRF 不会因为有新的成员设备加入而重新选举主设备。不过,当 IRF 系统形成时,因为没有主设备,所有加入的设备都认为自己是主设备,则继续下一条规则的比较。
    (2) 成员优先级大的优先。如果优先级相同,则继续下一条规则的比较。
    (3) 系统运行时间长的优先。在 IRF 中,成员设备启动时间间隔精度为 10 分钟,即 10 分钟之内启动的设备,则认为它们是同时启动的,则继续下一条规则的比较。
    (4) CPU MAC 小的优先。
    通过以上规则选出的最优成员设备即为主设备,其它成员设备则均为从设备 

 6.4 IRF拓扑维护
  如果某成员设备 A 故障或者 IRF 链路故障,其邻居设备会立即将“成员设备 A 离开”的信息广播通知给 IRF 中的其它设备。获取到离开消息的成员设备会根据本地维护的 IRF 拓扑信息表来判断离开的是主设备还是从设备,如果离开的是主设备,则触发新的角色选举,再更新本地的 IRF 拓扑;如果离开的是从设备,则直接更新本地的 IRF 拓扑,以保证 IRF 拓扑能迅速收敛。IRF 端口的状态由与它绑定的 IRF 物理端口的状态决定。与 IRF 端口绑定的所有 IRF 物理端口状态均为 down 时,IRF 端口的状态才会变成 down。

7.MAD(多主检测)功能

  IRF链路故障会导致一个IRF变成多个IRF,这些IRF拥有相同的IP地址等三层配置会引起地址冲突

 7.1冲突处理

  对于 LACP MAD 检测,冲突处理会先比较两个 IRF 中成员设备的数量,数量多的 IRF 处于正常工作状态,继续工作;数量少的迁移到 Recovery 状态(即禁用状态);如果成员数量相等,则主设备成员编号小的 IRF 处于正常工作状态,继续正常工作;其它 IRF 迁移到 Recovery状态(即禁用状态)。

  对于 BFD MAD/ ARP MAD/ND MAD 检测,冲突处理会直接让主设备成员编号小的 IRF 处于正常工作状态,继续正常工作;其它 IRF 迁移到 Recovery 状态(即禁用状态)

  IRF 迁移到 Recovery 状态后会关闭该 IRF 中所有成员设备上除保留端口以外的其它所有物理端口(通常为业务接口),以保证该 IRF 不能再转发业务报文。缺省情况下,只有 IRF 物理端口是保留端口,可通过 mad exclude interface 命令配置。

 7.2MAD故障恢复

  如果出现故障的是继续正常工作的 IRF,则在进行 MAD 故障恢复前,可以通过命令行先启用Recovery 状态的 IRF,让它接替原 IRF 工作,以便保证业务尽量少受影响,再恢复 MAD 故障。
  如果在 MAD 故障恢复前,处于 Recovery 状态的 IRF 也出现了故障,则需要将故障 IRF 和故障链路都修复后,才能让冲突的 IRF 重新合并为一个 IRF,恢复 MAD 故障

8配置限制和指导

  部分交换机不但可以与本系列内的交换机建立 IRF,而且这两个系列的设备之间也能够建立 IRF

  IRF 中所有成员设备的软件版本必须相同,如果有软件版本不同的设备要加入 IRF,请确保 IRF的启动文件同步加载功能处于使能状态

    注意:

      如果新设备加入 IRF,并且新设备的软件版本和主设备的软件版本不一致,则新加入的设备不能正常启动。此时:
      如果没有使能启动文件的自动加载功能,则需要用户手工升级新设备后,再将新设备加入 IRF。或者在主设备上使能启动文件的自动加载功能,断电重启新设备,让新设备重新加入 IRF。
      如果已经使能了启动文件的自动加载功能,则新设备加入 IRF 时,会与主设备的软件版本号进行比较,如果不一致,则自动从主设备下载启动文件,然后使用新的系统启动文件重启,重新加入 IRF。如果新下载的启动文件的文件名与设备上原有启动文件文件名重名,则原有启动文件会被覆盖。
    为了能够自动加载成功,请确保从设备存储介质上有足够的空闲空间用于存放新的启动文件。如果从设备存储介质上空闲空间不足,系统会自动删除从设备的当前启动文件来完成加载。如果删除从设备的当前启动文件后空间仍然不足,从设备将无法进行自动加载。此时,需要管理员重启从设备并进入从设备的 Boot ROM 菜单,删除一些不重要的文件后,再让从设备重新加入 IRF。

  使能 IRF 系统启动文件的自动加载功能:irf auto-update enable 缺省情况下,IRF系统启动文件的自动加载功能处于使能状态

  使用 using tengige 命令可以将一个 40GE 接口拆分成四个 10GE 接口,这四个 10GE 接口只能都作为 IRF 物理端口,或者都不作为 IRF 物理端口。当将其中一个 10GE 接口和 IRF 端口绑定时,系统要求先将这四个 10GE 接口都关闭,否则,绑定失败;当绑定后,将其中一个 10GE 接口激活时,系统会判断其它 10GE 接口是否已经和 IRF 端口绑定,如果没有绑定,则不允许激活。
  如果两个 IRF 的桥 MAC 地址相同,请修改其中一个 IRF 的桥 MAC 地址,否则,它们不能合并为一个 IRF。

  IRF 迁移到 Recovery 状态后会关闭该 IRF 中所有成员设备上除保留端口以外的其它所有物理端口(通常为业务接口),保留端口可通过 mad exclude interface 命令配置。

  如果接口因为多 Active 冲突被关闭,则只能等 IRF 恢复到正常工作状态后,接口才能自动被激活,不能通过 undo shutdown 命令来激活。
  请确保 IRF 中各成员设备上安装的特性 License 一致,否则,可能会导致这些 License 对应的特性不能正常运行。

9.IRF链路的负载分担类型

  目前设备上支持配置的负载分担类型包括:
    根据报文类型自动匹配负载分担类型;
    根据源 IP 地址进行负载分担;
    根据目的 IP 地址进行负载分担;
    根据源 MAC 地址进行负载分担;
    根据目的 MAC 地址进行负载分担;
    根据源 IP 地址与目的 IP 地址进行负载分担;
    根据源 MAC 地址与目的 MAC 地址进行负载分担

    全局配置 IRF
    进入系统视图 system-view
    配置IRF链路的负载分担模式:irf-port global load-sharing mode{ destination-ip | destination-mac | source-ip |source-mac } *
    端口下配置 IRF
    进入系统视图 system-view -
    进入IRF端口视图 irf-port member-id/port-number -
    配置IRF链路的负载分担模式irf-port load-sharing mode { destination-ip | destination-mac | source-ip | source-mac } *
    缺省情况下,本系列交换机(S5830V2 & S5820V2)在处理报文时通过报文类型来进行负载分担

    
  配置IRF的桥MAC保留时间:(缺省情况下,IRF的桥MAC的保留时间为6分钟 ) 

    通常情况下使用主设备的桥 MAC 作为 IRF 桥 MAC。

    如果两个 IRF 的桥 MAC 相同,则它们不能合并为一个 IRF。

    如果 IRF 设备上启用了 TRILL 功能,请将 IRF 的桥 MAC 地址保留时间设置为永久保留。
  

    如果配置了 IRF 桥 MAC 保留时间为 6 分钟,则当主设备离开 IRF 时,IRF 桥 MAC 在 6 分钟内保持不变化;如果 6 分钟后主设备没有回到 IRF,则使用新选举的主设备的  桥 MAC 作为 IRF桥 MAC。该配置适用于主设备短时间内离开又回到 IRF 的情况(比如主设备重启或者链路临时故障等),可以减少不必要的桥 MAC 切换导致的流量中断。         irf mac-address persistent always
    如果配置了 IRF 桥 MAC 保留时间为永久,则不管主设备是否离开 IRF,IRF 桥 MAC 始终保持不变。irf mac-address persistent timer
    如果配置了 IRF 桥 MAC 不保留,则当主设备离开 IRF 时,系统会立即使用新选举的主设备的桥 MAC 做 IRF 桥 MAC。undo irf mac-address persistent
    

    当使用链型拓扑搭建 IRF,且 IRF 与其他设备之间有聚合链路存在时,如果需要重启 Master 设备,请先配置 IRF 的桥 MAC 为永久保留,避免因为桥 MAC 变化造成数据传  输的延时甚至丢包。

  配置IRF链路down延迟上报功能:(缺省情况下,IRF链路down延迟上报时间为4秒)

    该功能用于避免因端口链路层状态在短时间内频繁改变,导致 IRF 分裂/合并的频繁发生

    配置IRF链路down延迟上报时间 irf link-delay interval

10.MAD配置

 
    10.1LACP MAD

      检测速度快,利用现有聚合组网即可实现,无需占用额外接口;利用聚合链路同时传输普通业务报文和MAD检测报文(扩展LACP报文)组网中需要使用H3C设备作为中间设备,每个成员设备都需要连接到中间

    LACD MAD检测原理

      使能 LACP MAD 检测后,成员设备通过 LACP 协议报文和其它成员设备交互 DomainID 和 ActiveID信息。
        当成员设备收到 LACP 协议报文后,先比较 DomainID。如果 DomainID 相同,再比较 ActiveID;
        如果 DomainID 不同,则认为报文来自不同 IRF,不再进行 MAD 处理。
        如果 ActiveID 相同,则表示 IRF 正常运行,没有发生多 Active 冲突;如果 ActiveID 值不同,则表示 IRF 分裂,检测到多 Active 冲突

    LACP MAD 检测组网要求
        LACP MAD检测方式组网中需要使用H3C设备作为中间设备。通常采用如下所示的组网:成员设备之间通过Device交互LACP扩展报文。

    H3C_IRF

    10.2BFD MAD

      检测速度较快,组网形式灵活,对其它设备没有要求配置专用三层接口,这些接口不能再传输普通业务流量
      如果不使用中间设备,则要求成员设备间是全连接,即每个成员设备都必须和其它所有成员设备相连。这些链路专用于 MAD 检测,不能再传输普通业务流量。这种组网方式适用于成员设备少,并且物理距离比较近的组网环境

      如果使用中间设备,组网时每个成员设备都需要连接到中间设备,这些 BFD 链路专用于 MAD 检测

    BFD MAD 检测原理
      BFD MAD 检测是通过 BFD 协议来实现的。要使 BFD MAD 检测功能正常运行,除在三层接口下使能 BFD MAD 检测功能外,还需要在该接口上配置 MAD IP 地址。            MAD IP 地址与普通 IP 地址不同的地方在于:MAD IP 地址与成员设备是绑定的,IRF 中的每个成员设备上都需要配置,且所有成员设备的 MAD IP 必须属于同一网段。
      当 IRF 正常运行时,只有主设备上配置的 MAD IP 地址生效,从设备上配置的 MAD IP 地址不生效,BFD 会话处于 down 状态;(使用 display bfd session 命令查看BFD 会话的状态。
      如果 Session State 显示为 Up,则表示激活状态;如果显示为 Down,则表示处于 down 状态)
      当 IRF 分裂形成多个 IRF 时,不同 IRF 中主设备上配置的 MAD IP 地址均会生效,BFD 会话被激活,此时会检测到多 Active 冲突。
    BFD MAD 检测组网要求
      BFD MAD检测方式可以使用中间设备来进行连接,也可以不使用中间设备。通常采用如 图 1-8 所示的组网方式:每台成员设备必须和其它所有成员设备之间有一条       BFD MAD检测链路(即成员设备之间是全连接组网)。这些链路连接的接口必须属于同一VLAN,在该VLAN接口视图下给不同成员设备配置同一网段下的不同IP地址。
      使能 BFD MAD 检测功能的三层接口只能专用于 BFD MAD 检测,不允许运行其它业务。如果用户配置了其它业务,可能会影响该业务以及 BFD MAD 检测功能的运行。

H3C_IRF

-----本文档在H3C S5830V2 & S5820V2 系列以太网交换机 IRF 配置指导中截取。))