Sentinel熔断降级

时间:2022-11-25 13:54:35

Sentinel熔断降级

1、介绍

官网地址:https://github.com/alibaba/Sentinel/wiki/熔断降级

Sentinel 提供以下几种熔断策略:

  • 慢调用比例 (SLOW_REQUEST_RATIO):选择以慢调用比例作为阈值,需要设置允许的慢调用 RT(即最大的响应时间),请求的响应时间大于该值则统计为慢调用。当单位统计时长(statIntervalMs)内请求数目大于设置的最小请求数目,并且慢调用的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求响应时间小于设置的慢调用 RT 则结束熔断,若大于设置的慢调用 RT 则会再次被熔断。
  • 异常比例 (ERROR_RATIO):当单位统计时长(statIntervalMs)内请求数目大于设置的最小请求数目,并且异常的比例大于阈值,则接下来的熔断时长内请求会自动被熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。异常比率的阈值范围是 [0.0, 1.0],代表 0% - 100%。
  • 异常数 (ERROR_COUNT):当单位统计时长内的异常数目超过阈值之后会自动进行熔断。经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态),若接下来的一个请求成功完成(没有错误)则结束熔断,否则会再次被熔断。

注意异常降级仅针对业务异常,对 Sentinel 限流降级本身的异常(BlockException)不生效。为了统计异常比例或异常数,需要通过 Tracer.trace(ex) 记录业务异常。示例:

进一步说明

Sentinel 熔断降级会在调用链路中某个资源出现不稳定状态时(例如调用超时或异常比例升高),对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联错误。

当资源被降级后,在接下来的降级时间窗口之内,对该资源的调用都自动熔断(默认行为是抛出 DegradeException)。

熔断有三种状态,分别为OPEN、HALF_OPEN、CLOSED

Hystrix复习

半开的状态系统自动去检测是否请求有异常,没有异常就关闭断路器恢复使用,有异常则继续打开断路器不可用。具体可以参考Hystrix

2、降级策略实战

2.1、慢调用比例策列

业务的响应时长(RT)大于指定时长的请求认定为慢调用。在指定时间内,如果请求数量超过了设定的最小数量,慢调用比例大于设定的阈值,则触发熔断

Sentinel熔断降级

属性描述

属性 描述
最大RT 需要设置的阈值,超过该值则为慢调用
比例阈值 慢调用所占有的调用比例,范围[0.0,10.]
熔断时长 在这段时间内发生熔断、拒绝所有请求,经过熔断时长后熔断器会进入探测恢复状态(HALF-OPEN 状态)
最小请求数 即允许通过的最小请求数,在该数量内不发生熔断

执行逻辑

上面慢调用的执行流程解读:

一个接口请求响应的速度大于【最大RT(200ms),业务代码设置1秒】,统计最近10000毫秒内的所有请求,如果请求数量超过10次,并且慢调用比例不低于0.4,则触发熔断,熔断时长为【自定义5秒】,然后进入half-open状态,放行一次请求做测试

  1. 熔断(OPEN):请求数大于最小请求数并且慢调用的比率大于比例阈值则发生熔断,熔断时长为用户自定义设置。
  2. 探测(HALFOPEN):当熔断过了定义的熔断时长,状态由熔断(OPEN)变为探测(HALFOPEN)。

注意Sentinel默认统计的RT上限是4900ms,超出此阈值的都会算作4900ms,若需要变更此上限可以通过启动配置项-Dcsp.sentinel.statistic.max.rt=xxx来配置

添加控制器

请求线程睡眠一秒方便后面的压测测试

@GetMapping("/testD")
public String testD()
{
    //暂停几秒钟线程
    try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); }
    log.info("testD 测试RT");
    return "------testD";
}

JMeter压测

  1. 先创建一个组(1秒发生10个请求,并且循环进行,只有点击停止的时候才会停止)
  2. 再创建一个请求

Sentinel熔断降级

在上面的测试中在通过访问:http://localhost:8401/testD发现会出现如下错误,因为被熔断了,当停止压测再请求又可以了

Blocked by Sentinel (flow limiting)

2.2、异常比例

统计指定时间内的调用,如果调用次数超过指定请求数,并且出现异常的比例达到设定的比例阈值(或超过指定异常数),则触发熔断

Sentinel熔断降级

解读

统计最近1000ms内的所有请求,如果请求量超过5次,并且异常比例不低于0.4,则触发熔断,熔断时长为5秒。然后进入half-open状态,放行异常请求做测试

修改业务代码报错

@GetMapping("/testD")
public String testD()
{
    //暂停几秒钟线程
    //try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); }
    // log.info("testD 测试RT");
    int a = 1/0;
    log.info("testD 异常比例数触发熔断");
    return "------testD";
}

启动测试刷新后台报出异常,然后进入熔断输出内容

Blocked by Sentinel (flow limiting)

2.3、异常数

异常数与异常比例是一样的,只是将异常比例阈值指定为具体的异常数就会触发熔断

Sentinel熔断降级

在1秒中内的请求数,有2次都是异常的就会触发5秒熔断