0%

ASP VNext 开源服务容错处理库Polly使用文档

在进入SOA之后,我们的代码从本地方法调用变成了跨机器的通信。任何一个新技术的引入都会为我们解决特定的问题,都会带来一些新的问题。比如网络故障、依赖服务崩溃、超时、服务器内存与CPU等其它问题。正是因为这些问题无法避免,所以我们在进行系统设计、特别是进行分布式系统设计的时候以“Design For Failure”(为失败而设计)为指导原则。把一些边缘场景以及服务之间的调用发生的异常和超时当成一定会发生的情况来预先进行处理。

Design For Failure
1. 一个依赖服务的故障不会严重破坏用户的体验。
2. 系统能自动或半自动处理故障,具备自我恢复能力。

以下是一些经验的服务容错模式

  • 超时与重试(Timeout and Retry)
  • 限流(Rate Limiting)
  • 熔断器(Circuit Breaker)
  • 舱壁隔离(Bulkhead Isolation)
  • 回退(Fallback)

如果想详细了解这几种模式可以参考美团技术团队的总结:服务容错模式。我们今天要讲的是,thanks to the community 多谢社区, Polly已经为我们实现了以上全部的功能。Polly是一个C#实现的弹性瞬时错误处理库(resilience and transient-fault-handling library一直觉得这个英文翻译不是很好) 。在Polly中,对这些服务容错模式分为两类:

  • 错误处理fault handling :重试、熔断、回退
  • 弹性应变resilience:超时、舱壁、缓存

可以说错误处理是当错误已经发生时,防止由于该错误对整个系统造成更坏的影响而设置。而弹性应变,则在是错误发生前,针对有可能发生错误的地方进行预先处理,从而达到保护整个系统的目地。

  • 定义条件: 定义你要处理的 错误异常/返回结果
  • 定义处理方式 : 重试,熔断,回退
  • 执行

先看一个简单的例子

1

2

3

4

5

6

var policy = Policy

.Handle<SomeExceptionType>()

.Retry();

policy.Execute(() => DoSomething());

我们可以针对两种情况来定义条件:错误异常和返回结果。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

Policy

.Handle<HttpRequestException>()

Policy

.Handle<SqlException>(ex => ex.Number == 1205)

Policy

.Handle<HttpRequestException>()

.Or<OperationCanceledException>()

Policy

.Handle<SqlException>(ex => ex.Number == 1205)

.Or<ArgumentException>(ex => ex.ParamName == "example"``)

Policy

.HandleInner<HttpRequestException>()

.OrInner<OperationCanceledException>(ex => ex.CancellationToken != myToken)

以及用返回结果来限定

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

Policy

.HandleResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.NotFound)

Policy

.HandleResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.InternalServerError)

.OrResult<HttpResponseMessage>(r => r.StatusCode == HttpStatusCode.BadGateway)

Policy

.HandleResult<HttpStatusCode>(HttpStatusCode.InternalServerError)

.OrResult<HttpStatusCode>(HttpStatusCode.BadGateway)

HttpStatusCode[] httpStatusCodesWorthRetrying = {

HttpStatusCode.RequestTimeout,

HttpStatusCode.InternalServerError,

HttpStatusCode.BadGateway,

HttpStatusCode.ServiceUnavailable,

HttpStatusCode.GatewayTimeout

};

HttpResponseMessage result = Policy

.Handle<HttpRequestException>()

.OrResult<HttpResponseMessage>(r => httpStatusCodesWorthRetrying.Contains(r.StatusCode))

.RetryAsync(...)

.ExecuteAsync( )

在这里使用的处理方式就是我们最开始说的服务容错模式,我们将介绍以下三种:重试、熔断、回退。

重试

重试很好理解,当发生某种错误或者返回某种结果的时候进行重试。Polly里面提供了以下几种重试机制

  • 按次数重试
  • 不断重试(直到成功)
  • 等待之后按次数重试
  • 等待之后不断重试(直到成功)

按次数重试

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Policy

.Handle<SomeExceptionType>()

.Retry()

Policy

.Handle<SomeExceptionType>()

.Retry(3)

Policy

.Handle<SomeExceptionType>()

.Retry(3, (exception, retryCount) =>

{

});

不断重试

1

2

3

4

5

6

7

8

9

10

11

12

Policy

.Handle<SomeExceptionType>()

.RetryForever()

Policy

.Handle<SomeExceptionType>()

.RetryForever(exception =>

{

});

等待之后重试

1

2

3

4

5

6

7

8

9

Policy

.Handle<SomeExceptionType>()

.WaitAndRetry(``new``[]

{

TimeSpan.FromSeconds(1),

TimeSpan.FromSeconds(2),

TimeSpan.FromSeconds(3)

});

当然也可以在每次重试的时候添加一些处理,这里我们可以从上下文中获取一些数据,这些数据在policy启动执行的时候可以传进来。

1

2

3

4

5

6

7

8

9

10

Policy

.Handle<SomeExceptionType>()

.WaitAndRetry(``new``[]

{

TimeSpan.FromSeconds(1),

TimeSpan.FromSeconds(2),

TimeSpan.FromSeconds(3)

}, (exception, timeSpan, context) => {

});

把WiatAndRetry抱成WaitAndRetryForever()则可以实现重试直到成功。

熔断

熔断也可以被作为当遇到某种错误场景下的一个操作。以下代码展示了当发生2次SomeExceptionType的异常的时候则会熔断1分钟,该操作后续如果继续尝试执行则会直接返回错误 。

1

2

3

Policy

.Handle<SomeExceptionType>()

.CircuitBreaker(2, TimeSpan.FromMinutes(1));

可以在熔断和恢复的时候定义委托来做一些额外的处理。onBreak会在被熔断时执行,而onReset则会在恢复时执行。

熔断器状态

我们的CircuitBreakPolicy的State定义了当前熔断器的状态,我们也可能调用它的Is

1

2

3

4

5

Action<Exception, TimeSpan> onBreak = (exception, timespan) => { ... };

Action onReset = () => { ... };

CircuitBreakerPolicy breaker = Policy

.Handle<SomeExceptionType>()

.CircuitBreaker(2, TimeSpan.FromMinutes(1), onBreak, onReset);

olate和Reset方法来手动熔断和恢复 。

1

CircuitState state = breaker.CircuitState;

  • Closed 关闭状态,允许执行
  • Open 自动打开,执行会被阻断
  • Isolate 手动打开,执行会被阻断
  • HalfOpen  从自动打开状态恢复中,在熔断时间到了之后从Open状态切换到Closed

1

2

3

4

breaker.Isolate();

breaker.Reset();

回退(Fallback)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Policy

.Handle<Whatever>()

.Fallback<UserAvatar>(UserAvatar.Blank)

Policy

.Handle<Whatever>()

.Fallback<UserAvatar>(() => UserAvatar.GetRandomAvatar())

Policy

.Handle<Whatever>()

.Fallback<UserAvatar>(UserAvatar.Blank, onFallback: (exception, context) =>

{

});

执行polly policy

为我声明了一个Policy,并定义了它的异常条件和处理方式,那么接下来就是执行它。执行是把我们具体要运行的代码放到Policy里面。

1

2

3

4

5

6

var policy = Policy

.Handle<SomeExceptionType>()

.Retry();

policy.Execute(() => DoSomething());

这就是我们最开始的例子,还记得我们在异常处理的时候有一个context上下文吗?我们可以在执行的时候带一些参数进去

1

2

3

4

5

6

7

8

9

10

11

12

13

var policy = Policy

.Handle<SomeExceptionType>()

.Retry(3, (exception, retryCount, context) =>

{

var methodThatRaisedException = context[``"methodName"``];

Log(exception, methodThatRaisedException);

});

policy.Execute(

() => DoSomething(),

new Dictionary<``string``, object``>() {{` `"methodName"``,` `"some method"` `}}

);

当然,我们也可以将Handle,Retry, Execute 这三个阶段都串起来写。

1

2

3

4

5

Policy

.Handle<SqlException>(ex => ex.Number == 1205)

.Or<ArgumentException>(ex => ex.ParamName == "example"``)

.Retry()

.Execute(() => DoSomething());

我们在上面讲了Polly在错误处理方面的使用,接下来我们介绍Polly在弹性应变这块的三个应用: 超时、舱壁和缓存。

超时

1

2

Policy

.Timeout(TimeSpan.FromMilliseconds(2500))

支持传入action回调

1

2

3

4

5

Policy

.Timeout(30, onTimeout: (context, timespan, task) =>

{

});

超时分为乐观超时与悲观超时,乐观超时依赖于CancellationToken ,它假设我们的具体执行的任务都支持CancellationToken。那么在进行timeout的时候,它会通知执行线程取消并终止执行线程,避免额外的开销。下面的乐观超时的具体用法 。

1

2

3

4

5

6

7

8

Policy timeoutPolicy = Policy.TimeoutAsync(30);

HttpResponseMessage httpResponse = await timeoutPolicy

.ExecuteAsync(

async ct => await httpClient.GetAsync(endpoint, ct),

CancellationToken.None

);

悲观超时与乐观超时的区别在于,如果执行的代码不支持取消CancellationToken,它还会继续执行,这会是一个比较大的开销。

1

2

Policy

.Timeout(30, TimeoutStrategy.Pessimistic)

上面的代码也有悲观sad…的写法

1

2

3

4

5

Policy timeoutPolicy = Policy.TimeoutAsync(30, TimeoutStrategy.Pessimistic);

var response = await timeoutPolicy

.ExecuteAsync(

async () => await FooNotHonoringCancellationAsync(),

);

舱壁

在开头的那篇文章中详细解释了舱壁这种模式,它用来限制某一个操作的最大并发执行数量 。比如限制为12

同时,我们还可以控制一个等待处理的队列长度

以及当请求执行操作被拒绝的时候,执行回调

1

2

3

4

5

Policy

.Bulkhead(12, context =>

{

});

缓存

Polly的缓存需要依赖于一个外部的Provider。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

var memoryCacheProvider = new Polly.Caching.MemoryCache.MemoryCacheProvider(MemoryCache.Default);

var cachePolicy = Policy.Cache(memoryCacheProvider, TimeSpan.FromMinutes(5));

var cachePolicy = Policy.Cache(memoryCacheProvider, new AbsoluteTtl(DateTimeOffset.Now.Date.AddDays(1));

var cachePolicy = Policy.Cache(memoryCacheProvider, new SlidingTtl(TimeSpan.FromMinutes(5));

TResult result = cachePolicy.Execute(() => getFoo(), new Context(``"FooKey"``));

var cachePolicy = Policy.Cache(myCacheProvider, TimeSpan.FromMinutes(5),

(context, key, ex) => {

logger.Error($``"Cache provider, for key {key}, threw exception: {ex}."``);

}

);

组合Policy

最后我们要说的是如何将多个policy组合起来。大致的操作是定义多个policy,然后用Wrap方法即可。

1

2

3

var policyWrap = Policy

.Wrap(fallback, cache, retry, breaker, timeout, bulkhead);

policyWrap.Execute(...)

在另一个Policy声明时组合使用其它外部声明的Policy。

1

2

3

4

5

6

7

PolicyWrap commonResilience = Policy.Wrap(retry, breaker, timeout);

Avatar avatar = Policy

.Handle<Whatever>()

.Fallback<Avatar>(Avatar.Blank)

.Wrap(commonResilience)

.Execute(() => { });

写在后面

上一篇我们介绍了《asp.net core开源api 网关Ocelot的中文使用文档》,Ocelot里面的一些关于Qos服务质量的处理就是用Polly来实现的。当然在没有网关介入的情况 下,我们也可以单独来使用Polly做弹性应对和瞬时错误处理。关于分布式架构,这是一个很大的话题,我们后面继续展示,欢迎关注 。