envoy 中文参考文档
  • 首页
  • 简介
    • Envoy是什么
    • 架构介绍
      • 术语
      • 线程模型
      • 监听器
      • L3/L4网络过滤器
      • HTTP连接管理
      • HTTP过滤器
      • HTTP路由
      • gRPC
      • WebSocket支持
      • 集群管理
      • 服务发现
      • 健康检查
      • 连接池
      • 负载均衡
      • 异常检测
      • 熔断
      • 全局限速
      • TLS
      • 统计
      • 运行时配置
      • 跟踪
      • TCP代理
      • 访问日志
      • MongoDB
      • DynamoDB
      • Redis
      • 热重启
      • 动态配置
      • 初始化
      • 逐出
      • 脚本
    • 部署
    • 业界对比
    • 获得帮助
    • 历史版本
  • 编译安装
    • 编译
    • 参考配置
    • 演示沙箱
      • 前端代理
      • Zipkin跟踪
      • Jaeger跟踪
      • gRPC桥接
      • 构建Envoy Docker镜像
    • 工具
  • 配置参考
    • V1 API 概述
    • V2 API 概述
    • 监听器
    • 网络过滤器
      • TLS客户端身份认证
      • Echo
      • Mongo代理
      • 速率限制
      • Redis代理
      • TCP代理
    • HTTP连接管理器
      • 路由匹配
      • 流量转移/分流
      • HTTP头部操作
      • HTTP头部清理
      • 统计
      • 运行时设置
      • 路由发现服务
    • HTTP过滤器
      • 缓存
      • CORS过滤器
      • 故障注入
      • DynamoDB
      • gRPC HTTP/1.1 桥接
      • gRPC-JSON 转码过滤器
      • gRPC-Web 过滤器
      • 健康检查
      • 速率限制
      • 路由
      • Lua
    • 集群管理
      • 统计
      • 运行时设置
      • 集群发现服务
      • 健康检查
      • 熔断
    • 访问日志
    • 限速服务
    • 运行时配置
    • 路由表检查工具
  • 运维管理
    • 命令行选项
    • 热重启
    • 管理接口
    • 统计概述
    • 运行时配置
    • 文件系统
  • 自定义扩展示例
  • V1 API参考
    • 监听器
    • 网络过滤器
      • TLS客户端身份认证
      • Echo
      • HTTP连接管理
      • Mongo代理
      • 速率限制
      • Redis代理
      • TCP代理
    • HTTP路由配置
      • 虚拟主机
      • 路由
      • 虚拟集群
      • 速率限制配置
      • 路由发现服务
    • HTTP过滤器
      • 缓存
      • CORS过滤器
      • DynamoDB
      • 故障注入
      • gRPC HTTP/1.1 桥接
      • gRPC-JSON 转码过滤器
      • gRPC-Web 过滤器
      • 健康检查
      • Lua
      • 速率限制
      • 路由
    • 集群管理
      • 集群
        • 健康检查
        • 熔断
        • TLS上下文
        • 异常值检测
        • HASH环负载均衡配置
      • 异常检测
      • 集群发现服务
      • 服务发现服务
    • 访问日志
    • 管理接口
    • 限速服务
    • 运行时配置
    • 跟踪
  • V2 API参考
    • 启动引导
    • 监听&监听发现
    • 集群&集群发现
    • 服务发现
    • 健康检查
    • HTTP路由管理&发现
    • TLS配置
    • 通用的类型
    • 网络地址
    • 协议选项
    • 发现API
    • 限速组件
    • 过滤器
      • 网络过滤器
        • TLS客户端身份认证
        • HTTP连接管理
        • Mongo代理
        • 速率限制
        • Redis代理
        • TCP代理
      • HTTP过滤器
        • 缓存
        • 故障注入
        • 健康检查
        • Lua
        • 速率限制
        • 路由
        • gRPC-JSON转码器
      • 常见访问日志类型
      • 常见故障注入类型
  • FAQ
    • Envoy有多快?
    • 我在哪里获得二进制文件?
    • 我如何设置SNI?
    • 如何设置区域感知路由?
    • 我如何设置Zipkin跟踪?
Powered by GitBook
On this page
  • 异常检测
  • 逐出算法
  • 检测类型
  • 连续5xx
  • 连续的网关故障
  • 成功率
  • 逐出事件记录
  • 配置参考
  • 返回

Was this helpful?

  1. 简介
  2. 架构介绍

异常检测

异常检测

异常值检测和逐出是动态确定上游群集中,某些主机是否正在执行不同于其他主机的过程,并将其从正常负载平衡集中移除。 性能可能会受到不同程度的影响,例如连续的故障,时间成功率,时间延迟等。异常检测是被动健康检查的一种形式。 Envoy还支持主动健康检查。被动和主动健康检查可以一起使用或独立使用,形成整体上游健康检查解决方案的基础。

逐出算法

取决于异常值检测的类型,弹出或者以行内(例如在连续5xx的情况下)或以指定的间隔(例如在定期成功率的情况下)运行。逐出算法的工作原理如下:

  1. 主机被确定为异常。

  2. Envoy检查以确保逐出的主机数量低于允许的阈值(通过outlier_detection.max_ejection_percent设置指定)。如果逐出的主机数量超过阈值,主机不会被逐出。

  3. 主机被逐出几毫秒。意味着主机被标记为不健康,在负载平衡期间不会使用,除非负载平衡器处于紧急情况。毫秒数等于outlier_detection.base_ejection_time_ms值乘以主机被逐出的次数。这会导致主机如果继续失败,则会被逐出更长和更长的时间。

  4. 逐出的主机将在逐出时间满之后自动重新投入使用。一般而言,异常值检测与主动健康检查一起使用,用于全面的健康检查解决方案。

检测类型

Envoy支持以下异常检测类型:

连续5xx

如果上游主机返回一些连续的5xx,它将被逐出。请注意,在这种情况下,5xx意味着一个实际的5xx响应代码,或者一个会导致HTTP路由器代表上游返回的事件(复位,连接失败等)。逐出所需的连续5xx数量由outlier_detection.consecutive_5xx值控制。

连续的网关故障

如果上游主机返回一些连续的“网关错误”(502,503或504状态码),它将被逐出。请注意,这包括HTTP路由代表上游返回其中一个状态码的事件(重置,连接失败等)。逐出所需的连续网关故障的数量由outlier_detection.consecutive_gateway_failure值控制。

成功率

基于成功率的异常值逐出汇总来自群集中每个主机的成功率数据。然后以给定的时间间隔,基于统计异常值检测来逐出主机。如果主机在一个时间间隔内的,请求量小于outlier_detection.success_rate_request_volume值,则不会为认为该主机成功率异常值。此外,如果一个时间间隔内请求量最小的主机,请求数小于outlier_detection.success_rate_minimum_hosts值,则不会对群集执行检测。

逐出事件记录

Envoy可以选择生成异常值逐出事件日志。这在日常操作中非常有用,因为全局统计数据,不能提供有关哪些主机被逐出的信息以及原因。下面是一条JSON格式的日志记录:

{
  "time": "...",
  "secs_since_last_action": "...",
  "cluster": "...",
  "upstream_url": "...",
  "action": "...",
  "type": "...",
  "num_ejections": "...",
  "enforced": "...",
  "host_success_rate": "...",
  "cluster_success_rate_average": "...",
  "cluster_success_rate_ejection_threshold": "..."
}

time:

事件发生的时间。

secs_since_last_action:

自从上一次操作(逐出或未逐出)发生以来的时间,以秒为单位。如果是第一次,之前没有动作,该值将为-1。

cluster:

被逐出主机所在的群集。

upstream_url:

被逐出的主机URL。例如,`tcp://1.2.3.4:80`。

action:

触发的动作(`eject`/`uneject`)

type:

如果`action`是`eject`,这里描述的是`eject类型`;如`5xx`、`GatewayFailure`、`SuccessRate`。

num_ejections:

如果`action`是`eject`,指定主机被逐出的累计次数(对于Envoy而言是本地的,并且如果主机被重新添加到集群,那么这个数值会被重置)

enforced:

如果`action`是`eject`,指定逐出是否被强制执行。`true`表示主机被强制逐出。`false`表示着事件被记录了,但是主机并没有被逐出。

host_success_rate:

如果`action`是`eject`,并且`type`是`SuccessRate`,主机在被逐出时的成功率(0~100范围)。

cluster_success_rate_average:

如果`action`是`eject`,并且`type`是`SuccessRate`,主机在被逐出时所在的集群平均成功率(0~100范围)。

cluster_success_rate_ejection_threshold:

如果`action`是`eject`,并且`type`是`SuccessRate`,指定逐出事件的成功率阈值。

配置参考

返回

Previous负载均衡Next熔断

Last updated 5 years ago

Was this helpful?

集群管理全局配置
每个群集配置
运行时设置
统计参考
架构介绍
简介
首页目录