Nginx负载均衡算法-RoundRobin

RoundRobin权重的实现算法

在Nginx中，上游服务可以通过server指令声明其IP地址或者域名，并通过upstream块指令定义为一组。这一组server中，将使用同一种负载均衡算法，从请求信息（比如HTTP Header或者IP Header）或者上游服务状态（比如TCP并发连接数）中计算出请求的路由：

如果上游服务器是异构的，例如上图中server 1、3、4、5都是2核4G的服务器，而server 2则是8核16G，那么既可以在server 2上部署多个不同的服务，并把它配置到多个usptream组中，也可以通过server指令后的weight选项，设置算法权重：

upstream rrBackend {
                server localhost:8001 weight=1;
                server localhost:8002 weight=2;
                server localhost:8003 weight=3;
}
location /rr {
                proxy_pass http://rrBackend;
}

在上面这段配置指令中，并没有显式指定负载均衡算法，此时将使用Nginx框架唯一自带的RoundRobin轮询算法。顾名思义，它将按照server在upstream配置块中的位置，有序访问上游服务。需要注意，加入weight权重后，Nginx并不会依照字面次序访问上游服务。仍然以上述配置为例，你可能认为Nginx应当这么访问：8001、8002、8002、8003、8003、8003（我在本机上启动了这3个HTTP端口，充当上游server，这样验证成本更低），但事实上，Nginx却是按照这个顺序访问的：8003、8002、8003、8001、8002、8003，为什么会这样呢？实际上这是为了动态权重的实现而设计的。我们先从实现层面谈起。
Nginx为每个server设置了2个访问状态：

struct ngx_http_upstream_rr_peer_s {
   ...
    ngx_int_t                       current_weight;
    ngx_int_t                       effective_weight;
...
};

其中current_weight初始化为0，而effective_weight就是动态权重，它被初始化为server指令后的weight权重。我们先忽略转发失败的场景，此时RoundRobin算法可以简化为4步：

遍历upstream组中的所有server，将current_weight的值增加effective_weight；
将全部的权重值相加得到total；
选择current_weight最大的server；
将这个选中server的current_weight减去total值。
这样，前6次的运算结果就如下表所示：

current_weight/	current_weight加effective_weight/	total/	选中server/	current_weight
[0,0,0]	[1,2,3]	6	8003	[1,2,-3]
[1,2,-3]	[2,4,0]	6	8002	[2,-2,0]
[2,-2,0]	[3,0,3]	6	8003	[3,0,-3]
[3,0,-3]	[4,2,0]	6	8001	[-2,2,0]
[-2,2,0]	[-1,4,3]	6	8002	[-1,-2,3]
[-1,-2,3]	[0,0,6]	6	8003	[0,0,0]
[0,0,0]	[1,2,3]	6	8003	[1,2,-3]

由于总权重为6（1+2+3），所以每6次转发后就是一个新的轮回。我再把简化的RoundRobin源代码列在下方，你可以对照理解：

    ngx_http_upstream_rr_peer_t* best = NULL;
    ngx_int_t  total = 0;
    for (peer = rrp->peers->peer, i = 0;
         peer;
         peer = peer->next, i++)
    {
        //在每一轮计算中，current_weight要加上effective_weight
peer->current_weight += peer->effective_weight;
//total值是所有effective_weight的累加和
        total += peer->effective_weight;
        if (best == NULL || peer->current_weight > best->current_weight) {
            //每一轮找出current_weight最大的那个server
best = peer;
        }
}
//选出server后，要将最大的
    best->current_weight -= total;
    return best;

可以看到，这段代码只做一遍循环就完成了server选择，执行效率很高。

网络错误该如何处理？

在上例中我们假定不会转发失败，所以effective_weight是不变的。但现实中分布式系统出错才是常态，接下来我们看看RoundRobin算法是怎样处理错误的。
在server指令后，可以加入max_fails和fail_timeout选项，它们共同对转发失败的次数加以限制：

在fail_timeout秒内（默认为10秒），每当转发失败，server的权重都会适当调低（通过effective_weight实现）；
如果转发失败次数达到了max_fails次，则接下来的fail_timeout秒内不再向该server转发任何请求；
在等待fail_timeout秒的空窗期后，server将会基于最低权重执行算法，尝试转发请求；
每成功转发1次权重加1，直到恢复至weight配置。
这就是动态权重发挥作用的机制，它不只对RoundRobin算法有效，对于最少连接数、一致性哈希算法同样有效。接下来我们再从实现层面上回顾下这一流程，加深你对动态权重的理解。Nginx为这一功能准备了6个状态变量：

struct ngx_http_upstream_rr_peer_s {
...
    ngx_int_t                       weight;
    time_t                          accessed;
    ngx_uint_t                      max_fails;
    ngx_uint_t                      fails;
    time_t                          checked;
    time_t                          fail_timeout;
...
};

其中，weight、max_fails、fail_timeout都是server指令后的选项，它们是固定不变的。fails是窗口期的转发失败次数，accessed表示最近一次转发失败时间，而checked则是最近一次转发时间（无论成功或者失败）。
这样，当访问上游server失败时，将会把accessed和checked置为当前时间，并将fails次数加1：

peer->fails++;
peer->accessed = now;
peer->checked = now;

如果max_fails功能没有关闭（0表示关闭，默认值是1），就会通过effective_weight适当降低权重：

if (peer->max_fails) {
    peer->effective_weight -= peer->weight / peer->max_fails;
}

当执行负载均衡算法时，如果在fail_timeout秒内连续失败了max_fails次，则不再访问该server：

if (peer->max_fails
    && peer->fails >= peer->max_fails
    && now - peer->checked <= peer->fail_timeout)
{
    continue;
}

在过了fail_timeout秒的空窗期后，一旦算法再次选择了该server，就会将checked重置为当前时间：

if (now - best->checked > best->fail_timeout) {
    best->checked = now;
}

一旦最终转发请求成功，就会通过accessed将fails失败次数清零：

if (peer->accessed < peer->checked) {
    peer->fails = 0;
}

注意，此时effective_weight还需要通过不断的成功来缓慢恢复权重：

if (peer->effective_weight < peer->weight) {
    peer->effective_weight++;
}

RoundRobin算法还能控制并发连接数，你可以通过server指令后的max_conns选项设置（默认为0表示不加限制）。它的实现原理非常简单，这里不再介绍。
可见，RoundRobin算法可以柔性恢复转发错误。如果上游Server进程是复制扩展的（处理的数据相同），那么RoundRobin就是最简单有效的负载均衡算法。

RoundRobin权重的实现算法

网络错误该如何处理？

发送评论 编辑评论

发送评论编辑评论