nginx的hash和一致性hash的区别

hash     

     nginx的负载均衡时有一个hash $request_uri的选项,这个是类似于LVS的dh。是针对客户端访问的uri来做的绑定。这样客户端访问同一个uri的时候,会被分配到同一个服务器上去。这样提高了缓存的命中率。

     过程:每个uri进行hash计算得到一个数值,这个数值除以整个节点数量取余数。(取模算法)

     缺点:如果一个节点挂了,那么整个全局都会乱掉。因为整个的节点数变了,因为除数变了。


   一致性hash 

    一致性hash的采用的是除数特别大,假设有一个hash环。是个闭环。把32位二进制的整数转换为十进制后均匀分布在整个环上。hash结果是除以2的32次方-1(hash是除以). 那么结果一定是落在环上的。那么,这个点靠近谁,就缓存在谁那里。假设a节点坏了。那么下一次的计算结果就是旁边的邻居。但是邻居的缓存不会受到影响。只是坏掉的A节点会从新去缓存。



引入虚拟节点可以解决偏斜问题。

在tengine的官方网站有一致性hash的一些详细介绍:

这个模块提供一致性hash作为负载均衡算法。

该模块通过使用客户端信息(如:$ip, $uri, $args等变量)作为参数,使用一致性hash算法将客户端映射到后端机器

如果后端机器宕机,这请求会被迁移到其他机器

server id 字段,如果配置id字段,则使用id字段作为server标识,否则使用server ip和端口作为server标识,

使用id字段可以手动设置server的标识,比如一台机器的ip或者端口变化,id仍然可以表示这台机器。使用id字段

可以减低增减服务器时hash的波动。

server weight 字段,作为server权重,对应虚拟节点数目

具体算法,将每个server虚拟成n个节点,均匀分布到hash环上,每次请求,根据配置的参数计算出一个hash值,在hash环

上查找离这个hash最近的虚拟节点,对应的server作为该次请求的后端机器。

该模块可以根据配置参数采取不同的方式将请求均匀映射到后端机器,比如:

consistent_hash $remote_addr:可以根据客户端ip映射

consistent_hash $request_uri: 根据客户端请求的uri映射

consistent_hash $args:根据客户端携带的参数进行映射


如果后端主机宕机,请求会移动到其他的节点上去。
有三种hash方式。 consistent_hash $remote_addr:可以根据客户端ip映射 consistent_hash $request_uri: 根据客户端请求的uri映射 consistent_hash $args:根据客户端携带的参数进行映射

例子: