点击上方“芋道源码”,选择“置顶公众号”
技术文章第一时间送达!
源码精品专栏
[精尽 Dubbo 原理与源码专栏( 已经完成 69+ 篇,预计总共 75+ 篇 )](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484647&idx=1&sn=9eb7e47d06faca20d530c70eec3b8d5c&chksm=fa497b56cd3ef2408f807e66e0903a5d16fbed149ef7374021302901d6e0260ad717d903e8d4&scene=21#wechat_redirect)
**[中文详细注释的开源项目](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484404&idx=1&sn=109f263e51b81ca9f270846dd16f6b3a&chksm=fa497c45cd3ef55358b09beb6e18ba04737799d3c0bc32baaa0796dc707b1275c0c555a249ba&scene=21#wechat_redirect)**
[**Spring MVC 和 Security 源码合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484380&idx=1&sn=b4e0da1a314d77dcd170a25ed1ebb4c5&chksm=fa497c6dcd3ef57bcfb69a52c594bcb72e35d9bbe89fa87601b2a6c9f266d656b1ad2a5d4da4&scene=21#wechat_redirect)
摘要: 原创出处 https://www.cnkirito.moe/rpc-cluster/ 「老徐」欢迎转载,保留摘要,谢谢!
上一篇文章分析了服务的注册与发现,这一篇文章着重分析下 RPC 框架都会用到的集群的相关知识。
集群(Cluster)本身并不具备太多知识点,在分布式系统中,集群一般涵盖了负载均衡(LoadBalance),高可用(HA),路由(Route)等等概念,每个 RPC 框架对集群支持的程度不同,本文着重分析前两者–负载均衡和高可用。
集群概述
在此之前的《深入理解 RPC》系列文章,对 RPC 的分析着重还是放在服务之间的点对点调用,而分布式服务中每个服务必然不止一个实例,不同服务的实例和相同服务的多个实例构成了一个错综复杂的分布式环境,在服务治理框架中正是借助了 Cluster 这一层来应对这一难题。还是以博主较为熟悉的 motan 这个框架来介绍 Cluster 的作用。
先来看看 Cluster 的顶层接口:
@Spi(scope = Scope.PROTOTYPE)
public interface ClusterT extends CallerT {
@Override
void init();
void setUrl(URL url);
void setLoadBalance(LoadBalance loadBalance);//1
void setHaStrategy(HaStrategy haStrategy);//2
void onRefresh(ListReferer referers);
ListReferer getReferers();
LoadBalance getLoadBalance();
}
在概述中,我们只关心 Cluster 接口中的两个方法,它揭示了 Cluster 在服务治理中的地位
1
指定负载均衡算法
2
指定高可用策略(容错机制)
http://ov0zuistv.bkt.clouddn.com/TIM%E5%9B%BE%E7%89%8720180227151838.png
我们需要对所谓的负载均衡策略和高可用策略有一定的理解,才能够搞清楚集群是如何运作的。
负载均衡
说到负载均衡,大多数人可能立刻联想到了 nginx。负载均衡可以分为服务端负载均衡和客户端负载均衡,而服务端负载均衡又按照实现方式的不同可以划分为软件负载均衡和硬件负载均衡,nginx 便是典型的软件负载均衡。而我们今天所要介绍的 RPC 中的负载均衡则主要是客户端负载均衡。如何区分也很简单,用笔者自己的话来描述下
在 RPC 调用中,客户端持有所有的服务端节点引用,自行通过负载均衡算法选择一个节点进行访问,这便是客户端负载均衡。
客户端如何获取到所有的服务端节点引用呢?一般是通过配置的方式,或者是从上一篇文章介绍的服务注册与发现组件中获取。
负载均衡接口分析
motan 中的负载均衡抽象:
@Spi(scope = Scope.PROTOTYPE)
public interface LoadBalanceT {
void onRefresh(ListReferer referers);
Referer select(Request request);//1
void selectToHolder(Request request, ListReferer refersHolder);
void setWeightString(String weightString);
}
ribbon 中的负载均衡抽象:
public interface IRule{
public Server choose(Object key);//1
public void setLoadBalancer(ILoadBalancer lb);
public ILoadBalancer getLoadBalancer();
}
1
对比下两个 RPC 框架对负载均衡的抽象可以发现,其实负载均衡策略干的事很简单,就是根据请求返回一个服务节点。在 motan 中对服务端的点对点调用抽象成了 Referer,而在 ribbon 中则是 Server。
几种负载均衡算法
负载均衡算法有几种经典实现,已经是老生常谈了,总结后主要有如下几个:
每个框架支持的实现都不太一样,如 ribbon 支持的负载均衡策略:
motan 支持的负载均衡策略:
算法很多,有些负载均衡算法的实现复杂度也很高,请教了一些朋友,发现用的最多还是 RoundRobin,Random 这两种。可能和他们实现起来很简单有关,很多运用到 RPC 框架的项目也都是保持了默认配置。
而这两种经典复杂均衡算法实现起来是很简单的,在此给出网上的简易实现,方便大家更直观的了解。
服务列表
public class IpMap
{
// 待路由的Ip列表,Key代表Ip,Value代表该Ip的权重
public static HashMapString, Integer serverWeightMap =
new HashMapString, Integer();
static
{
serverWeightMap.put("192.168.1.100", 1);
serverWeightMap.put("192.168.1.101", 1);
// 权重为4
serverWeightMap.put("192.168.1.102", 4);
serverWeightMap.put("192.168.1.103", 1);
serverWeightMap.put("192.168.1.104", 1);
// 权重为3
serverWeightMap.put("192.168.1.105", 3);
serverWeightMap.put("192.168.1.106", 1);
// 权重为2
serverWeightMap.put("192.168.1.107", 2);
serverWeightMap.put("192.168.1.108", 1);
serverWeightMap.put("192.168.1.109", 1);
serverWeightMap.put("192.168.1.110", 1);
}
}
轮询(Round Robin)
public class RoundRobin
{
private static Integer pos = 0;
public static String getServer()
{
// 重建一个Map,避免服务器的上下线导致的并发问题
MapString, Integer serverMap =
new HashMapString, Integer();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
SetString keySet = serverMap.keySet();
ArrayListString keyList = new ArrayListString();
keyList.addAll(keySet);
String server = null;
synchronized (pos)
{
if (pos keySet.size())
pos = 0;
server = keyList.get(pos);
pos ++;
}
return server;
}
}
随机(Random)
public class Random
{
public static String getServer()
{
// 重建一个Map,避免服务器的上下线导致的并发问题
MapString, Integer serverMap =
new HashMapString, Integer();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
SetString keySet = serverMap.keySet();
ArrayListString keyList = new ArrayListString();
keyList.addAll(keySet);
java.util.Random random = new java.util.Random();
int randomPos = random.nextInt(keyList.size());
return keyList.get(randomPos);
}
}
高可用策略
高可用(HA)策略一般也被称作容错机制,分布式系统中出错是常态,但服务却不能停止响应,6个9一直是各个公司的努力方向。当一次请求失败之后,是重试呢?还是继续请求其他机器?抑或是记录下这次失败?下面是集群中的几种常用高可用策略:
高可用接口分析
以 motan 的 HaStrategy 为例来介绍高可用在集群中的实现细节
@Spi(scope = Scope.PROTOTYPE)
public interface HaStrategyT {
void setUrl(URL url);
Response call(Request request, LoadBalance loadBalance);//1
}
1
如我之前所述,高可用策略依赖于请求和一个特定的负载均衡算法,返回一个响应。
快速失败(failfast)
@SpiMeta(name = "failfast")
public class FailfastHaStrategyT extends AbstractHaStrategyT {
@Override
public Response call(Request request, LoadBalance loadBalance) {
Referer refer = loadBalance.select(request);
return refer.call(request);
}
}
motan 实现了两个高可用策略,其一便是 failfast,非常简单,只进行一次负载均衡节点的选取,接着发起点对点的调用。
失效转移(failover)
@SpiMeta(name = "failover")
public class FailoverHaStrategyT extends AbstractHaStrategyT {
protected ThreadLocalListReferer referersHolder = new ThreadLocalListReferer() {
@Override
protected java.util.Listcom.weibo.api.motan.rpc.Referer initialValue() {
return new ArrayListReferer();
}
};
@Override
public Response call(Request request, LoadBalance loadBalance) {
ListReferer referers = selectReferers(request, loadBalance);
if (referers.isEmpty()) {
throw new MotanServiceException(String.format("FailoverHaStrategy No referers for request:%s, loadbalance:%s", request,
loadBalance));
}
URL refUrl = referers.get(0).getUrl();
// 先使用method的配置
int tryCount =
refUrl.getMethodParameter(request.getMethodName(), request.getParamtersDesc(), URLParamType.retries.getName(),
URLParamType.retries.getIntValue());
// 如果有问题,则设置为不重试
if (tryCount 0) {
tryCount = 0;
}
// 只有 failover 策略才会有重试
for (int i = 0; i = tryCount; i++) {
Referer refer = referers.get(i % referers.size());
try {
request.setRetries(i);
return refer.call(request);
} catch (RuntimeException e) {
// 对于业务异常,直接抛出
if (ExceptionUtil.isBizException(e)) {
throw e;
} else if (i = tryCount) {
throw e;
}
LoggerUtil.warn(String.format("FailoverHaStrategy Call false for request:%s error=%s", request, e.getMessage()));
}
}
throw new MotanFrameworkException("FailoverHaStrategy.call should not come here!");
}
protected ListReferer selectReferers(Request request, LoadBalance loadBalance) {
ListReferer referers = referersHolder.get();
referers.clear();
loadBalance.selectToHolder(request, referers);
return referers;
}
}
其二的高可用策略是 failover,实现相对复杂一些,容忍在重试次数内的失败调用。这也是 motan 提供的默认策略。
其他集群相关的知识点
在 Dubbo 中也有 cluster 这一分层,除了 loadbalance 和 ha 这两层之外还包含了路由(Router)用来做读写分离,应用隔离;合并结果(Merger)用来做响应结果的分组聚合。
在 SpringCloud-Netflix 中整合了 Zuul 来做服务端的负载均衡
参考资料
666. 彩蛋
如果你对 Dubbo 感兴趣,欢迎加入我的知识星球一起交流。
目前在知识星球(https://t.zsxq.com/2VbiaEu)更新了如下 Dubbo 源码解析如下:
01. 调试环境搭建
02. 项目结构一览
03. 配置 Configuration
04. 核心流程一览
05. 拓展机制 SPI
- 线程池
07. 服务暴露 Export
08. 服务引用 Refer
注册中心 Registry
动态编译 Compile
动态代理 Proxy
服务调用 Invoke
调用特性
过滤器 Filter
NIO 服务器
P2P 服务器
HTTP 服务器
序列化 Serialization
集群容错 Cluster
优雅停机
日志适配
状态检查
监控中心 Monitor
管理中心 Admin
运维命令 QOS
链路追踪 Tracing
…
一共 60 篇++