【RPC 专栏】深入理解 RPC 之集群篇

本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer,已开源在github ,欢迎star!

本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录,这是我花了6个月总结的一线大厂Java面试总结,本人已拿大厂offer,欢迎star

原文链接:blog.ouyangsihai.cn >> 【RPC 专栏】深入理解 RPC 之集群篇

点击上方“芋道源码”,选择“置顶公众号”

技术文章第一时间送达!

源码精品专栏

  • [精尽 Dubbo 原理与源码专栏( 已经完成 69+ 篇,预计总共 75+ 篇 )](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484647&idx=1&sn=9eb7e47d06faca20d530c70eec3b8d5c&chksm=fa497b56cd3ef2408f807e66e0903a5d16fbed149ef7374021302901d6e0260ad717d903e8d4&scene=21#wechat_redirect)

  • **[中文详细注释的开源项目](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484404&idx=1&sn=109f263e51b81ca9f270846dd16f6b3a&chksm=fa497c45cd3ef55358b09beb6e18ba04737799d3c0bc32baaa0796dc707b1275c0c555a249ba&scene=21#wechat_redirect)**

  • **[Java 并发源码合集](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484341&idx=1&sn=91d6fc7e8841a0f6046e1c2f4693a537&chksm=fa497c04cd3ef512f9249a5deb305a28b68d3ba44467f13fa8c6068711540b2f3e0a6f622ae3&scene=21#wechat_redirect)**
  • [**RocketMQ 源码合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484334&idx=1&sn=761e2659f474f06e7db935eae26e2b03&chksm=fa497c1fcd3ef509a02890b8e9f6bddb02e714f9c7e70cfbc37cd5bd75be64855225497fd3de&scene=21#wechat_redirect)
  • [**Sharding-JDBC 源码解析合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484360&idx=1&sn=0dae84944d2c388fdc1bbed868ac5b99&chksm=fa497c79cd3ef56f8487dda6d53e3772e0aa9812ee66376993c3445bc94920c01a03dd4a4b8f&scene=21#wechat_redirect)
  • [**Spring MVC 和 Security 源码合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484380&idx=1&sn=b4e0da1a314d77dcd170a25ed1ebb4c5&chksm=fa497c6dcd3ef57bcfb69a52c594bcb72e35d9bbe89fa87601b2a6c9f266d656b1ad2a5d4da4&scene=21#wechat_redirect)

  • [**MyCAT 源码解析合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484377&idx=3&sn=1323ac1a4099fac49c96686e58d1960d&chksm=fa497c68cd3ef57e5c3b683f9ead89f06ea5d01947672bfff8341cff2ab0c39c03274723c49a&scene=21#wechat_redirect)
  • 摘要: 原创出处 https://www.cnkirito.moe/rpc-cluster/ 「老徐」欢迎转载,保留摘要,谢谢!

  • 集群概述
  • 负载均衡
  • 负载均衡接口分析
  • 几种负载均衡算法
  • 高可用策略
  • 高可用接口分析
  • 其他集群相关的知识点
  • 参考资料
  • 上一篇文章分析了服务的注册与发现,这一篇文章着重分析下 RPC 框架都会用到的集群的相关知识。

    集群(Cluster)本身并不具备太多知识点,在分布式系统中,集群一般涵盖了负载均衡(LoadBalance),高可用(HA),路由(Route)等等概念,每个 RPC 框架对集群支持的程度不同,本文着重分析前两者–负载均衡和高可用。

    集群概述

    在此之前的《深入理解 RPC》系列文章,对 RPC 的分析着重还是放在服务之间的点对点调用,而分布式服务中每个服务必然不止一个实例,不同服务的实例和相同服务的多个实例构成了一个错综复杂的分布式环境,在服务治理框架中正是借助了 Cluster 这一层来应对这一难题。还是以博主较为熟悉的 motan 这个框架来介绍 Cluster 的作用。

    先来看看 Cluster 的顶层接口:

    
    @Spi(scope = Scope.PROTOTYPE)
    public interface ClusterT extends CallerT {
        @Override
        void init();
        void setUrl(URL url);
        void setLoadBalance(LoadBalance loadBalance);//1
        void setHaStrategy(HaStrategy haStrategy);//2
        void onRefresh(ListReferer referers);
        ListReferer getReferers();
        LoadBalance getLoadBalance();
    }
    

    在概述中,我们只关心 Cluster 接口中的两个方法,它揭示了 Cluster 在服务治理中的地位

    1 指定负载均衡算法

    2 指定高可用策略(容错机制)

    http://ov0zuistv.bkt.clouddn.com/TIM%E5%9B%BE%E7%89%8720180227151838.png

    我们需要对所谓的负载均衡策略和高可用策略有一定的理解,才能够搞清楚集群是如何运作的。

    负载均衡

    说到负载均衡,大多数人可能立刻联想到了 nginx。负载均衡可以分为服务端负载均衡和客户端负载均衡,而服务端负载均衡又按照实现方式的不同可以划分为软件负载均衡和硬件负载均衡,nginx 便是典型的软件负载均衡。而我们今天所要介绍的 RPC 中的负载均衡则主要是客户端负载均衡。如何区分也很简单,用笔者自己的话来描述下

    在 RPC 调用中,客户端持有所有的服务端节点引用,自行通过负载均衡算法选择一个节点进行访问,这便是客户端负载均衡。

    客户端如何获取到所有的服务端节点引用呢?一般是通过配置的方式,或者是从上一篇文章介绍的服务注册与发现组件中获取。

    负载均衡接口分析

    motan 中的负载均衡抽象:

    
    @Spi(scope = Scope.PROTOTYPE)
    public interface LoadBalanceT {
        void onRefresh(ListReferer referers);
        Referer select(Request request);//1
        void selectToHolder(Request request, ListReferer refersHolder);
        void setWeightString(String weightString);
    }
    

    ribbon 中的负载均衡抽象:

    
    public interface IRule{
        public Server choose(Object key);//1
        public void setLoadBalancer(ILoadBalancer lb);
        public ILoadBalancer getLoadBalancer();
    }
    

    1 对比下两个 RPC 框架对负载均衡的抽象可以发现,其实负载均衡策略干的事很简单,就是根据请求返回一个服务节点。在 motan 中对服务端的点对点调用抽象成了 Referer,而在 ribbon 中则是 Server。

    几种负载均衡算法

    负载均衡算法有几种经典实现,已经是老生常谈了,总结后主要有如下几个:

  • 轮询(Round Robin)
  • 加权轮询(Weight Round Robin)
  • 随机(Random)
  • 加权随机(Weight Random)
  • 源地址哈希(Hash)
  • 一致性哈希(ConsistentHash)
  • 最小连接数(Least Connections)
  • 低并发优先(Active Weight)
  • 每个框架支持的实现都不太一样,如 ribbon 支持的负载均衡策略

    策略名策略描述实现说明|------

    motan 支持的负载均衡策略

    策略名策略描述|------

    算法很多,有些负载均衡算法的实现复杂度也很高,请教了一些朋友,发现用的最多还是 RoundRobin,Random 这两种。可能和他们实现起来很简单有关,很多运用到 RPC 框架的项目也都是保持了默认配置。

    而这两种经典复杂均衡算法实现起来是很简单的,在此给出网上的简易实现,方便大家更直观的了解。

    服务列表

    
    public class IpMap
    {
        // 待路由的Ip列表,Key代表Ip,Value代表该Ip的权重
        public static HashMapString, Integer serverWeightMap =
                new HashMapString, Integer();
        static
        {
            serverWeightMap.put("192.168.1.100", 1);
            serverWeightMap.put("192.168.1.101", 1);
            // 权重为4
            serverWeightMap.put("192.168.1.102", 4);
            serverWeightMap.put("192.168.1.103", 1);
            serverWeightMap.put("192.168.1.104", 1);
            // 权重为3
            serverWeightMap.put("192.168.1.105", 3);
            serverWeightMap.put("192.168.1.106", 1);
            // 权重为2
            serverWeightMap.put("192.168.1.107", 2);
            serverWeightMap.put("192.168.1.108", 1);
            serverWeightMap.put("192.168.1.109", 1);
            serverWeightMap.put("192.168.1.110", 1);
        }
    }
    

    轮询(Round Robin)

    
    public class RoundRobin
    {
        private static Integer pos = 0;
    
        public static String getServer()
        {
            // 重建一个Map,避免服务器的上下线导致的并发问题
            MapString, Integer serverMap =
                    new HashMapString, Integer();
            serverMap.putAll(IpMap.serverWeightMap);
    
            // 取得Ip地址List
            SetString keySet = serverMap.keySet();
            ArrayListString keyList = new ArrayListString();
            keyList.addAll(keySet);
    
            String server = null;
            synchronized (pos)
            {
                if (pos  keySet.size())
                    pos = 0;
                server = keyList.get(pos);
                pos ++;
            }
    
            return server;
        }
    }
    

    随机(Random)

    
    public class Random
    {
        public static String getServer()
        {
            // 重建一个Map,避免服务器的上下线导致的并发问题
            MapString, Integer serverMap =
                    new HashMapString, Integer();
            serverMap.putAll(IpMap.serverWeightMap);
    
            // 取得Ip地址List
            SetString keySet = serverMap.keySet();
            ArrayListString keyList = new ArrayListString();
            keyList.addAll(keySet);
    
            java.util.Random random = new java.util.Random();
            int randomPos = random.nextInt(keyList.size());
    
            return keyList.get(randomPos);
        }
    }
    

    高可用策略

    高可用(HA)策略一般也被称作容错机制,分布式系统中出错是常态,但服务却不能停止响应,6个9一直是各个公司的努力方向。当一次请求失败之后,是重试呢?还是继续请求其他机器?抑或是记录下这次失败?下面是集群中的几种常用高可用策略:

  • 失效转移(failover) 当出现失败,重试其他服务器,通常用于读操作等幂等行为,重试会带来更长延迟。该高可用策略会受到负载均衡算法的限制,比如失效转移强调需要重试其他机器,但一致性 Hash 这类负载均衡算法便会与其存在冲突(个人认为一致性 Hash 在 RPC 的客户端负载均衡中意义不是很大)
  • 快速失败(failfast) 只发起一次调用,失败立即报错,通常用于非幂等性的写操作。 如果在 motan,dubbo 等配置中设置了重试次数0,又配置了该高可用策略,则重试效果也不会生效,由此可见集群中的各个配置可能是会相互影响的。
  • 失效安全(failsafe) 出现异常时忽略,但记录这一次失败,存入日志中。
  • 失效自动恢复(failback) 后台记录失败请求,定时重发。通常用于消息通知操作。
  • 并行调用(forking) 只要一个成功即返回,通常用于实时性要求较高的读操作。需要牺牲一定的服务资源。
  • 广播(broadcast) 广播调用,所有提供逐个调用,任意一台报错则报错。通常用于更新提供方本地状态,速度慢,任意一台报错则报错。
  • 高可用接口分析

    以 motan 的 HaStrategy 为例来介绍高可用在集群中的实现细节

    
    @Spi(scope = Scope.PROTOTYPE)
    public interface HaStrategyT {
        void setUrl(URL url);
        Response call(Request request, LoadBalance loadBalance);//1
    }
    

    1 如我之前所述,高可用策略依赖于请求和一个特定的负载均衡算法,返回一个响应。

    快速失败(failfast)

    
    @SpiMeta(name = "failfast")
    public class FailfastHaStrategyT extends AbstractHaStrategyT {
    
        @Override
        public Response call(Request request, LoadBalance loadBalance) {
            Referer refer = loadBalance.select(request);
            return refer.call(request);
        }
    }
    

    motan 实现了两个高可用策略,其一便是 failfast,非常简单,只进行一次负载均衡节点的选取,接着发起点对点的调用。

    失效转移(failover)

    
    @SpiMeta(name = "failover")
    public class FailoverHaStrategyT extends AbstractHaStrategyT {
    
        protected ThreadLocalListReferer referersHolder = new ThreadLocalListReferer() {
            @Override
            protected java.util.Listcom.weibo.api.motan.rpc.Referer initialValue() {
                return new ArrayListReferer();
            }
        };
    
        @Override
        public Response call(Request request, LoadBalance loadBalance) {
    
            ListReferer referers = selectReferers(request, loadBalance);
            if (referers.isEmpty()) {
                throw new MotanServiceException(String.format("FailoverHaStrategy No referers for request:%s, loadbalance:%s", request,
                        loadBalance));
            }
            URL refUrl = referers.get(0).getUrl();
            // 先使用method的配置
            int tryCount =
                    refUrl.getMethodParameter(request.getMethodName(), request.getParamtersDesc(), URLParamType.retries.getName(),
                            URLParamType.retries.getIntValue());
            // 如果有问题,则设置为不重试
            if (tryCount  0) {
                tryCount = 0;
            }
           // 只有 failover 策略才会有重试
            for (int i = 0; i = tryCount; i++) {
                Referer refer = referers.get(i % referers.size());
                try {
                    request.setRetries(i);
                    return refer.call(request);
                } catch (RuntimeException e) {
                    // 对于业务异常,直接抛出
                    if (ExceptionUtil.isBizException(e)) {
                        throw e;
                    } else if (i = tryCount) {
                        throw e;
                    }
                    LoggerUtil.warn(String.format("FailoverHaStrategy Call false for request:%s error=%s", request, e.getMessage()));
                }
            }
    
            throw new MotanFrameworkException("FailoverHaStrategy.call should not come here!");
        }
    
        protected ListReferer selectReferers(Request request, LoadBalance loadBalance) {
            ListReferer referers = referersHolder.get();
            referers.clear();
            loadBalance.selectToHolder(request, referers);
            return referers;
        }
    
    }
    

    其二的高可用策略是 failover,实现相对复杂一些,容忍在重试次数内的失败调用。这也是 motan 提供的默认策略。

    其他集群相关的知识点

    在 Dubbo 中也有 cluster 这一分层,除了 loadbalance 和 ha 这两层之外还包含了路由(Router)用来做读写分离,应用隔离;合并结果(Merger)用来做响应结果的分组聚合。

    在 SpringCloud-Netflix 中整合了 Zuul 来做服务端的负载均衡

    参考资料

  • 几种简单的负载均衡算法及其Java代码实现
  • 搜索业务和技术介绍及容错机制
  • 666. 彩蛋

    如果你对 Dubbo 感兴趣,欢迎加入我的知识星球一起交流。

    【RPC 专栏】深入理解 RPC 之集群篇

    目前在知识星球(https://t.zsxq.com/2VbiaEu)更新了如下 Dubbo 源码解析如下:

    01. 调试环境搭建
    02. 项目结构一览
    03. 配置 Configuration
    04. 核心流程一览

    05. 拓展机制 SPI

    1. 线程池

    07. 服务暴露 Export

    08. 服务引用 Refer

    1. 注册中心 Registry

    2. 动态编译 Compile

    3. 动态代理 Proxy

    4. 服务调用 Invoke

    5. 调用特性 

    6. 过滤器 Filter

    7. NIO 服务器

    8. P2P 服务器

    9. HTTP 服务器

    10. 序列化 Serialization

    11. 集群容错 Cluster

    12. 优雅停机

    13. 日志适配

    14. 状态检查

    15. 监控中心 Monitor

    16. 管理中心 Admin

    17. 运维命令 QOS

    18. 链路追踪 Tracing


    一共 60 篇++

    本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer,已开源在github ,欢迎star!

    本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录,这是我花了6个月总结的一线大厂Java面试总结,本人已拿大厂offer,欢迎star

    原文链接:blog.ouyangsihai.cn >> 【RPC 专栏】深入理解 RPC 之集群篇


     上一篇
    分布式消息队列 RocketMQ 源码分析 —— RPC 通信(一) 分布式消息队列 RocketMQ 源码分析 —— RPC 通信(一)
    点击上方“芋道源码”,选择“置顶公众号” 技术文章第一时间送达! 源码精品专栏 [精尽 Dubbo 原理与源码专栏( 已经完成 69+ 篇,预计总共 75+ 篇 )](http://mp.weixin.qq.com/s?__biz=MzU
    2021-04-05
    下一篇 
    【RPC 专题】深入理解 RPC 之服务注册与发现篇 【RPC 专题】深入理解 RPC 之服务注册与发现篇
    点击上方“芋道源码”,选择“置顶公众号” 技术文章第一时间送达! 源码精品专栏 [**中文详细注释的开源项目**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=22474844
    2021-04-05