eureka

发布日期: 2021-04-05

作者: 欧阳思海

文章字数: 6.4k

阅读时长: 26 分

阅读次数:

本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer，已开源在github ，欢迎star！

本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录，这是我花了6个月总结的一线大厂Java面试总结，本人已拿大厂offer，欢迎star

原文链接：blog.ouyangsihai.cn >> 注册中心 Eureka 源码解析 —— Eureka-Server 集群同步

源码精品专栏

[精尽 Dubbo 原理与源码专栏( 已经完成 69+ 篇，预计总共 75+ 篇 )](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484647&idx=1&sn=9eb7e47d06faca20d530c70eec3b8d5c&chksm=fa497b56cd3ef2408f807e66e0903a5d16fbed149ef7374021302901d6e0260ad717d903e8d4&scene=21#wechat_redirect)

**[中文详细注释的开源项目](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484404&idx=1&sn=109f263e51b81ca9f270846dd16f6b3a&chksm=fa497c45cd3ef55358b09beb6e18ba04737799d3c0bc32baaa0796dc707b1275c0c555a249ba&scene=21#wechat_redirect)**

**[Java 并发源码合集](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484341&idx=1&sn=91d6fc7e8841a0f6046e1c2f4693a537&chksm=fa497c04cd3ef512f9249a5deb305a28b68d3ba44467f13fa8c6068711540b2f3e0a6f622ae3&scene=21#wechat_redirect)**

[**RocketMQ 源码合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484334&idx=1&sn=761e2659f474f06e7db935eae26e2b03&chksm=fa497c1fcd3ef509a02890b8e9f6bddb02e714f9c7e70cfbc37cd5bd75be64855225497fd3de&scene=21#wechat_redirect)

[**Sharding-JDBC 源码解析合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484360&idx=1&sn=0dae84944d2c388fdc1bbed868ac5b99&chksm=fa497c79cd3ef56f8487dda6d53e3772e0aa9812ee66376993c3445bc94920c01a03dd4a4b8f&scene=21#wechat_redirect)

[**Spring MVC 和 Security 源码合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484380&idx=1&sn=b4e0da1a314d77dcd170a25ed1ebb4c5&chksm=fa497c6dcd3ef57bcfb69a52c594bcb72e35d9bbe89fa87601b2a6c9f266d656b1ad2a5d4da4&scene=21#wechat_redirect)

[**MyCAT 源码解析合集**](http://mp.weixin.qq.com/s?__biz=MzUzMTA2NTU2Ng==&mid=2247484377&idx=3&sn=1323ac1a4099fac49c96686e58d1960d&chksm=fa497c68cd3ef57e5c3b683f9ead89f06ea5d01947672bfff8341cff2ab0c39c03274723c49a&scene=21#wechat_redirect)

中文详细注释的开源项目

RocketMQ 源码合集

Spring MVC 和 Security 源码合集

摘要: 原创出处 http://www.iocoder.cn/Eureka/server-cluster/ 「芋道源码」欢迎转载，保留摘要，谢谢！

本文主要基于 Eureka 1.8.X 版本

1. 概述
1. 集群节点初始化与更新
2.1 集群节点启动
2.2 更新集群节点信息
2.3 集群节点
1. 获取初始注册信息
1. 同步注册信息
4.1 同步操作类型
4.2 发起 Eureka-Server 同步操作
4.3 接收 Eureka-Server 同步操作
4.4 处理 Eureka-Server 同步结果

1. 概述

本文主要分享 Eureka-Server 集群同步注册信息。

Eureka-Server 集群如下图：

Eureka-Server 集群不区分主从节点或者 Primary & Secondary 节点，所有节点相同角色( 也就是没有角色 )，完全对等。
Eureka-Client 可以向任意 Eureka-Client 发起任意读写操作，Eureka-Server 将操作复制到另外的 Eureka-Server 以达到最终一致性。注意，Eureka-Server 是选择了 AP 的组件。

Eureka-Server 可以使用直接配置所有节点的服务地址，或者基于 DNS 配置。推荐阅读：《Spring Cloud构建微服务架构（六）高可用服务注册中心》。

本文主要类在 com.netflix.eureka.cluster 包下。

OK，让我们开始愉快的遨游在代码的海洋。

推荐 Spring Cloud 书籍：

请支持正版。下载盗版，等于主动编写低级 BUG 。
程序猿DD —— 《Spring Cloud微服务实战》
周立 —— 《Spring Cloud与Docker微服务架构实战》
两书齐买，京东包邮。

推荐 Spring Cloud 视频：

Java 微服务实践 - Spring Boot
Java 微服务实践 - Spring Cloud
Java 微服务实践 - Spring Boot / Spring Cloud

ps ：注意，本文提到的同步，准确来说是**复制( Replication )**。

2. 集群节点初始化与更新

com.netflix.eureka.cluster.PeerEurekaNodes ，Eureka-Server 集群节点集合。构造方法如下：


public class PeerEurekaNodes {

    private static final Logger logger = LoggerFactory.getLogger(PeerEurekaNodes.class);

    /**
     * 应用实例注册表
     */
    protected final PeerAwareInstanceRegistry registry;
    /**
     * Eureka-Server 配置
     */
    protected final EurekaServerConfig serverConfig;
    /**
     * Eureka-Client 配置
     */
    protected final EurekaClientConfig clientConfig;
    /**
     * Eureka-Server 编解码
     */
    protected final ServerCodecs serverCodecs;
    /**
     * 应用实例信息管理器
     */
    private final ApplicationInfoManager applicationInfoManager;

    /**
     * Eureka-Server 集群节点数组
     */
    private volatile ListPeerEurekaNode peerEurekaNodes = Collections.emptyList();
    /**
     * Eureka-Server 服务地址数组
     */
    private volatile SetString peerEurekaNodeUrls = Collections.emptySet();

    /**
     * 定时任务服务
     */
    private ScheduledExecutorService taskExecutor;

    @Inject
    public PeerEurekaNodes(
            PeerAwareInstanceRegistry registry,
            EurekaServerConfig serverConfig,
            EurekaClientConfig clientConfig,
            ServerCodecs serverCodecs,
            ApplicationInfoManager applicationInfoManager) {
        this.registry = registry;
        this.serverConfig = serverConfig;
        this.clientConfig = clientConfig;
        this.serverCodecs = serverCodecs;
        this.applicationInfoManager = applicationInfoManager;
    }
}

peerEurekaNodes, peerEurekaNodeUrls, taskExecutor 属性，在构造方法中未设置和初始化，而是在 PeerEurekaNodes#start() 方法，设置和初始化，下文我们会解析这个方法。
Eureka-Server 在初始化时，调用 EurekaBootStrap#getPeerEurekaNodes(…) 方法，创建 PeerEurekaNodes ，点击链接查看该方法的实现。

2.1 集群节点启动

调用 PeerEurekaNodes#start() 方法，集群节点启动，主要完成两个逻辑：

初始化集群节点信息
初始化固定周期( 默认：10 分钟，可配置 )更新集群节点信息的任务

代码如下：


  1: public void start() {
  2:     // 创建 定时任务服务
  3:     taskExecutor = Executors.newSingleThreadScheduledExecutor(
  4:             new ThreadFactory() {
  5:                 @Override
  6:                 public Thread newThread(Runnable r) {
  7:                     Thread thread = new Thread(r, "Eureka-PeerNodesUpdater");
  8:                     thread.setDaemon(true);
  9:                     return thread;
 10:                 }
 11:             }
 12:     );
 13:     try {
 14:         // 初始化 集群节点信息
 15:         updatePeerEurekaNodes(resolvePeerUrls());
 16:         // 初始化 初始化固定周期更新集群节点信息的任务
 17:         Runnable peersUpdateTask = new Runnable() {
 18:             @Override
 19:             public void run() {
 20:                 try {
 21:                     updatePeerEurekaNodes(resolvePeerUrls());
 22:                 } catch (Throwable e) {
 23:                     logger.error("Cannot update the replica Nodes", e);
 24:                 }
 25: 
 26:             }
 27:         };
 28:         taskExecutor.scheduleWithFixedDelay(
 29:                 peersUpdateTask,
 30:                 serverConfig.getPeerEurekaNodesUpdateIntervalMs(),
 31:                 serverConfig.getPeerEurekaNodesUpdateIntervalMs(),
 32:                 TimeUnit.MILLISECONDS
 33:         );
 34:     } catch (Exception e) {
 35:         throw new IllegalStateException(e);
 36:     }
 37:     // 打印 集群节点信息
 38:     for (PeerEurekaNode node : peerEurekaNodes) {
 39:         logger.info("Replica node URL:  " + node.getServiceUrl());
 40:     }
 41: }

第 15 行 && 第 21 行：调用 #updatePeerEurekaNodes() 方法，更新集群节点信息。

2.2 更新集群节点信息

调用 #resolvePeerUrls() 方法，获得 Eureka-Server 集群服务地址数组，代码如下：


  1: protected ListString resolvePeerUrls() {
  2:     // 获得 Eureka-Server 集群服务地址数组
  3:     InstanceInfo myInfo = applicationInfoManager.getInfo();
  4:     String zone = InstanceInfo.getZone(clientConfig.getAvailabilityZones(clientConfig.getRegion()), myInfo);
  5:     ListString replicaUrls = EndpointUtils.getDiscoveryServiceUrls(clientConfig, zone, new EndpointUtils.InstanceInfoBasedUrlRandomizer(myInfo));
  6: 
  7:     // 移除自己（避免向自己同步）
  8:     int idx = 0;
  9:     while (idx  replicaUrls.size()) {
 10:         if (isThisMyUrl(replicaUrls.get(idx))) {
 11:             replicaUrls.remove(idx);
 12:         } else {
 13:             idx++;
 14:         }
 15:     }
 16:     return replicaUrls;
 17: }

第 2 至 5 行：获得 Eureka-Server 集群服务地址数组。EndpointUtils#getDiscoveryServiceUrls(…) 方法，逻辑与《Eureka 源码解析 —— EndPoint 与解析器》「3.4 ConfigClusterResolver」基本类似。EndpointUtils 正在逐步，猜测未来这里会替换。
第 7 至 15 行：移除自身节点，避免向自己同步。

调用 #updatePeerEurekaNodes() 方法，更新集群节点信息，主要完成两部分逻辑：

添加新增的集群节点
关闭删除的集群节点

代码如下：


  1: protected void updatePeerEurekaNodes(ListString newPeerUrls) {
  2:     if (newPeerUrls.isEmpty()) {
  3:         logger.warn("The replica size seems to be empty. Check the route 53 DNS Registry");
  4:         return;
  5:     }
  6: 
  7:     // 计算 新增的集群节点地址
  8:     SetString toShutdown = new HashSet(peerEurekaNodeUrls);
  9:     toShutdown.removeAll(newPeerUrls);
 10: 
 11:     // 计算 删除的集群节点地址
 12:     SetString toAdd = new HashSet(newPeerUrls);
 13:     toAdd.removeAll(peerEurekaNodeUrls);
 14: 
 15:     if (toShutdown.isEmpty() && toAdd.isEmpty()) { // No change
 16:         return;
 17:     }
 18: 
 19:     // 关闭删除的集群节点
 20:     // Remove peers no long available
 21:     ListPeerEurekaNode newNodeList = new ArrayList(peerEurekaNodes);
 22:     if (!toShutdown.isEmpty()) {
 23:         logger.info("Removing no longer available peer nodes {}", toShutdown);
 24:         int i = 0;
 25:         while (i  newNodeList.size()) {
 26:             PeerEurekaNode eurekaNode = newNodeList.get(i);
 27:             if (toShutdown.contains(eurekaNode.getServiceUrl())) {
 28:                 newNodeList.remove(i);
 29:                 eurekaNode.shutDown(); // 关闭
 30:             } else {
 31:                 i++;
 32:             }
 33:         }
 34:     }
 35: 
 36:     // 添加新增的集群节点
 37:     // Add new peers
 38:     if (!toAdd.isEmpty()) {
 39:         logger.info("Adding new peer nodes {}", toAdd);
 40:         for (String peerUrl : toAdd) {
 41:             newNodeList.add(createPeerEurekaNode(peerUrl));
 42:         }
 43:     }
 44: 
 45:     // 赋值
 46:     this.peerEurekaNodes = newNodeList;
 47:     this.peerEurekaNodeUrls = new HashSet(newPeerUrls);
 48: }

第 7 至 9 行：**计算**新增的集群节点地址。

第 11 至 13 行：**计算**删除的集群节点地址。

第 19 至 34 行：**关闭**删除的集群节点。

第 36 至 43 行：**添加**新增的集群节点。调用 `#createPeerEurekaNode(peerUrl)` 方法，创建集群节点，代码如下：

  1: protected PeerEurekaNode createPeerEurekaNode(String peerEurekaNodeUrl) {
  2:     HttpReplicationClient replicationClient = JerseyReplicationClient.createReplicationClient(serverConfig, serverCodecs, peerEurekaNodeUrl);
  3:     String targetHost = hostFromUrl(peerEurekaNodeUrl);
  4:     if (targetHost == null) {
  5:         targetHost = "host";
  6:     }
  7:     return new PeerEurekaNode(registry, targetHost, peerEurekaNodeUrl, replicationClient, serverConfig);
  8: }

第 11 至 13 行：计算删除的集群节点地址。

第 36 至 43 行：添加新增的集群节点。调用 #createPeerEurekaNode(peerUrl) 方法，创建集群节点，代码如下：

2.3 集群节点

com.netflix.eureka.cluster.PeerEurekaNode ，单个集群节点。

点击链接查看构造方法

第 129 行：创建 ReplicationTaskProcessor 。在「4.1.2 同步操作任务处理器」详细解析
第 131 至 140 行：创建批量任务分发器，在《Eureka 源码解析 —— 任务批处理》有详细解析。
第 142 至 151 行：创建单任务分发器，用于 Eureka-Server 向亚马逊 AWS 的 ASG ( Autoscaling Group ) 同步状态。暂时跳过。

3. 获取初始注册信息

Eureka-Server 启动时，调用 PeerAwareInstanceRegistryImpl#syncUp() 方法，从集群的一个 Eureka-Server 节点获取初始注册信息，代码如下：


  1: @Override
  2: public int syncUp() {
  3:     // Copy entire entry from neighboring DS node
  4:     int count = 0;
  5: 
  6:     for (int i = 0; ((i  serverConfig.getRegistrySyncRetries()) && (count == 0)); i++) {
  7:         // 未读取到注册信息，sleep 等待
  8:         if (i  0) {
  9:             try {
 10:                 Thread.sleep(serverConfig.getRegistrySyncRetryWaitMs());
 11:             } catch (InterruptedException e) {
 12:                 logger.warn("Interrupted during registry transfer..");
 13:                 break;
 14:             }
 15:         }
 16: 
 17:         // 获取注册信息
 18:         Applications apps = eurekaClient.getApplications();
 19:         for (Application app : apps.getRegisteredApplications()) {
 20:             for (InstanceInfo instance : app.getInstances()) {
 21:                 try {
 22:                     if (isRegisterable(instance)) { // 判断是否能够注册
 23:                         register(instance, instance.getLeaseInfo().getDurationInSecs(), true); // 注册
 24:                         count++;
 25:                     }
 26:                 } catch (Throwable t) {
 27:                     logger.error("During DS init copy", t);
 28:                 }
 29:             }
 30:         }
 31:     }
 32:     return count;
 33: }

第 7 至 15 行：未获取到注册信息，sleep 等待再次重试。
第 17 至 30 行：获取注册信息，若获取到，注册到自身节点。
- 第 22 行：判断应用实例是否能够注册到自身节点。主要用于亚马逊 AWS 环境下的判断，若非部署在亚马逊里，都返回 true 。点击链接查看实现。
- 第 23 行：调用 #register() 方法，注册应用实例到自身节点。在《Eureka 源码解析 —— 应用实例注册发现（一）之注册》有详细解析。
若调用 #syncUp() 方法，未获取到应用实例，则 Eureka-Server 会有一段时间( 默认：5 分钟，可配 )不允许被 Eureka-Client 获取注册信息，避免影响 Eureka-Client 。

标记 Eureka-Server 启动时，未获取到应用实例，代码如下：

// PeerAwareInstanceRegistryImpl.java

private boolean peerInstancesTransferEmptyOnStartup = true;
public void openForTraffic(ApplicationInfoManager applicationInfoManager, int count) {
    // … 省略其他代码
    if (count  0) {
        this.peerInstancesTransferEmptyOnStartup = false;
    }
    // … 省略其他代码
}

判断 Eureka-Server 是否允许被 Eureka-Client 获取注册信息，代码如下：

// PeerAwareInstanceRegistryImpl.java
public boolean shouldAllowAccess(boolean remoteRegionRequired) {
   if (this.peerInstancesTransferEmptyOnStartup) {
       // 设置启动时间
       this.startupTime = System.currentTimeMillis();
       if (!(System.currentTimeMillis()  this.startupTime + serverConfig.getWaitTimeInMsWhenSyncEmpty())) {
           return false;
       }
   }
   // ... 省略其他代码
   return true;
}

判断 Eureka-Server 是否允许被 Eureka-Client 获取注册信息，代码如下：


// PeerAwareInstanceRegistryImpl.java
public boolean shouldAllowAccess(boolean remoteRegionRequired) {
   if (this.peerInstancesTransferEmptyOnStartup) {
       // 设置启动时间
       this.startupTime = System.currentTimeMillis();
       if (!(System.currentTimeMillis()  this.startupTime + serverConfig.getWaitTimeInMsWhenSyncEmpty())) {
           return false;
       }
   }
   // ... 省略其他代码
   return true;
}

4. 同步注册信息

Eureka-Server 集群同步注册信息如下图：

Eureka-Server 接收到 Eureka-Client 的 Register、Heartbeat、Cancel、StatusUpdate、DeleteStatusOverride 操作，固定间隔( 默认值：500 毫秒，可配 )向 Eureka-Server 集群内其他节点同步( 准实时，非实时 )。

4.1 同步操作类型

com.netflix.eureka.registry.PeerAwareInstanceRegistryImpl.Action ，同步操作类型，代码如下：


public enum Action {
   Heartbeat, Register, Cancel, StatusUpdate, DeleteStatusOverride;

   // ... 省略监控相关属性
}

Register ，在《Eureka 源码解析 —— 应用实例注册发现（一）之注册》有详细解析
Heartbeat ，在《Eureka 源码解析 —— 应用实例注册发现（二）之续租》有详细解析
Cancel ，在《Eureka 源码解析 —— 应用实例注册发现（三）之下线》有详细解析
StatusUpdate ，在《Eureka 源码解析 —— 应用实例注册发现（八）之覆盖状态》有详细解析
DeleteStatusOverride ，在《Eureka 源码解析 —— 应用实例注册发现（八）之覆盖状态》有详细解析

4.2 发起 Eureka-Server 同步操作

Eureka-Server 在完成 Eureka-Client 发起的上述操作在自身节点的执行后，向集群内其他 Eureka-Server 发起同步操作。以 Register 操作举例子，代码如下：


// PeerAwareInstanceRegistryImpl.java
public void register(final InstanceInfo info, final boolean isReplication) {
   // 租约过期时间
   int leaseDuration = Lease.DEFAULT_DURATION_IN_SECS;
   if (info.getLeaseInfo() != null && info.getLeaseInfo().getDurationInSecs()  0) {
       leaseDuration = info.getLeaseInfo().getDurationInSecs();
   }
   // 注册应用实例信息
   super.register(info, leaseDuration, isReplication);
   // Eureka-Server 复制
   replicateToPeers(Action.Register, info.getAppName(), info.getId(), info, null, isReplication);
}

最后一行，调用 #replicateToPeers(…) 方法，传递对应的同步操作类型，发起同步操作。

#replicateToPeers(...) 方法，代码如下：


  1: private void replicateToPeers(Action action, String appName, String id,
  2:                               InstanceInfo info /* optional */,
  3:                               InstanceStatus newStatus /* optional */, boolean isReplication) {
  4:     Stopwatch tracer = action.getTimer().start();
  5:     try {
  6:         if (isReplication) {
  7:             numberOfReplicationsLastMin.increment();
  8:         }
  9: 
 10:         // Eureka-Server 发起的请求 或者 集群为空
 11:         // If it is a replication already, do not replicate again as this will create a poison replication
 12:         if (peerEurekaNodes == Collections.EMPTY_LIST || isReplication) {
 13:             return;
 14:         }
 15: 
 16:         for (final PeerEurekaNode node : peerEurekaNodes.getPeerEurekaNodes()) {
 17:             // If the url represents this host, do not replicate to yourself.
 18:             if (peerEurekaNodes.isThisMyUrl(node.getServiceUrl())) {
 19:                 continue;
 20:             }
 21:             replicateInstanceActionsToPeers(action, appName, id, info, newStatus, node);
 22:         }
 23:     } finally {
 24:         tracer.stop();
 25:     }
 26: }

第 10 至 14 行：Eureka-Server 在处理上述操作( Action )，无论来自 Eureka-Client 发起请求，还是 Eureka-Server 发起同步，调用的内部方法相同，通过 isReplication=true 参数，避免死循环同步。
第 16 至 22 行：循环集群内每个节点，调用 #replicateInstanceActionsToPeers(…) 方法，发起同步操作。

#replicateInstanceActionsToPeers(...) 方法，代码如下：


 // ... 省略代码，太长了。

**Cancel** ：调用 `PeerEurekaNode#cancel(…)` 方法，点击链接查看实现。
**Heartbeat** ：调用 `PeerEurekaNode#heartbeat(…)` 方法，点击链接查看实现。
**Register** ：调用 `PeerEurekaNode#register(…)` 方法，点击链接查看实现。
**StatusUpdate** ：调用 `PeerEurekaNode#statusUpdate(…)` 方法，点击链接查看实现。
**DeleteStatusOverride** ：调用 `PeerEurekaNode#deleteStatusOverride(…)` 方法，点击链接查看实现。

上面的每个方法实现，我们**都**会看到类似这么一段代码：

batchingDispatcher.process(
    taskId("${action}", appName, id), // id
    new InstanceReplicationTask(targetHost, Action.Cancel, appName, id) {
    @Override
    public EurekaHttpResponse<Void> execute() {
        return replicationClient.doString(...);
    }
 
    @Override
    public void handleFailure(int statusCode, Object responseEntity) throws Throwable {
        // do Something...
    }
 
}, // ReplicationTask 子类
expiryTime
)

    @Override
    public void handleFailure(int statusCode, Object responseEntity) throws Throwable {
        // do Something…
    }

}, // ReplicationTask 子类
expiryTime
)

`#task(...)` 方法，生成同步操作任务**编号**。代码如下：

private static String taskId(String requestType, String appName, String id) {
   return requestType + '#' + appName + '/' + id;
}

Heartbeat ：调用 PeerEurekaNode#heartbeat(…) 方法，点击链接查看实现。

StatusUpdate ：调用 PeerEurekaNode#statusUpdate(…) 方法，点击链接查看实现。

上面的每个方法实现，我们都会看到类似这么一段代码：

InstanceReplicationTask ，同步操作任务，在「4.1.1 同步操作任务」详细解析。

expiryTime ，任务过期时间。

4.1.1 同步操作任务

`com.netflix.eureka.cluster.ReplicationTask` ，同步任务**抽象类**
- 第 4 行：创建批量提交同步操作任务的请求对象( ReplicationList ) 。比较易懂，咱就不啰嗦贴代码了。

本人花费半年的时间总结的《Java面试指南》已拿腾讯等大厂offer，已开源在github ，欢迎star！

本文GitHub https://github.com/OUYANGSIHAI/JavaInterview 已收录，这是我花了6个月总结的一线大厂Java面试总结，本人已拿大厂offer，欢迎star

原文链接：blog.ouyangsihai.cn >> 注册中心 Eureka 源码解析 —— Eureka-Server 集群同步