Eureka注册不上或注册后IP不对(多网卡的坑)

一、问题发现

​ 使用SpringCloud一套的微服务项目在开发测试环境都再正常不过了,到生产部署的时候启动服务就死活无法启动,去看启动日志发现,在获取配置中心配置时连接不到配置中心了,报了一个Host Unreachable的错。

在这里插入图片描述
​ 按道理来说这个错很简单,就是网络不通导致的。但是问题就出现在这儿,我直接ping注册中心和配置中心的IP是通的,没有问题。

​ 再仔细一看才发现事情并不简单,我们生产环境开放的是一套10.21.xx.xx的网段IP,但是日志中却去寻找29.192.xx.xx去了,打开eureka控制台发现注册到注册中心上的配置中心确实是29.192.xx.xx,并且注册中心显示的自己的IP也是29.192.xx.xx。配置中心启动没问题是因为他和注册中心在一台机器上,所以用什么样的ip都无关紧要,其他服务想要拉取配置中心所在机器的配置就拉不到了。

​ 问题是我们其他服务在配置eureka client的时候填写的eureka server地址确实都是10.21.xx.xx,为什么注册中心会自动改成29.192.xx.xx。咨询了客户方之后才知道,29.192.xx.xx这个IP是用来监控服务器用的,各服务器之间都通过这个IP发送心跳来保持在线状态,不能做业务使用。

二、拨云见日

知道这个IP从哪儿来下一步就要分析解决了,先查看网络配置
在这里插入图片描述

​ 确实从网卡配置顺序上来说eureka client选取了第一块网卡配置的IP向注册中心注册,这就导致了无法连接的问题。

​ 那么问题就指向了eureka client是如何选取网卡IP进行注册的以及如何能让eureka client根据我们的意愿选择我们想要的IP进行注册。

​ 去官网查找并没有找到关于eureka client是如何选取网卡IP的描述,那么就只能去扒源码了。最终找到是在com.netflix.appinfo包下的InstanceInfo类封装了本机信息,其中就包括了IP地址的获取方法。在 Spring Cloud 环境下,Eureka Client并没有自己实现探测本机IP的逻辑,而是交给Spring的InetUtils工具类的findFirstNonLoopbackAddress()方法完成的,下边贴出这个方法的源码:

public InetAddress findFirstNonLoopbackAddress() {
  InetAddress result = null;
  try {
    int lowest = Integer.MAX_VALUE;
    for (Enumeration<NetworkInterface> nics = NetworkInterface
         .getNetworkInterfaces(); nics.hasMoreElements();) {
      NetworkInterface ifc = nics.nextElement();
      if (ifc.isUp()) {
        log.trace("Testing interface: " + ifc.getDisplayName());
        if (ifc.getIndex() < lowest || result == null) {
          lowest = ifc.getIndex();
        }
        else if (result != null) {
          continue;
        }
        // @formatter:off
        if (!ignoreInterface(ifc.getDisplayName())) {
          for (Enumeration<InetAddress> addrs = ifc
               .getInetAddresses(); addrs.hasMoreElements();) {
            InetAddress address = addrs.nextElement();
            if (address instanceof Inet4Address
                && !address.isLoopbackAddress()
                && isPreferredAddress(address)) {
              log.trace("Found non-loopback interface: "
                        + ifc.getDisplayName());
              result = address;
            }
          }
        }
        // @formatter:on
      }
    }
  }
  catch (IOException ex) {
    log.error("Cannot get first non-loopback address", ex);
  }
  if (result != null) {
    return result;
  }
  try {
    return InetAddress.getLocalHost();
  }
  catch (UnknownHostException e) {
    log.warn("Unable to retrieve localhost");
  }
  return null;
}

​ 这个方法中通过NetworkInterface接口获取到网卡的列表信息进行循环获取,首先判断是否启用(如果网卡禁用再获取IP自然就没意义),在启用状态下拿到网卡的索引值(目的是为了获取网卡的最小索引值),最后还要判断是否在忽略列表中,如果不在忽略列表才能选用。在这一系列的操作过后如果没能获取到最终结果,那么最后就会调用jdk的getLocalHost()方法来获取IP地址并返回。

​ 总体来说,这个工具类会获取所有网卡,依次进行遍历,取ip地址合理、索引值最小、已经启动且不在忽略列表的网卡的ip地址作为结果。如果仍然没有找到合适的IP, 那么就将InetAddress.getLocalHost()做为最后的fallback方案。

三、开刀治病

​ 有了源码的加持,想要达到我们最终获取指定IP的目的就条条大路通罗马了。

1、忽略指定网卡

​ 在bootstrap.yml中添加忽略属性spring.cloud.inetutils.gnored-interfaces[0]=ens161 # 忽略ens161, 支持正则表达式 注意,不能在application.yml中添加,玩过SpringCloud的应该都懂。

2、禁用无关网卡

​ 如上面网卡信息图即禁用掉ens161和ens256,最终只保留ens224网卡生效,这样一来获取到启用的网卡也就只有一块了。

查看网卡信息(生产环境最终没敢禁用,以下拿我本地环境测试)

[melonrind@melonrind ~]$ ifconfig
enp0s3: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 10.0.2.15  netmask 255.255.255.0  broadcast 10.0.2.255
        inet6 fe80::9ee2:1871:6417:19a9  prefixlen 64  scopeid 0x20<link>
        ether 08:00:27:75:08:94  txqueuelen 1000  (Ethernet)
        RX packets 44098  bytes 59104330 (56.3 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 21246  bytes 1370966 (1.3 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

enp0s8: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.56.200  netmask 255.255.255.0  broadcast 192.168.56.255
        inet6 fe80::1c58:28df:b483:fb7a  prefixlen 64  scopeid 0x20<link>
        ether 08:00:27:f3:69:ec  txqueuelen 1000  (Ethernet)
        RX packets 333237  bytes 148991996 (142.0 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 396257  bytes 138439800 (132.0 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 127.0.0.1  netmask 255.0.0.0
        inet6 ::1  prefixlen 128  scopeid 0x10<host>
        loop  txqueuelen 1000  (Local Loopback)
        RX packets 224153  bytes 56176690 (53.5 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 224153  bytes 56176690 (53.5 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
[melonrind@melonrind ~]$ nmcli con sh
NAME    UUID                                  TYPE      DEVICE
enp0s3  e0a2f8ed-112e-41ed-9f35-89502e325c18  ethernet  enp0s3
enp0s8  221018b1-6e99-48fc-8c3d-fe7dee581328  ethernet  enp0s8

这里就可以禁用掉enp0s3网卡,保留enp0s8

[root@melonrind ~]# ifdown enp0s3
Device 'enp0s3' successfully disconnected.

启用可以用如下命令

[root@melonrind ~]# ifup enp0s3
3、配置host

​ 当网查遍历逻辑都没有找到合适ip时会走JDK的InetAddress.getLocalHost()。该方法会返回当前主机的hostname, 然后会根据hostname解析出对应的ip。因此如果确认没有找到合适的IP的情况下,可以配置本机的hostname和/etc/hosts文件,直接将本机的主机名映射到指定IP地址。

4、手工指定实例IP

​ eureka client在启动时可以对该eureka client的实例进行配置,因此这里也可以自己指定IP地址。可以添加如下配置:

# 指定此实例的ip
eureka.instance.ip-address=${你指定的ip地址}
# 注册时使用ip而不是主机名
eureka.instance.prefer-ip-address=true

不过该配置需要添加在eureka client配置之上,形如:

eureka:
  instance:
    ip-address: 192.168.56.1
    prefer-ip-address: true
  client:
    register-with-eureka: true
    fetch-registry: true
    service-url:
      defaultZone: http://192.168.56.1:9130/eureka
    registry-fetch-interval-seconds: 30
    eureka-server-connect-timeout-seconds: 5
    eureka-server-read-timeout-seconds: 5
    filter-only-up-instances:  true
    eureka-connection-idle-timeout-seconds: 30
    eureka-server-total-connections: 200
    eureka-server-total-connections-per-host: 50
5、服务启动时指定IP

​ 在不方便修改配置文件时可以选用此方式(我就是用此方式解决),在服务启动时添加参数:java -jar -Dspring.cloud.inetutils.preferred-networks=192.168.56.1 ...

至此,该问题得到解决,又是惊心动魄的一天。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐