解决HA模式下NameNode切换导致HMaster挂掉

解决HA模式下NameNode切换导致HMaster挂掉问题：在我们自己搭建大数据集群学习的时候，往往因为机器配置不够高，导致虚拟机卡顿，节点莫名其妙挂掉。在Hadoop的高可用集群下，机器配置不够两个namenode一直自动切换状态，导致了HBase集群的Hmaster节点挂掉。问题产生的原因：我们查看HBase的master日志：# 进入日志文件目录[root@hadoop001 ~]# cd

简丶致

1128人浏览 · 2021-08-06 10:59:57

简丶致 · 2021-08-06 10:59:57 发布

解决HA模式下NameNode切换导致HMaster挂掉

问题：

在我们自己搭建大数据集群学习的时候，往往因为机器配置不够高，导致虚拟机卡顿，节点莫名其妙挂掉。

在Hadoop的高可用集群下，机器配置不够两个namenode一直自动切换状态，导致了HBase集群的Hmaster节点挂掉。

问题产生的原因：

我们查看HBase的master日志：

# 进入日志文件目录
[root@hadoop001 ~]# cd /opt/module/hbase-1.3.1/logs/
[root@hadoop001 logs]# vim hbase-root-master-hadoop001.log

从日志中很容易发现是namenode主备切换导致的错误。

解决方法：

1、修改hbase-site.xml配置文件

修改base.roodir的配置

<property>
     <name>hbase.roodir</name>
     <value>hdfs://hadoop001:9000/hbase</value>
</property>

# 修改为
<property>
     <name>hbase.roodir</name>
     <value>hdfs://ns/hbase</value>
</property>

# 注意，这里的ns为hadoop的dfs.nameservices的值（hdfs-site-xml中配置，根据自己的配置填写）

2、建立软连接

[root@hadoop001 ~]# ln -s /opt/module/hadoop-2.7.6/etc/hadoop/hdfs-site.xml /opt/module/hbase-1.3.1/conf/hdfs-site.xml
[root@hadoop001 ~]# ln -s /opt/module/hadoop-2.7.6/etc/hadoop/core-site.xml /opt/module/hbase-1.3.1/conf/core-site.xml

3、将所有集群的Hbase配置文件同步