解决HA模式下NameNode切换导致HMaster挂掉

问题:

在我们自己搭建大数据集群学习的时候,往往因为机器配置不够高,导致虚拟机卡顿,节点莫名其妙挂掉。

在Hadoop的高可用集群下,机器配置不够两个namenode一直自动切换状态,导致了HBase集群的Hmaster节点挂掉。

问题产生的原因:

我们查看HBase的master日志:

# 进入日志文件目录
[root@hadoop001 ~]# cd /opt/module/hbase-1.3.1/logs/
[root@hadoop001 logs]# vim hbase-root-master-hadoop001.log 

image-20210806102440917

从日志中很容易发现是namenode主备切换导致的错误。

解决方法:

1、修改hbase-site.xml配置文件

image-20210806100600458

修改base.roodir的配置

<property>
     <name>hbase.roodir</name>
     <value>hdfs://hadoop001:9000/hbase</value>
</property>

# 修改为
<property>
     <name>hbase.roodir</name>
     <value>hdfs://ns/hbase</value>
</property>

# 注意,这里的ns为hadoop的dfs.nameservices的值(hdfs-site-xml中配置,根据自己的配置填写)

2、建立软连接

[root@hadoop001 ~]# ln -s /opt/module/hadoop-2.7.6/etc/hadoop/hdfs-site.xml /opt/module/hbase-1.3.1/conf/hdfs-site.xml
[root@hadoop001 ~]# ln -s /opt/module/hadoop-2.7.6/etc/hadoop/core-site.xml /opt/module/hbase-1.3.1/conf/core-site.xml 

3、将所有集群的Hbase配置文件同步

使用scp指令分发到其他节点即可

然后重启集群,即可解决Hmaster节点挂掉问题

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐