关于在你的虚拟机上搭建hadoop集群的详细教程

安装jdk首先，需要安装jdk环境，因为hadoop是由Java编写。rpm -ivh jdk-8u91-linux-x64.rpm默认安装到这个位置：/usr/java/jdk1.8.0_91安装hadoop将你的hadoop进行解压tar –xvf hadoop-2.7.3.tar.gz接着，要告诉hadoop java的位置。进入你hadoop的目录，cd /usr/lo...

我就算饿死也不做程序员

1057人浏览 · 2019-05-29 21:35:03

我就算饿死也不做程序员 · 2019-05-29 21:35:03 发布

安装jdk

首先，需要安装jdk环境，因为hadoop是由Java编写。

rpm -ivh jdk-8u91-linux-x64.rpm

默认安装到这个位置：/usr/java/jdk1.8.0_91

安装hadoop

将你的hadoop进行解压

tar –xvf hadoop-2.7.3.tar.gz

接着，要告诉hadoop java的位置。进入你hadoop的目录，

cd /usr/local/hadoop/etc/hadoop

修改hadoop-env.sh，在JAVA_HOME=后面填入jdk的路径
在这里插入图片描述

配置环境变量

将hadoop加到环境变量，下面的路径要根据你hadoop解压的路径来。

export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin

更新环境变量使其生效

source /etc/profile

关闭防火墙

关闭虚拟机的防火墙，使得虚拟机之间可以互相连接

systemctl stop firewalld
systemctl disable firewalld

在这里插入图片描述

建立关联

我在VMware创建了4个虚拟机，一个为master，另外3个位slave1-3，然后master管理着其它虚拟机。
关系是这样的：master为namenode，存放文件名，slave1-3为datanode，存放元数据。你每次增加一份数据，就会进行分块并且进行备份，然后分配到所有datanode。
修改hadoop的core-site.xml文件，让其知道管理者的是谁。

cd /usr/local/hadoop/etc/hadoop/
vim core-site.xml

在这里插入图片描述
在configuration之间增加以下代码：

<property>
     <name>fs.defaultFS</name>
     <value>hdfs://master:9000</value>
</property>

在这里插入图片描述
接着，还需要修改系统host

vim /etc/hosts

192.168.52.10 master
192.168.52.20 slave1
192.168.52.30 slave2
192.168.52.40 slave3

将hdfs格式化

hdfs namenode -format

然后，我们就可以启动master的namedode

hadoop-daemon.sh start namenode

当你看到下面的提示信息时，就证明namenode启动成功了！
在这里插入图片描述
接着在slave1-3启动datanode

hadoop-daemon.sh start datanode

在这里插入图片描述
到这里，我们的hadoop环境基本上就配置完成了~

欢迎关注同名公众号：“我就算饿死也不做程序员”。
交个朋友，一起交流，一起学习，一起进步。在这里插入图片描述

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

GaussDB高智能--库内AI引擎：模型管理&数据集管理

华为开发者空间

领取云主机，带你基于PyTorch构建高效手写体识别系统

华为开发者空间

华为云数据库斯享会走进贵阳，与贵州企业携手共绘数智蓝图

华为开发者空间

所有评论(0)

查看更多评论

我就算饿死也不做程序员

@sgyuanshi

已为社区贡献2条内容