从零开始搭建虚拟机伪分布式环境（从创建虚拟机一步步教你搭建伪分布式开发环境）。

从零开始搭建伪分布式环境，本人已经测试一遍除了粗心把路径命令打错了别的无任何错误

我真的很笨

1631人浏览 · 2022-09-22 12:41:32

我真的很笨 · 2022-09-22 12:41:32 发布

创建虚拟机及导入安装包

使用软件：VMware Workstation Pro

系统：Liunx

环境：Count OS 7

链接：https://pan.baidu.com/s/1uia69iL9Uf3WcHyV2qOI-Q?pwd=2022
提取码：2022 （这个是所需要用到的Jdk安装包和Hadoop安装包）

注：从开始安装Jdk到最后搭建伪分布式环境，我本人是全程在root用户下进行的主要是为了防止权限不够的原因

首先第一步新建虚拟机点击左上角文件→新建虚拟机

这里选择典型，然后点击下一步

这里选择稍后安装操作系统，然后点击下一步。

这里选择Linux操作系统版本选择CentOS 7 64位（这里你使用的是Linux中CentOS 7 64位的系统之后你下载导入的所有安装包必须为64位的）32位的同理。

这里的名称可以随便起我们这里就叫dayuanzhong把路径的话也可以改，不过我用的是默认路径

接下来选择多个文件夹内存方面搭建伪分布式环境20G是足够的了。

这里直接点击完成

下一步点击虚拟机编辑点击内存设置为2G

然后再点击处理器，将处理器数量设置为4个然后点击完成。

然后点击CD/DVD使用ISO映像文件选择2009点击确定，下一步启动dayuanzhong

这里一定要选择第一个

这里的安装语言选择默认的第一个直接Continue

接下里我们一步步来设置虚拟机

第一步键盘输入

分3.1步走战略第一步点击加号第二步找到chinese（pinyin）并选择第三步点击Add添加

第3.1不Done保存退出

第二个时间

进去后直接点Done出来就行

第三步

点进去后选择GUI然后点击Done就ok了

第四步

这个和那个时间一样点进去后再点击Done出来就可以了

之后就是网络配置

首先点击NETWORK&HOST NAME进入到里面

进去之后打开nes33网络然后点击Done退出即可

然后点击下一步

这里要等一会，在等待的时候可以先设置root密码，另一个不用管他

然后这里密码使用123456不用管他同不同意直接双击Done

这就好了点击Reboot

下一步点击LICENSE进入其中在下面把协议打上√然后点击Done退出

点击下一步

完成上面操作后第一步语言选择汉语

键盘语言选择汉语（pinyin）

接下来三步直接选择前进或是跳过，直接来到设置用户名和密码

用户名为user

密码自己设置（这里设置的是user用户密码不是root用户不要搞混）

接下来导入我们需要的各种安装包

首先打开虚拟机设置点击选项下的共享文件夹然后点击总是开启

点击添加 →下一步→选择自己存放安装包的文件夹点击下一步

选择启用此共享然后点击完成点击确定

完成共享后安装包会放在我们的主文件及→其他位置→计算机→mnt文件夹里面然后将他们都拖到桌面上

搭建伪分布式环境之安装JDK

首先关闭防火墙

关闭防火墙指令:systemctl stop firewalld.service

接下来是修改主机名

输入命令：hostnamectl set-hostnam master

然后输入vi /etc/hostname查看(推出的话按esc键之后输入:wq就可以了)

接下来检测一下虚拟机自带的JDK

使用java -version指令

下面这个就是虚拟机自带的JDK在安装自己的之前需要先将他卸载

第一步先查看Java的相关信息用rpm -qa |grep java指令可以实现

然后开始卸载

卸载指令为rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.262.b10-1.el7.x86_64

标红的地方要根据自己虚拟机的情况写

然后使用java -version指令查看一下

当看到以下信息就证明卸载成功了

开始安装自己的jdk

先在usr目录下建立一个java文件夹，方法为在usr目录下右键打开终端输入

mkdir java 就建好了

使用mv jdk-8u281-linux-x64.rpm usr/java/命令将JDK移动到usr下的Java文件夹下（我的终端就不看了太不好解释了，所有的移动文件命令都失败了他自己却过去了，很神奇。）

开始解压安装JDK

首先在他这个文件夹下直接右键打开终端

不同类型的安装包用不同的指令，rpm用-ivh tar用-zxvf 我们这里是rpm的安装包所以完整命令是

rpm -ivh jdk-8u281-linux-x64.rpm 最后用java -version检查一下

下一步配置环境变量

命令为vi ~/.bash_profile （进入之后按i可以编辑同样的按esc键之后输入：wq保存退出）完成后输入source ~/.bash_profile释放一下配置文件

完成后我们的JDK就安装完成了

Hadoop单节点式环境搭建

第一步同样先将我们的hadoop安装包移动到home/user/hadoop文件夹下

首先在user文件夹里创建一个hadoop文件夹

mkdir /home/user/hadoop
然后将安装包移动到hadoop文件夹里

mv hadoop-3.1.4.tar.gz /home/user/hadoop/
之后进入hadoop文件夹下查看

接下来就开始解压安装因为我们的Hadoop安装包和之前的JDK不一样，hadoop是tar的安装包所以我们的命令应该是

tar -zxvf hadoop-3.1.4.tar.gz
然后使用 vi ~/.bash_profile 来对hadoop进行变量配置，最后同样的source ~/.bash_profile命令释放配置

然后使用hadoop version检查一下hadoop版本

接下来测试一下 mapreduce程序首先(cd ..)退回到user目录，创建一个input1文件夹在input1里面再创建一个test.txt文件

创建文件命令为

touch 文件名

接下来编辑一下test.txt文件

编辑命令为

vim 文件名

编辑完成后保存退出就可以了（与环境变量同理）

最后一步就是输入命令开始测试mapreduce程序

完成后我们的hadoop单节点环境就搭建完成了。

搭建伪分布式环境

第一步检查防火墙是否为关闭状态

检查命令为systemctl status firewalld.service

绿色为开启灰色为关闭

检查完后在终端进入我们的hadoop-3.1.4文件夹下

配置环境变量

命令为

vi ./etc/hadoop/hadoop-env.sh

首先是7条export配置命令（用截图是因为我不想让你们养成复制粘贴的习惯，锻炼你们的代码速度）

然后就是将JAD的路径复制到下面大概是在第54行。

下一步配置vi ./etc/hadoop/core-site.xml 变量

如下图所示更改（记得手打哦）

接下里配置vi ./etc/hadoop/hdfs-site.xml 变量

同样如下图更改所示

之后配置vi ./etc/hadoop/yarn-site.xml 变量

如下图（下面有可以复制粘贴，这个太多了让你们手打我怕你们把我打一顿）

<property>

    <name>yarn.nodemanager.aux-services</name>

    <value>mapreduce_shuffle</value>

</property>

<property>

    <name>yarn.resourcemanager.address</name>

    <value>master:18040</value>

</property>

<property>

    <name>yarn.resourcemanager.scheduler.address</name>

    <value>master:18030</value>

</property>

    <property>

    <name>yarn.resourcemanager.resource-tracker.address</name>

    <value>master:18025</value>

</property>

    <property>

    <name>yarn.resourcemanager.admin.address</name>

    <value>master:18141</value>

</property>

    <property>

    <name>yarn.resourcemanager.webapp.address</name>

    <value>master:18088</value>

</property>