hadoop2.7.2 window win7 基础环境搭建

hadoop环境搭建相对麻烦，需要安装虚拟机过着cygwin什么的，所以通过查资料和摸索，在window上搭建了一个，不需要虚拟机和cygwin依赖，相对简便很多。下面运行步骤除了配置文件有部分改动，其他都是参照hadoop下载解压的share/doc/index.html。hadoop下载：http://apache.opencas.org/hadoop/common

t0mCl0nes

35048人浏览 · 2016-04-26 14:49:32

t0mCl0nes · 2016-04-26 14:49:32 发布

hadoop环境搭建相对麻烦，需要安装虚拟机过着cygwin什么的，所以通过查资料和摸索，在window上搭建了一个，不需要虚拟机和cygwin依赖，相对简便很多。

下面运行步骤除了配置文件有部分改动，其他都是参照hadoop下载解压的share/doc/index.html。

hadoop下载：http://apache.opencas.org/hadoop/common/

下面配置windows环境：

Java JDK ：

我采用的是1.8的，配置JAVA_HOME，如果默认安装，会安装在C:\Program Files\Java\jdk1.8.0_51。此目录存在空格，启动hadoop时将报错，JAVA_HOME is incorrect ...此时需要将环境变量JAVA_HOME值修改为：C:\Progra~1\Java\jdk1.8.0_51，Program Files可以有Progra~代替。

Hadoop 环境变量：

新建HADOOP_HOME，指向hadoop解压目录，如：D:/hadoop。path环境变量中增加：%HADOOP_HOME%\bin;。

Hadoop 依赖库：

winutils相关，hadoop在windows上运行需要winutils支持和hadoop.dll等文件，下载地址：http://download.csdn.net/detail/fly_leopard/9503059

注意hadoop.dll等文件不要与hadoop冲突。为了不出现依赖性错误可以将hadoop.dll放到c:/windows/System32下一份。

hadoop环境测试：

起一个cmd窗口，起到hadoop/bin下，hadoop version，显示如下：

hadoop基本文件配置：hadoop配置文件位于：hadoop/etc/hadoop下

core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml

core-site.xml:

<configuration>

   <property>

       <name>fs.defaultFS</name>

       <value>hdfs://localhost:9000</value>

   </property>

</configuration>

hdfs-site.xml:

<configuration>

       <property>

               <name>dfs.replication</name>

                <value>1</value>

       </property>

       <property>

                <name>dfs.namenode.name.dir</name>

               <value>file:/hadoop/hadoop272/data/dfs/namenode</value>

       </property>

       <property>

               <name>dfs.datanode.data.dir</name>

               <value>file:/hadoop/hadoop272/data/dfs/datanode</value>

       </property>

</configuration>

mapred-site.xml:

<configuration>

       <property>

          <name>mapreduce.framework.name</name>

          <value>yarn</value>

       </property>

</configuration>

yarn-site.xml:

<configuration>

       <property>

          <name>yarn.nodemanager.aux-services</name>

          <value>mapreduce_shuffle</value>

       </property>

       <property>

          <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

          <value>org.apache.hadoop.mapred.ShuffleHandler</value>

       </property>

</configuration>

格式化系统文件：

hadoop/bin下执行 hdfs namenode -format

待执行完毕即可，不要重复format。

格式化完成后到hadoop/sbin下执行 start-dfs启动hadoop

访问：http://localhost:50070