1、准备软件

 64位下载包下载:      hadoop-2.4.0-64bit.tar.gz
百度网盘:
链接: http://pan.baidu.com/s/1hqEDe2S 密码: 224f
链接: http://pan.baidu.com/s/1gdl95OB 密码: h6dc

2、安装JDK

直接执行安装命令:sudo apt-get install openjdk-7-jdk

3、安装Hadoop

3.1上传hadoop压缩文件

通过之前配置的FlashFXP直接将文件上传到Ubuntu上

3.2解压hadoop文件

sudo tar -xzvf /tmp/hadoop-2.4.0-64bit.tar.gz

3.3配置hadoop文档

文档1:sudo vi profile(注意,这里说的etc不是hadoop文件夹下的那个,是用户根目录下的。在末尾添加:
export JAVA_HOME=/usr/lib/jvm/ java-1.7.0-openjdk-amd64
export HADOOP_PREFIX=/home/YXC/hadoop-2.4.0
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/:$HADOOP_PREFIX/bin:$PATH"
export HADOOP_PREFIX PATH CLASSPATH

文档2: hadoop-env.sh 进入hadoop2.4.0文件夹,配置etc/hadoop中的文件
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386

文档3:core-site.xml
<configuration>
     <property>
         <name>fs.default.name</name>
         <value>hdfs://localhost:9000</value>
     </property>
     <property>
         <name>dfs.namenode.name.dir</name>
         <value>file:/home/YXC/hadoop-2.4.0/dfs/name</value>
     </property>
     <property>
         <name>dfs.datanode.data.dir</name>
         <value>file:/home/YXC/hadoop-2.4.0/dfs/data</value>
     </property>
</configuration>

文档4: hdfs-site.xml(系统默认文件保存3份,因伪分布模式,故改为1份)
<configuration>
  <property>
      <name>dfs.replication</name>  
      <value>1</value>  
      <description>Default block replicied when the file is created. The default </description>  
  </property>  
  <property>
      <name>dfs.namenode.name.dir</name>
      <value>/home/YXC/hadoop-2.4.0/dfs/name</value>
  <property>
  <property>
      <name>dfs.namenode.data.dir</name>
      <value>/home/YXC/hadoop-2.4.0/dfs/data</value>
  <property>
<configuration>

文档5:mapred-site.xml
(注意修改文件后缀: sudo mv mapred-site.xml.template mapred-site.xml
<configuration>
  <property>
    <name>mapreduce.jobtracker.address</name>
    <value>localhost:9001</value>
  </property>
</configuration>

文档6:yarn-site.xml
<configuration>
<!-- Site specific YARN configuration properties -->
 <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
 </property>
 <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
 </property>
</configuration>

4、SSH免密码登录

      之前已经配置,不再赘述。
ssh localhost
要是能免密码登陆显示系统信息,就应该是对的。(这里有个输入密码环节,是系统的密码)。

5、开始终极配置

5.1到hadoop2.4.0目录下

./bin/hadoop namenode –format格式化结点信息
如果出现  HADOOP_HDFS_HOME not found!
关掉虚拟机重启即可。

5.2开始sbin/start-all.sh.

执行 jps 则出现:

表明成功!
浏览器下http://ip:50070 这是hdfs的页面!




Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐