本地搭建Hadoop伪分布式环境之四:开启搭建Hadoop2.4.0之旅
搭建hadoop2.4.0伪分布式:win8+VMware虚拟机+Ubuntu系统+java7+hadoop2.4.0!!!!!!!!!!!!!!!!!!!
·
1、准备软件
64位下载包下载: hadoop-2.4.0-64bit.tar.gz
百度网盘:链接: http://pan.baidu.com/s/1hqEDe2S 密码: 224f链接: http://pan.baidu.com/s/1gdl95OB 密码: h6dc
2、安装JDK
直接执行安装命令:sudo apt-get install openjdk-7-jdk
3、安装Hadoop
3.1上传hadoop压缩文件
通过之前配置的FlashFXP直接将文件上传到Ubuntu上
3.2解压hadoop文件
sudo tar -xzvf /tmp/hadoop-2.4.0-64bit.tar.gz
3.3配置hadoop文档
文档1:sudo vi profile(注意,这里说的etc不是hadoop文件夹下的那个,是用户根目录下的。在末尾添加: )
export JAVA_HOME=/usr/lib/jvm/ java-1.7.0-openjdk-amd64export HADOOP_PREFIX=/home/YXC/hadoop-2.4.0export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"export PATH="$JAVA_HOME/:$HADOOP_PREFIX/bin:$PATH"export HADOOP_PREFIX PATH CLASSPATH
文档2: hadoop-env.sh 进入hadoop2.4.0文件夹,配置etc/hadoop中的文件
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386
文档3:core-site.xml
<configuration><property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property><property><name>dfs.namenode.name.dir</name><value>file:/home/YXC/hadoop-2.4.0/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/home/YXC/hadoop-2.4.0/dfs/data</value></property></configuration>
文档4: hdfs-site.xml(系统默认文件保存3份,因伪分布模式,故改为1份)
<configuration><property><name>dfs.replication</name><value>1</value><description>Default block replicied when the file is created. The default </description></property><property><name>dfs.namenode.name.dir</name><value>/home/YXC/hadoop-2.4.0/dfs/name</value><property><property><name>dfs.namenode.data.dir</name><value>/home/YXC/hadoop-2.4.0/dfs/data</value><property><configuration>
文档5:mapred-site.xml(注意修改文件后缀: sudo mv mapred-site.xml.template mapred-site.xml )
<configuration><property><name>mapreduce.jobtracker.address</name><value>localhost:9001</value></property></configuration>
文档6:yarn-site.xml
<configuration><!-- Site specific YARN configuration properties --><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>
4、SSH免密码登录
之前已经配置,不再赘述。
ssh localhost要是能免密码登陆显示系统信息,就应该是对的。(这里有个输入密码环节,是系统的密码)。
5、开始终极配置
5.1到hadoop2.4.0目录下
./bin/hadoop namenode –format格式化结点信息如果出现 HADOOP_HDFS_HOME not found!关掉虚拟机重启即可。
5.2开始sbin/start-all.sh.
执行 jps 则出现:
表明成功!浏览器下http://ip:50070 这是hdfs的页面!
更多推荐
已为社区贡献7条内容
所有评论(0)