inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。

  Hadoop是Apache基金会下的一个开源云计算平台项目。当前最新版本是hadoop 0.20.1。下面就hadoop 0.20.1为蓝本,介绍在Ubuntu Linux 9.10下安装hadoop的方法。(来源:http://blog.csdn.net/inkfish)

支持的平台:(来源:http://blog.csdn.net/inkfish)
  Linux,可作为开发和产品部署的平台;
  Windows,可作为开发平台。

事先需要的软件:(来源:http://blog.csdn.net/inkfish)
  1.JavaTM1.6.x,必须安装,建议选择Sun公司发行的Java版本;
  2.ssh必须安装,并保证sshd运行,hadoop将以ssh进行通讯;
  3.如果是windows,则需要装Cygwin,用以支持shell命令。

安装可用的模式:(来源:http://blog.csdn.net/inkfish)
  1.本地模式;
  2.伪分布模式;
  3.全分布模式。

本地模式安装步骤:(来源:http://blog.csdn.net/inkfish)
  1.将hadoop安装包解压缩到某目录下;
  2.修改conf/hadoop-env.sh文件,export JAVA_HOME= 那行设置正确的JAVA_HOME 位置,当然如果事先在操作系统已经set完JAVA_HOME ,可以忽略此步骤;


  本地模式安装完了,就这么简单!

 

测试一下运行效果:(来源:http://blog.csdn.net/inkfish)

  $ mkdir input
  $ cp conf/*.xml input
  $ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
  $ cat output/*

这个示例程序是hadoop自带的,用于把conf下的xml文件拷贝到input目录下,并且找到并显示所有与最后一个参数的正则表达式相匹配的行,output是输出文件夹。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐