kettle与大数据组件（hdfs、hive、hbase）的连接

准备工作：涉及大数据组件：hadoop、zookeeper、hive、hbase启动hadoop集群：start-all.sh启动zookeeper：shbin/zkServer.shstart启动hbase：bin/start-hbase.sh启动hiveserver2：bin/hiveserver2进入beeline查看端口开启情况：bin/beelinebeeline>!connect

Gettle

1660人浏览 · 2022-05-17 13:13:25

Gettle · 2022-05-17 13:13:25 发布

准备工作：

1.相互之间版本是否对应

在正式开始之前，需要查看自己的Hadoop、hbase、hive、kettle版本是否相互支持。可以到官网查看版本支持或者网上看网友整理的版本支持结果。

2.各个组件是否能够成功运行

环境搭建好之后可以测试测试。如果服务和进程启动不起来，后续操作也就进行不下去了。

3.kettle当中文件的配置

需要将要连接的master上的一些配置文件覆盖kettle的某个目录下相应的文件。

以上三个部分都可以单独写一篇简文，后续有时间的话，我会去发布相应的文章，然后把链接附到上面。

4.启动命令（分先后）

涉及大数据组件：hadoop、zookeeper、hive、hbase

启动hadoop集群：start-all.sh

启动zookeeper：sh bin/zkServer.sh start

启动hbase：bin/start-hbase.sh

启动hiveserver2：bin/hiveserver2

进入beeline查看端口开启情况：bin/beeline

beeline>!connect jdbc:hive2://node1:10000（账号密码直接回车就行）

sh /root/opt/module/zookeeper/bin/zkServer.sh start
/root/app/hbase-1.3.1/bin/start-hbase.sh
/root/opt/module/hive-1.2.1/bin/hiveserver2
/root/opt/module/hive-1.2.1/bin/beeline      # 进入beeline查看端口开启情况
beeline>!connect jdbc:hive2://node1:10000

实际启动命令根据自己的hadoop、hbase、zookeeper、hive安装目录更改路径。