目录

一、需求与数据集

二、准备工作

1、创建一个maven工程 

2、修改prom文件,添加依赖

3、复制Hadoop的配置文件core-site.xml和HBase的配置文件hbase-site.xml到resources目录

 4、查看目录

5、创建基本的包结构与类

6、创建类 

7、结果 

三、案例一、使用javaapi创建hbase的表

1、编写代码

2、运行

1)开启集群

2)运行结果

3、查看创建的表

四、案例二、使用javaapi删除表

1、编写删除表的方法代码

2、调用方法

 3、getAdmin方法

4、运行

5、查看结果

五、案例三、往创建的表中插入数据

1、编写添加数据的方法

2、调用方法

 3、getAdmin方法

4、运行

 5、查看结果

 六、案例四、查看一条数据

1、编写方法

2、调用方法

3、查看结果

七、案例五、删除一条数据、

1、编写方法

2、调用

​ 3、运行

 4、查看结果

八、案例六、导入数据 

1、需求

2、Import JOB导入大量的数据

3、上传数据至hdfs

4、导入数据

1)启动yarn

2)创建表

 3)运行导入命令

4)运行结果 

5、查看数据

6、count计数

7、 Mapreduce计数 

 九、案例六、查询2020年6月份所有用户的用水量

1、需求分析

2、编写代码

3、调用方法

 4、查看结果

5、输出代码的改进

 6、解决数值型数据显示乱码的问题

十、Export Job 导出数据

1、导出数据

2、查看结果


一、需求与数据集

某自来水公司,需要存储大量的缴费明细数据,以下截取了缴费明细的一部分内容:

用户id姓地址性缴费时间表示表示用量合查表日期最迟缴费

因为缴费明细的数据记录非常庞大,该公司的信息部门决定使用hbase来存储这些数据,并

且可以使用java来访问这些数据。

二、准备工作

idea的maven环境搭建成功

1、创建一个maven工程 

2、修改prom文件,添加依赖

3、复制Hadoop的配置文件core-site.xml和HBase的配置文件hbase-site.xml到resources目录

 复制到项目中

 4、查看目录

5、创建基本的包结构与类

6、创建类 

7、结果 

三、案例一、使用javaapi创建hbase的表

使用java-api创建hbase的表

创建一个名为water_bill的表,包含一个列簇

1、编写代码

2、运行

1)开启集群

2)运行结果

3、查看创建的表

四、案例二、使用javaapi删除表

删除刚刚创建的表

1、编写删除表的方法代码

2、调用方法

 3、getAdmin方法

4、运行

5、查看结果

五、案例三、往创建的表中插入数据

1、编写添加数据的方法

 

2、调用方法

 3、getAdmin方法

4、运行

 5、查看结果

 六、案例四、查看一条数据

查看显示rowkey是49441091的数据

1、编写方法

获取某列的值

获取某行的值

2、调用方法

getTable调用

getone调用

3、查看结果

gettable

getone

七、案例五、删除一条数据、

1、编写方法

2、调用

 3、运行

 4、查看结果

八、案例六、导入数据 

1、需求

有一份10W条记录的抄表数据文件,需求将其导入hbase中

2、Import JOB导入大量的数据

在hbase中,有一个import的MR作业,可以专门用来将数据导入到hbase中

用法

Hbase org.apache.hadoop.hbase.mapreduce.Import表名hdfs数据文件路径

3、上传数据至hdfs

4、导入数据

1)启动yarn

2)创建表

 3)运行导入命令

hbase org.apache.hadoop.hbase.mapreduce.Import WATER_BILL /water_bill/

4)运行结果 

5、查看数据

6、count计数

7、 Mapreduce计数 

 九、案例六、查询2020年6月份所有用户的用水量

1、需求分析

在hbase中用scan+filter实现过滤查询。2020年6月份其实就是从2020年6月1号到2020

年6月30日的所有抄表数据

2、编写代码

3、调用方法

 4、查看结果

5、输出代码的改进

 6、解决数值型数据显示乱码的问题

打印显示字符串数据正常

显示结果

十、Export Job 导出数据

用法:

hbase org.apache.hadoop.hbase.mapreduce.Export 表名 路径

1、导出数据

2、查看结果

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐