关于hbase的数据迁移

关于hbase的数据迁移

高个子男孩

2365人浏览 · 2022-03-07 20:44:39

高个子男孩 · 2022-03-07 20:44:39 发布

前提：两套集群是同一个网段的
方式1：通过快照方式进行数据迁移（不需要提前建表）
1）：首先现在老集群A上进行快照制作（hbase命令行）

hbase> snapshot '要快照的表名tableA' , '快照名称snapA'

查看快照：list_snapshots
删除快照：delete_snapshot ‘快照名称snapA’
2）：开始快照迁移（将集群A的快照迁移到集群B上）

bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot 快照名称snapA -copy-to hdfs://newCluster:8082/hbase

3)：登录新集群的hbase命令行,然后执行

restore_snapshot 'snapA'

方式2：在老集群A上通过bulkload写入新集群B上（需要提前建表，别忘记预分区）
1）：在新集群B 提前将表创建好，例如：

create 'renter_info',{NAME =>'MM', COMPRESSION => 'SNAPPY'}, SPLITS => ['19999999', '33333332', '4ccccccb', '66666664' , '7ffffffd' , '99999996' , 'b333332f' , 'ccccccc8' , 'e6666661']

2）：在老集群A 执行bulkload命令语句：

bin/hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles -Dcreate.table=no -DHbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily=2014 hdfs://newCluster:8020/hbase/data/default/order_info

方式3：hadoop distcp 方式
1）：通过hadoop distcp将集群A中要迁移的表数据通过分布式copy方式，copy到集群B

hadoop distcp hdfs://oldcluster:8020/hbase/data/default/order_info  hdfs://newCluster:8020/hbase/data/default/order_info

2）：修复元数据

/opt/cloudera/parcels/CDH/lib/hbase/bin/hbase hbck -fixMeta

3）：重启Hbase

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

GaussDB(DWS) 资源监控Topsql

华为开发者空间

cover

GaussDB(DWS) 日常维护命令

华为开发者空间

cover

码上出发：华为云码道 + MCP赋能12306列车查询系统

华为开发者空间

所有评论(0)

查看更多评论

高个子男孩

已为社区贡献2条内容