前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系

正文

在这里插入图片描述

HBase 是什么?

HBase 基于 Google 的 BigTable 论文的开源实现,是建立的 HDFS 之上,提供高可靠性高性能存储可伸缩实时读写的分布式数据库系统。

在需要实时读写随机访问超大规模数据集时,可以使用 HBase。

hbase的特点

  1. 海量存储——可以存储大批量的数据
  2. 列(簇)式存储——hbase表的数据是基于列族进行存储的,列族是在列的方向上的划分。
  3. 极易扩展——底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加 datanode节点服务(机器)就可以了;可以通过增加服务器来提高集群的存储能力。
  4. 高并发——支持高并发的读写请求
  5. 稀疏——稀疏主要是针对Hbase列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。
  6. 数据的多版本——hbase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,版本号就是插入数据的时间戳
  7. 数据类型单一——所有的数据在hbase中是以字节数组进行存储
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐