前言

HBase是非关系型数据库,它的逻辑结构、物理结构和架构都与关系型数据库不同。像MySQL这样的关系型数据库在对数据进行增删改查的时候,直接对数据进行操作,而HBase则利用TimeStamp覆盖原来的操作,向用户呈现最新TimeStamp的操作内容。

这么讲起来可能有些抽象,不妨看看下面的案例。

案例

建立一张表stu,向其中插入两行数据。为什么说是两行呢?因为HBase中的行数主要看Row Key,相同RowKey属于同一行数据,因此下图stu表中含有两行数据。

 输入 scan 'stu',{RAW=>true,VERSIONS=>10} ,查看stu表的版本信息:

版本信息里会记录所有对stu表的操作内容,注意到其中就有timestamp

把1001的年龄改为100,并查看表,成功改动信息:

这时候再查看版本信息,会发现置顶的信息是刚执行的操作,而之前age=18的记录也保留着,只不过没有向用户呈现而已。由此可见,HBase向用户呈现操作结果时就是按照寻找TimeStamp最大的结果去呈现:

 再次改动1001的age,改为10000,同时添加比age=100小的TimeStamp,发现并没有改成功:

 查看版本信息:

 该结果再次证明,用户所看到的数据是TimeStamp最大的数据。

那如果把记录删除了呢?会把版本信息里的所有同类信息都删掉吗?

 

我们发现上图1001的age记录已经被删除了 ,但是版本信息中age的value还保留着。

总结

TimeStamp就像是一条时间轴,用户每次对表进行增删改查操作,都会留下相应的时间戳,而HBase向用户呈现的永远是时间轴上最新时间所对应的操作。

因此在进行delete、put等操作时可以带上TimeStamp,获得更确切的结果。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐