【HBase】TimeStamp的作用
HBase是非关系型数据库,它的逻辑结构、物理结构和架构都与关系型数据库不同。像MySQL这样的关系型数据库在对数据进行增删改查的时候,直接对数据进行操作,而HBase则利用TimeStamp覆盖原来的操作,向用户呈现最新TimeStamp的操作内容。
前言
HBase是非关系型数据库,它的逻辑结构、物理结构和架构都与关系型数据库不同。像MySQL这样的关系型数据库在对数据进行增删改查的时候,直接对数据进行操作,而HBase则利用TimeStamp覆盖原来的操作,向用户呈现最新TimeStamp的操作内容。
这么讲起来可能有些抽象,不妨看看下面的案例。
案例
建立一张表stu,向其中插入两行数据。为什么说是两行呢?因为HBase中的行数主要看Row Key,相同RowKey属于同一行数据,因此下图stu表中含有两行数据。
输入 scan 'stu',{RAW=>true,VERSIONS=>10} ,查看stu表的版本信息:
版本信息里会记录所有对stu表的操作内容,注意到其中就有timestamp
把1001的年龄改为100,并查看表,成功改动信息:
这时候再查看版本信息,会发现置顶的信息是刚执行的操作,而之前age=18的记录也保留着,只不过没有向用户呈现而已。由此可见,HBase向用户呈现操作结果时就是按照寻找TimeStamp最大的结果去呈现:
再次改动1001的age,改为10000,同时添加比age=100小的TimeStamp,发现并没有改成功:
查看版本信息:
该结果再次证明,用户所看到的数据是TimeStamp最大的数据。
那如果把记录删除了呢?会把版本信息里的所有同类信息都删掉吗?
我们发现上图1001的age记录已经被删除了 ,但是版本信息中age的value还保留着。
总结
TimeStamp就像是一条时间轴,用户每次对表进行增删改查操作,都会留下相应的时间戳,而HBase向用户呈现的永远是时间轴上最新时间所对应的操作。
因此在进行delete、put等操作时可以带上TimeStamp,获得更确切的结果。
更多推荐
所有评论(0)