温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

HBase是如何保证数据的强一致性的

发布时间:2021-09-09 14:54:08 来源:亿速云 阅读:508 作者:chen 栏目:大数据

本篇内容介绍了“HBase是如何保证数据的强一致性的”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!


HBase是如何保证数据的强一致性的?  

有三个方面可以说的,另外HBase是牺牲了数据的可用性来保证它的数据强一致性的,即CAP原理中放弃了A,HBase是个cp系统。

1. HBase中每一条数据只会出现在一个Region,它的数据冗余备份不是在region这个层面做的,还是依赖HDFS来做的冗余。

而且同一时间一个Region只会被分配给一个RegionServer,这就保证了系统中只会有一条可以使用的数据。

2. HBase支持行级事物,即一个put操作要么成功,要么失败。

3. 另外当有RegionServer宕机的时候,Region会被分配到其他的RegionServer上,同时重写WAL Log,这个过程中整个Region中的数据是不可用的,因为它是缺失的。

如果可用的话那么必定会有数据不一致的问题(即写入过的数据查询不到),所以这里用可用性来换取了强一致性,等到WAL写完,保证了数据完整性之后,才可重新访问。

LSM-Tree结构为何写入比读取快那么多?

LSM-Tree结构写入快的原因是它将对数据的修改增量保持在内存中,达到指定的大小限制后才将这些修改操作批量写入磁盘;

读取的时候会比较麻烦,需要合并磁盘中历史数据和内存中最近修改操作,所以写入性能大大提升,读取时可能需要先看是否命中内存,否则需要访问较多的磁盘文件。

极端的说,基于LSM树实现的HBase的写性能比MySQL高了一个数量级,读性能低了一个数量级。

如果 HMaster 挂了,会对HBase集群造成什么影响?

说清楚HMaster的指责基本就能解决问题了

  1. HMaster负责为RegionServer分配Region

  2. 负责RegionServer的负载均衡

  3. 发现失效的RegionServer并重新分配其上的region

  4. 管理用户对table的增删改查操作


所以HMaster宕机后数据的读取和写入还是正常的,但是无法对table进行操作,region的分配的相关操作也会无法进行。

“HBase是如何保证数据的强一致性的”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI