本篇内容介绍了“HBase是如何保证数据的强一致性的”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
HBase是如何保证数据的强一致性的?
有三个方面可以说的,另外HBase是牺牲了数据的可用性来保证它的数据强一致性的,即CAP原理中放弃了A,HBase是个cp系统。
1. HBase中每一条数据只会出现在一个Region,它的数据冗余备份不是在region这个层面做的,还是依赖HDFS来做的冗余。
而且同一时间一个Region只会被分配给一个RegionServer,这就保证了系统中只会有一条可以使用的数据。
2. HBase支持行级事物,即一个put操作要么成功,要么失败。
3. 另外当有RegionServer宕机的时候,Region会被分配到其他的RegionServer上,同时重写WAL Log,这个过程中整个Region中的数据是不可用的,因为它是缺失的。
如果可用的话那么必定会有数据不一致的问题(即写入过的数据查询不到),所以这里用可用性来换取了强一致性,等到WAL写完,保证了数据完整性之后,才可重新访问。
LSM-Tree结构为何写入比读取快那么多?
LSM-Tree结构写入快的原因是它将对数据的修改增量保持在内存中,达到指定的大小限制后才将这些修改操作批量写入磁盘;
读取的时候会比较麻烦,需要合并磁盘中历史数据和内存中最近修改操作,所以写入性能大大提升,读取时可能需要先看是否命中内存,否则需要访问较多的磁盘文件。
极端的说,基于LSM树实现的HBase的写性能比MySQL高了一个数量级,读性能低了一个数量级。
如果 HMaster 挂了,会对HBase集群造成什么影响?
说清楚HMaster的指责基本就能解决问题了
HMaster负责为RegionServer分配Region
负责RegionServer的负载均衡
发现失效的RegionServer并重新分配其上的region
管理用户对table的增删改查操作
所以HMaster宕机后数据的读取和写入还是正常的,但是无法对table进行操作,region的分配的相关操作也会无法进行。
“HBase是如何保证数据的强一致性的”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。