美创科技打造县域医疗灾备新标杆|神木市医院 HIS 系统数据库分钟级切换演练实录
2025-07-02
百万罚单警示!DCAS助力金融机构筑牢数据安全防线,实现监管合规
2025-06-20
2025中国互联网产业年会丨《中国互联网产业绿色算力发展倡议》正式发布
2025-02-07
美创用户专访 | 精细化管理:医疗行业数据分类分级的策略与实践
2025-01-10
容灾演练双月报|美创助力某特大型通信基础设施央企顺利完成多个核心系统异地容灾演练
2025-01-10
存储域
数据库加密 诺亚防勒索访问域
数据库防水坝 数据库防火墙 数据库安全审计 动态脱敏流动域
静态脱敏 数据水印 API审计 API防控 医疗防统方运维服务
数据库运维服务 中间件运维服务 国产信创改造服务 驻场运维服务 供数服务安全咨询服务
数据出境安全治理服务 数据安全能力评估认证服务 数据安全风险评估服务 数据安全治理咨询服务 数据分类分级咨询服务 个人信息风险评估服务 数据安全检查服务随着大数据概念及技术的不断推广,HBase作为大数据技术中的一个重要框架也渐渐被人熟知,本文将简单地介绍HBase这个大数据常见组件。
HBase得名于Hadoop Database,是一个分布式存储系统,比较起传统的关系型数据库,例如SQL、ORACLE,HBase的优点在于,可以实现高性能的并发读写操作。同时,HBase不同于传统关系型数据库的面向行存储,HBase是面向列存储,列可以动态增加,列为空就不存储数据,能更好的节省存储空间。Hbase还会对数据进行透明切分,使得存储本身具有了水平伸缩性。正因为这些优点,Hadoop+Zookeeper+HBase很自然的成为现在大数据技术中一套较为流行且成熟的数据存储和计算框架。
接下来,来了解一下HBase的基本架构和原理。
如上图所示,HBase中所有的数据文件都存储在hadoop的hdfs文件系统中,主要包括上图中HFILE和HLOG FILE两种文件类型。HFile是Hadoop的二进制格式文件,实际上StoreFile就是对HFile做了轻量级包装,即StoreFile底层就是HFile,存储着HBASE中最基础的数据。HLog中记录了写入数据的归属信息,可以简单的理解为操作记录,可作为hbase恢复数据的依据。
架构的上层是HRegion和HRegionServer,HRegionServer内部管理了一系列HRegion对象,每个HRegion对应了HBase表中的一个 Region。在HBase的实际使用中,会根据数据特性对数据进行划分region的存储,以避免数据存储的热点问题。而每个HRegion由多个HStore组成,HStore存储是HBase存储的核心,其由两部分组成,一部分是MemStore,一部分是StoreFiles。MemStore是Sorted Memory Buffer,用户写入的数据首先会放入MemStore,当MemStore满了以后会Flush成一个StoreFile(底层实现是HFile), 当StoreFile文件数量增长到一定阈值,会触发Compact合并操作,将多个StoreFiles合并成一个StoreFile,形成最基础的数据存储文件。
架构中还包括HMaster和zookeeper,这里只做简单介绍,HMaster在功能上主要负责hbase表和Region的管理工作,包括表的增删改查,调整region的分布,进行新region的分配以及region的迁移等。Zookeeper负责存储HBase表的一些元信息和HMaster的地址,客户端可以通过zookeeper来找到HMaster,同时HMaster也可以通过zookeeper来感知到各个HRegionServer的健康状态。