区域服务器在哪里?无论是数据节点还是区域服务器,区域都存在于不同的硬件中。
WAL是否包含表的数据以及操作?
memstore有什么作用?它存储了WAL的数据和数据?
zookeeper实际上做了什么?
答案 0 :(得分:0)
希望以下信息有助于:
技术上,Hadoop集群中的Datanode上存在Region服务器。区域存储在HDFS中。
客户端向HRegionServer发出HTable.put(Put)请求,HRegionServer将详细信息传递给匹配的HRegion实例。第一步是将数据写入超前日志(WAL),由HLog类表示。
将数据写入WAL后,将其放入MemStore中。同时,检查MemStore是否已满,如果是,则请求刷新到磁盘。该请求由HRegionServer中的单独线程提供,该线程将数据写入位于HDFS中的新HFile。
ZooKeeper协调客户端与Hbase群集之间的通信。
答案 1 :(得分:0)
1. Region服务器位于数据节点所在的相同位置。他们负责将数据存储为hdfs中的3个副本。
2.WAL类似于SQL服务器中的事务日志,它会记录所有操作并在存储失败时执行其操作(为了将丢失的数据作为备份提供)。
3.当写入数据时,最初存储到WAL,然后在达到memstore限制(阈值级别)时存储到memstore,然后将数据刷新到同一存储中存在的数据。
4.它存储-.ROOT.-表,该表包含集群信息,在读取数据时对客户端有帮助。即:它提供了向客户端查找数据的路径。