我正在从Spark批量加载HBase,并通过HFileOutputFormat2写入HFiles。一切都好,直到看起来好像挂在最后几个文件上的大负载为止
INFO org.apache.hadoop.hbase.tool.LoadIncrementalHFiles:
Split occurred while grouping HFiles,
retry attempt 632 with 2 files remaining
to group or split
有什么想法吗?不确定我的HFiles是否倾斜?太大了? (它们只有10兆字节,而我的hbase.region.max.filesize = 10GB)