我们一直在运行3节点AWS EMR集群(1个NameNode,2个DataNodes)。观察到Namenode检查点未发生,并且fsImage,md5文件未更新。编辑日志不断堆积,由于磁盘空间不足而导致NameNode故障。
HDFS版本:Hadoop 2.8.3-amzn-0
-rw-r--r-- 1 hdfs hdfs 62 Sep 3 12:04 fsimage_0000000000000000000.md5
-rw-r--r-- 1 hdfs hdfs 317 Sep 3 12:04 fsimage_0000000000000000000
-rw-r--r-- 1 hdfs hdfs 260954697 Sep 3 13:49 edits_0000000000000000001-0000000000002061850
-rw-r--r-- 1 hdfs hdfs 270456683 Sep 3 14:54 edits_0000000000002061851-0000000000004196518
-rw-r--r-- 1 hdfs hdfs 256666626 Sep 3 15:54 edits_0000000000004196519-0000000000006223083
-rw-r--r-- 1 hdfs hdfs 256756282 Sep 3 16:54 edits_0000000000006223084-0000000000008250289
-rw-r--r-- 1 hdfs hdfs 263465424 Sep 3 17:59 edits_0000000000008250290-0000000000010330235
-rw-r--r-- 1 hdfs hdfs 257754598 Sep 3 19:49 edits_0000000000010330236-0000000000012365196
-rw-r--r-- 1 hdfs hdfs 257361703 Sep 3 21:39 edits_0000000000012365197-0000000000014396984
-rw-r--r-- 1 hdfs hdfs 258246258 Sep 3 23:29 edits_0000000000014396985-0000000000016435653
-rw-r--r-- 1 hdfs hdfs 257862137 Sep 4 01:19 edits_0000000000016435654-0000000000018471306
-rw-r--r-- 1 hdfs hdfs 257044520 Sep 4 03:09 edits_0000000000018471307-0000000000020496923
-rw-r--r-- 1 hdfs hdfs 256987603 Sep 4 04:59 edits_0000000000020496924-0000000000022520948
-rw-r--r-- 1 hdfs hdfs 254213703 Sep 4 06:44 edits_0000000000022520949-0000000000024522780
-rw-r--r-- 1 hdfs hdfs 265518336 Sep 4 08:34 edits_0000000000024522781-0000000000026613243
根据Hadoop 2.8.3
辅助NameNode或CheckpointNode将为每个'dfs.namenode.checkpoint.txns'(默认-100000)事务创建命名空间的检查点,而不管是否'dfs.namenode.checkpoint.period'(默认为3600秒)已经过期。
但是在Namenode中没有发生检查点
答案 0 :(得分:1)
您可以运行以下命令使NameNode变通:
<item name="bottomNavigationStyle">@style/Widget.Design.BottomNavigationView</item>
https://community.hortonworks.com/content/supportkb/49438/how-to-manually-checkpoint.html
答案 1 :(得分:0)
检查点将由辅助 Namenode 或检查点节点创建。
这里的设置只有 namenode,它不会自己创建检查点。
设置中应提供检查点节点或辅助 Namenode 以自动执行此操作,否则必须重新启动安全模式 saveSnaphot 或 Namenode 才能发生检查点。