火花工人在跑步一段时间后死亡

时间:2016-06-24 10:59:09

标签: apache-spark out-of-memory

我正在运行火花流工作。

我的群集配置

Spark version - 1.6.1
spark node  config
cores - 4
memory - 6.8 G (out of 8G)
number of nodes - 3

对于我的工作,我给每个节点6GB内存和总核心 - 3

作业运行一小时后,我在工作日志上收到以下错误

    Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00007f53b496a000, 262144, 0) failed; error='Cannot allocate memory' (errno=12)
    #
    # There is insufficient memory for the Java Runtime Environment to continue.
    # Native memory allocation (mmap) failed to map 262144 bytes for committing reserved memory.
    # An error report file with more information is saved as:
    # /usr/local/spark/sbin/hs_err_pid1622.log

虽然我在work-dir / app-id / stderr中没有看到任何错误。

通常建议运行spark worker的xm *设置是什么?

如何进一步调试此问题?

PS:我使用默认设置启动了我的worker和master。

更新

由于错误"cannot allocate memory".

,我发现我的执行程序经常被添加和删除

日志:

  16/06/24 12:53:47 INFO MemoryStore: Block broadcast_53 stored as values in memory (estimated size 14.3 KB, free 440.8 MB)
  16/06/24 12:53:47 INFO BlockManager: Found block rdd_145_1 locally
  16/06/24 12:53:47 INFO BlockManager: Found block rdd_145_0 locally
  Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00007f3440743000, 12288, 0) failed; error='Cannot allocate memory' (errno=12)

1 个答案:

答案 0 :(得分:1)

我有同样的情况。我在官方文件中找到原因,它说:

  

通常,Spark可以在每台机器上运行8 GB到数百GB的内存。在所有情况下,我们建议仅为Spark分配最多75%的内存;剩下的就是操作系统和缓冲区缓存。

您的计算内存有8GB,6GB用于工作节点。因此,如果操作系统使用的内存超过2GB,则为工作节点留下的内存不足,工作人员将丢失。 *只需检查操作系统将使用多少内存,并为工作节点分配剩余内存*