为什么调整java堆分配会导致OOME?
我们在日志中看到OutOfMemoryExceptions,它们似乎与java堆提交大小从~1G增长到~2.4G一致。尽管出现了错误消息,但似乎我们的堆空间不足。除了抛出异常(并生成堆转储)之外,resize似乎最终成功并且应用程序继续运行而没有问题(具有~2.4G堆提交大小)。
以下是日志输出的示例:
INFO | jvm 1 | 2013/08/16 12:08:05 | [GC [PSYoungGen: 328000K->2997K(339200K)] 645686K->320683K(1038272K), 0.0101580 secs] [Times: user=0.01 sys=0.00, real=0.00 secs]
INFO | jvm 1 | 2013/08/16 12:09:14 | [GC [PSYoungGen: 331509K->3487K(338816K)] 649195K->322153K(1037888K), 0.0115600 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:09:59 | [GC [PSYoungGen: 331999K->2928K(340032K)] 650665K->322608K(1039104K), 0.0099300 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:10:48 | [GC [PSYoungGen: 333104K->2723K(339648K)] 652784K->323240K(1038720K), 0.0100130 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:11:28 | [GC [PSYoungGen: 332885K->3884K(340864K)] 653402K->325089K(1039936K), 0.0106250 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:11:39 | [GC [PSYoungGen: 23694K->463K(340352K)] 344899K->323656K(2437504K), 0.0070330 secs] [Times: user=0.01 sys=0.00, real=0.00 secs]
INFO | jvm 1 | 2013/08/16 12:11:39 | [GC [PSYoungGen: 463K->0K(340608K)] 323656K->323592K(2437760K), 0.0044440 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:11:39 | [Full GC
INFO | jvm 1 | 2013/08/16 12:11:40 | [PSYoungGen: 0K->0K(340608K)] [PSOldGen: 323592K->323592K(699072K)] 323592K->323592K(1039680K) [PSPermGen: 159297K->159297K(262144K)], 1.2076900 secs] [Times: user=1.20 sys=0.00, real=1.21 secs]
INFO | jvm 1 | 2013/08/16 12:11:40 | [GC [PSYoungGen: 0K->0K(340736K)] 323592K->323592K(2437888K), 0.0046330 secs] [Times: user=0.02 sys=0.00, real=0.00 secs]
INFO | jvm 1 | 2013/08/16 12:11:40 | [Full GC
INFO | jvm 1 | 2013/08/16 12:11:42 | [PSYoungGen: 0K->0K(340736K)] [PSOldGen: 323592K->279953K(744512K)] 323592K->279953K(1085248K) [PSPermGen: 159297K->159062K(262144K)], 1.7593100 secs] [Times: user=1.75 sys=0.00, real=1.76 secs]
INFO | jvm 1 | 2013/08/16 12:11:42 | java.lang.OutOfMemoryError: Java heap space
INFO | jvm 1 | 2013/08/16 12:11:42 | Dumping heap to java_pid28908.hprof ...
INFO | jvm 1 | 2013/08/16 12:11:48 | Heap dump file created [463314899 bytes in 6.037 secs]
INFO | jvm 1 | 2013/08/16 12:12:36 | [GC [PSYoungGen: 331840K->6044K(352192K)] 611793K->285998K(2449344K), 0.0164060 secs] [Times: user=0.02 sys=0.00, real=0.02 secs]
INFO | jvm 1 | 2013/08/16 12:13:28 | [GC [PSYoungGen: 352156K->6161K(364160K)] 632110K->286114K(2461312K), 0.0152330 secs] [Times: user=0.02 sys=0.01, real=0.01 secs]
INFO | jvm 1 | 2013/08/16 12:14:47 | [GC [PSYoungGen: 364113K->6575K(374144K)] 644066K->288169K(2471296K), 0.0179930 secs] [Times: user=0.02 sys=0.01, real=0.02 secs]
请注意,在OOME之前,承诺堆总数在1GB到2.4GB之间振荡。我们可以看到事先稳定在1GB,之后稳定在2.4GB。
这个1.6.0._24 JVM的javaopts是:
JVM正在运行1.6.0._24。我们现在无法更改版本,但在接下来的一两个月内会有一个窗口。如果1.6.0_45更稳定,我们将切换到那个。我们正在测试它。
该机器只有4GB的总系统内存。此外,还有一个小型RAM磁盘正在使用中。我担心Xmx设置对于这种环境来说已经太高了。
这令我们感到困惑,因为在异常时看起来堆的使用量并不大。我们为什么要收到这个OOME?
更新:我们试图通过将初始内存(Xms)设置为等于最大内存(Xmx)来防止这种情况。到目前为止,虽然我们尚未介绍生产方面的变化,但这些实验仍然很有希望。它仍然没有解释为什么OOME首先发生,尽管它似乎表明可以避免OOME而不增加最大堆大小(或减少应用程序内存占用量)。那么神秘仍然是为什么堆调整大小导致了OOME?
答案 0 :(得分:1)
为了阅读你的日志,看起来你有一个非常大的活动爆发,大多数像大到足以直接进入终身/老一代的物体。我仍然建议你增加最大内存,以查看应用程序的行为,因为OOME可能会给你一些令人困惑的统计数据。
这表明早期推广很重要。 “GC”是一个次要集合,它似乎需要每个对象,触发一个Full GC,它可以找到一些可以丢弃的终身对象。当年轻物体在伊甸园空间中死亡时,GC效果最佳,但看起来你的大部分物体都在终身空间中死亡。
测试此方法的一种方法是使最大堆空间更大。如果您可以尝试24 GB堆或80%的主内存,请查看它的行为。例如如果你有32 GB的内存,请尝试-Xmx24g
。从这些数字来看,您似乎希望Eden大小至少为5 GB。
如果这不是一个选项,我建议您使用内存分析器将内存消耗减少至少3倍。
我会检查你有最新版本的Java 6,如更新45.更新18和26之间有显着的性能提升。