Question

Som背景信息;

服务器;

新的SLES 12服务器，带有130 GB Ram，用于为大型数据库运行MySQL（150G +数据）。

服务器还将托管一些Java应用程序。

Java版本（默认来自Oracle） - Java（TM）SE运行时环境（版本1.7.0-b147） - Java HotSpot（TM）64位服务器VM（版本21.0-b17，混合模式）

我们偶然发现了以下问题;

运行一些特定的Java应用程序会使kerne / system cpu峰值减慢/暂停应用程序一段时间。我通过创建一个Java应用程序来重现它，它只是随着时间的推移而占用内存并使用一些cpu。

调查显示在减速期间（10000-25000）有大量的中断。

每次放缓之后，Java都会获得更多内存。将Java设置为以固定内存开始似乎也可以减少问题（将-Xmx和-Xms设置为相同的值）。详细的垃圾收集也表明GC正在开始并可能成为触发器。

GC和内存分配由于某种原因非常昂贵，我们不确定从这里查看。来自GC的详细信息：

[GC^C 1024064K->259230K(3925376K), 87,3591890 secs]

在低端linux服务器上运行GC的同一程序（从SUN运行SLES，Java 1.6.0_11）;

[GC 1092288K->253266K(3959488K), 3.0125460 secs]

在减速期间TOP：

top - 11:23:33 up 87 days, 19:55,  5 users,  load average: 14.27, 4.50, 10.17
Tasks: 250 total,  39 running, 211 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.0%us, 71.8%sy,  0.0%ni, 28.2%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:    129033M total,   128576M used,      457M free,     1388M buffers
Swap:    32765M total,       13M used,    32752M free,   113732M cached

在减速期间

vmstat（从3.行开始）;

procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu------
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 0  0  13552 1714328 1422268 116462260    0    0    10     9    0    0  0  0 100  0  0
 1  0  13552 1241780 1422268 116462292    0    0     0     0  240  353  1  0 99  0  0
 1  0  13552 695616 1422268 116462292    0    0     0    17  419  431  3  0 97  0  0
55  0  13552 486384 1422268 116462292    0    0     0     2 20228  458  1 57 43  0  0
75  0  13552 476172 1422268 116462300    0    0     0     8 12782  684  0 70 30  0  0
65  0  13552 470304 1422268 116462304    0    0     0     0 13108  792  0 72 28  0  0

为什么GC在高端服务器上比在低端服务器上如此昂贵？有什么想法寻找线索吗？

更新 - 调用参数2012-11-26 调用params;

java -Xmx4g -Xms4g -verbose:gc -server -cp "./dest/" UseMemoryMain

给予

[GC^C 1024064K->259230K(3925376K), 87,3591890 secs]

更改为;

java -Xmx4g -Xms4g -XX:+UseParallelGC -verbose:gc -cp "./dest/" UseMemoryMain

给予

[GC 1048640K->265430K(4019584K), 0,0902660 secs]

更改为;

java -Xmx4g -Xms4g -XX:+UseConcMarkSweepGC -verbose:gc -cp "./dest/" UseMemoryMain

给予

[GC 1092288K->272230K(3959488K), 0,1791320 secs]

真正有趣的是，重新运行今天而不告诉使用哪种GC方法会产生这种情况;

java -Xmx4g -Xms4g -verbose:gc -server -cp "./dest/" UseMemoryMain

给予

[GC 1024064K->259238K(3925376K), 0,0839190 secs]

Java以某种方式改变了违约GC的策略......

Answer 1

垃圾收集确实是一个棘手的话题。要给出最佳答案，您应该发布用于调用java的完整命令行。

正如你所说，使用GC开关搁浅有帮助。原因在于，对于目前使用的许多应用程序来说，默认设置不是最佳选择。对于许多需要快速响应的应用程序，因为它们是交互式的，参数

-XX：+ UseConcMarkSweepGC

会有很大的不同。

值得注意的是，使用你提到的JVM，使用更大的堆（比如更大的10GB）总是需要一些调整。获取您拥有的GC日志，并观察使用GC选项时行为的变化。我建议尝试不同的收集器策略（如CMS或G1），并使用Eden Space的配置（如Xmn）。

最后，但并非最不重要的是，您可以使用分析器调查应用程序对内存的作用。也许代码可以改进，因此可以避免很多GC。

Linux使用运行Java GC的系统/内核CPU

1 个答案: