最近我们在Docker容器中遇到了Ruby问题。尽管负载非常低,但应用程序往往会占用大量内存,并且在提及的情况下经过一段时间后它会加载OOM。
经过一番调查后,我们将问题缩小到单线
docker run -ti -m 209715200 ruby:2.1 ruby -e 'while true do array = []; 3000000.times do array << "hey" end; puts array.length; end;'
在一些机器上,它在开始后很快就被OOMed(由于超过极限而被oom-killer杀死),但是在某些机器上,它虽然很慢,却没有OOM,但仍有效。似乎(似乎,似乎并非如此)在某些配置中,ruby能够推断出cgroup的限制并调整它的GC。
测试配置:
如果你看一下ruby进程的内存消耗,在所有情况下它都表现得与这张图相似,保持在略低于限制的同一级别,或者撞到极限并被杀死。
我们希望不惜一切代价避免使用OOM,因为它会降低弹性并带来丢失数据的风险。应用程序真正需要的内存低于限制。
对于如何处理ruby以避免OOMing,你有什么建议,可能会失去性能吗?
我们无法弄清楚测试安装之间的重大差异。
编辑:无法更改代码或增加内存限制。第一个因为我们精通社区插件而我们无法控制,第二个因为它不能保证我们将来不会再次面对这个问题。
答案 0 :(得分:2)
我不认为这是一个码头工人问题。您过度使用容器的资源,一旦达到内存阈值,Ruby往往表现不佳。它可以GC,但是如果另一个进程试图占用一些内存或者Ruby尝试再次分配,那么内核将(通常)杀死具有最多内存的进程。如果您担心服务器上的内存使用情况,请在80%RAM上添加一些阈值警报,并为该作业分配适当大小的资源。当您开始达到阈值时,分配更多RAM或查看特定的作业参数/分配,以查看是否需要重新设计它以减少占用空间。
另一个潜在的选择,如果你真的想要一个很好的固定内存带到GC反对是使用JRuby并设置JVM最大内存在容器内存上留下一点摆动空间。 JVM将在其自己的上下文中更好地管理OOM,因为它不会与其他进程共享这些资源,也不会让内核认为服务器正在死亡。
答案 1 :(得分:2)
我在一个Docker主机上运行的一些基于java的Docker容器遇到了类似的问题。问题是每个容器都看到了主机的总可用内存,并假设它可以为自己使用所有内存。它没有经常运行GC,最终导致内存异常。我最终手动限制每个容器可以使用的内存量,我不再有OOM。在contianer中我也限制了JVM的内存。
不确定这是否与您所看到的问题相同,但可能是相关的。
https://docs.docker.com/engine/reference/run/#/runtime-constraints-on-resources
答案 2 :(得分:2)
你可以通过环境变量尝试tweak rubies垃圾收集(取决于你的ruby版本):
RUBY_GC_MALLOC_LIMIT=4000100
RUBY_GC_MALLOC_LIMIT_MAX=16000100
RUBY_GC_MALLOC_LIMIT_GROWTH_FACTOR=1.1
或通过GC.start
对于您的示例,请尝试
docker run -ti -m 209715200 ruby:2.1 ruby -e 'while true do array = []; 3000000.times do array << "hey" end; puts array.length; array = nil; end;'
帮助垃圾收集器。
修改强>
我没有与你相比的环境。在我的机器上(14.04.5 LTS,docker 1.12.3,RAM 4GB,Intel(R)Core(TM)i5-3337U CPU @ 1.80GHz)以下看起来非常有前景。
docker run -ti -m 500MB -e "RUBY_GC_MALLOC_LIMIT_GROWTH_FACTOR=1" \
-e "RUBY_GC_MALLOC_LIMIT=5242880" \
-e "RUBY_GC_MALLOC_LIMIT_MAX=16000100" \
-e "RUBY_GC_HEAP_INIT_SLOTS=500000" \
ruby:2.1 ruby -e 'while true do array = []; 3000000.times do array << "hey" end; puts array.length; puts `ps -o rss -p #{Process::pid}`.chomp.split("\n").last.strip.to_i / 1024.0 / 1024 ; puts GC.stat; end;'
但是每个ruby应用程序都需要一个不同的设置来进行微调,如果你遇到内存泄漏,你会丢失。