Question

我有一个Linux守护进程，它会分叉几个孩子并监视它们是否崩溃（根据需要重新启动）。如果父进程可以监视子进程的内存使用情况 - 检测内存泄漏并在超出特定大小时重新启动子进程，那将会很棒。我怎么能这样做？

Answer 1

您应该能够从/ proc / {PID} / status：

中获取详细的内存信息

Name:   bash
State:  S (sleeping)
Tgid:   6053
Pid:    6053
PPid:   6050
TracerPid:  0
Uid:    1007    1007    1007    1007
Gid:    1007    1007    1007    1007
FDSize: 256
Groups: 1007 
VmPeak:    48076 kB
VmSize:    48044 kB
VmLck:         0 kB
VmHWM:      4932 kB
VmRSS:      2812 kB
VmData:     2232 kB
VmStk:        84 kB
VmExe:       832 kB
VmLib:      6468 kB
VmPTE:       108 kB
Threads:    1
SigQ:   0/8190
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000000001010
SigCgt: 0000000188020001
CapInh: 0000000000000000
CapPrm: 0000000000000000
CapEff: 0000000000000000
Cpus_allowed:   0f
Mems_allowed:   00000000,00000001
voluntary_ctxt_switches:    69227121
nonvoluntary_ctxt_switches: 19071

然而，除非内存泄漏是戏剧性的，否则很难检测到它们查看进程统计信息，因为malloc和free通常与它们对应的系统调用（brk / sbrk）相当抽象。

您还可以查看/ proc / $ {PID} / statm。

Answer 2

您可以尝试使用与您的进程并行运行vmstat的监视器脚本（请注意，如果您多次运行此脚本，这将不是一个好主意，因为您将获得多个vmstat副本）。然后，此监视器脚本可以获取空闲内存加上缓冲区和缓存大小，以获取操作系统可用的内存量，您可以跟踪它。然后，如果它低于某个阈值，您可以通过调用ps -e -o来检查最大的进程...（有关详细信息，请参阅手册页，但请尝试使用vsz，pcpu，user，pid，args作为起点）。

我建议将此监视器作为一个单独的进程运行，并在它变得太大时杀死它。您可以使用

限制监视的进程集

-u user-name

参数ps。

这是一个黑客（英国的意思）虽然 - 正确的解决方案是修复泄漏，假设你有代码。

监视子进程的内存使用情况

2 个答案: