我有一个Linux守护进程,它会分叉几个孩子并监视它们是否崩溃(根据需要重新启动)。 如果父进程可以监视子进程的内存使用情况 - 检测内存泄漏并在超出特定大小时重新启动子进程,那将会很棒。 我怎么能这样做?
答案 0 :(得分:4)
您应该能够从/ proc / {PID} / status:
中获取详细的内存信息Name: bash
State: S (sleeping)
Tgid: 6053
Pid: 6053
PPid: 6050
TracerPid: 0
Uid: 1007 1007 1007 1007
Gid: 1007 1007 1007 1007
FDSize: 256
Groups: 1007
VmPeak: 48076 kB
VmSize: 48044 kB
VmLck: 0 kB
VmHWM: 4932 kB
VmRSS: 2812 kB
VmData: 2232 kB
VmStk: 84 kB
VmExe: 832 kB
VmLib: 6468 kB
VmPTE: 108 kB
Threads: 1
SigQ: 0/8190
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000000001010
SigCgt: 0000000188020001
CapInh: 0000000000000000
CapPrm: 0000000000000000
CapEff: 0000000000000000
Cpus_allowed: 0f
Mems_allowed: 00000000,00000001
voluntary_ctxt_switches: 69227121
nonvoluntary_ctxt_switches: 19071
然而,除非内存泄漏是戏剧性的,否则很难检测到它们查看进程统计信息,因为malloc和free通常与它们对应的系统调用(brk / sbrk)相当抽象。
您还可以查看/ proc / $ {PID} / statm。
答案 1 :(得分:1)
您可以尝试使用与您的进程并行运行vmstat的监视器脚本(请注意,如果您多次运行此脚本,这将不是一个好主意,因为您将获得多个vmstat副本)。然后,此监视器脚本可以获取空闲内存加上缓冲区和缓存大小,以获取操作系统可用的内存量,您可以跟踪它。然后,如果它低于某个阈值,您可以通过调用ps -e -o来检查最大的进程...(有关详细信息,请参阅手册页,但请尝试使用vsz,pcpu,user,pid,args作为起点)。
我建议将此监视器作为一个单独的进程运行,并在它变得太大时杀死它。您可以使用
限制监视的进程集-u user-name
参数ps。
这是一个黑客(英国的意思)虽然 - 正确的解决方案是修复泄漏,假设你有代码。