Dtrace脚本,返回按区域聚合的%CPU,%内存和网络输入/输出

时间:2013-01-29 09:12:23

标签: monitoring dtrace

我需要一个DTrace脚本,它返回CPU使用百分比,内存使用百分比以及使用的网络输入和输出字节,按区域聚合数据。像这样:

ZONE  %CPU %MEM NET_INPUT NET_OUTPUT
zone1 25%  12%   86012     1294
zone2 48%  65%   86012     7354
zone3  8%  14%  268153    68746

到现在为止,我正在使用:

prstat -Z -c -n 1,99999 5 1

返回类似的内容(没有网络流量):

Please wait...
   PID USERNAME  SIZE   RSS STATE  PRI NICE      TIME  CPU PROCESS/NLWP       
 32051 root     1090M 1079M sleep    1    0  12:57:25 0,4% qemu-system-x86/7
ZONEID    NPROC  SWAP   RSS MEMORY      TIME  CPU ZONE                        
  3228        2 1090M 1079M   2,2%  12:57:25 0,4% 6ce064b6-fec9-4daa-ba2b-0082f73fca73
     0      105 2075M  633M   1,1% 202:56:51 0,4% global                      
  3031        2 2105M 2094M   4,3%  17:04:52 0,3% e32fb987-35f7-4860-a04a-ca26c327d4ba
(...)
  3411       18   81M   54M   0,1%   0:00:04 0,0% 52120eb6-2e20-4a64-8f7a-235a44d9f100
Total: 894 processes, 5460 lwps, load averages: 0,53, 0,53, 0,54

我需要获得相同的功能,但需要使用DTrace,以便将数据与网络流量相结合,并在将来使用更多探测器。

2 个答案:

答案 0 :(得分:5)

这样的脚本尚不存在的原因是使用DTrace很难获得CPU /内存利用率。 DTrace最适合对特定事件的数据进行采样。要使用DTrace获得CPU利用率,您需要在每次CPU变为空闲时以及每次繁忙时进行跟踪,然后再进行一些添加。请注意,这与DTrace为跟踪调度程序操作提供的提供程序不同,因为这些提供程序基于每个线程而不是基于每个CPU。内存更加烦人,因为你会跟踪每个内存分配和释放。

要获取这些数据源,可以通过从kstat提取数据来获得更好的服务(听起来您使用的是Solaris,而AFAIK是唯一具有kstat的平台)。您正在寻找的信息可以通过以下方式找到:

$ sudo kstat unix:0:system_misc:ncpus      # this is the number of CPUs you have
module: unix                            instance: 0     
name:   system_misc                     class:    misc
        ncpus                           2

$ sudo kstat cpu::sys:cpu_ticks*           # ticks of each type for each core since boot
module: cpu                             instance: 0     
name:   sys                             class:    misc
        cpu_ticks_idle                  9375292
        cpu_ticks_kernel                82658
        cpu_ticks_user                  23684
        cpu_ticks_wait                  0

module: cpu                             instance: 1     
name:   sys                             class:    misc
        cpu_ticks_idle                  9410367
        cpu_ticks_kernel                49141
        cpu_ticks_user                  21956
        cpu_ticks_wait                  0

$ sudo kstat unix:0:system_pages:physmem   # pages of physical memory (multiply by page size for number of bytes)
module: unix                            instance: 0     
name:   system_pages                    class:    pages
        physmem                         1045390

$ sudo kstat unix:0:system_pages:freemem   # pages of free memory (multiply by page size for number of bytes)
module: unix                            instance: 0     
name:   system_pages                    class:    pages
        freemem                         880842

请注意,您需要从CPU刻度计数器的最后一个读数中减去每个新读数 - 否则,您将跟踪自系统启动以来的刻度总数。当计数器溢出时,它们被设置为0,然后将新值添加到它们(它不仅仅是盲目的加法溢出)。

您还可以使用kstat来监控使用link:0::通过网络链接读取/写入的字节数。我不确定是否可以按区域找到此信息,但可能还有kstat跟踪该信息。

我想如果您决定使用DTrace监视值,可以通过跟踪在内核中修改这些计数器并记录修改的时刻来强制它这样做。但是,我并没有真正意识到这一点,因为你已经发现了更容易使用其他方法。为什么不创建一个启动两个数据源的脚本,并将结果组合成更好看的内容?

答案 1 :(得分:1)

看看Brendan Gregg的DTraceToolkit。它有大量脚本,使用各种探针来完成大量任务。这可能会指出你正确的方向。