getrusage返回舍入的数字

时间:2013-09-27 06:15:08

标签: c linux

我正在尝试使用rusage测量各种函数调用的资源使用时间(用户和系统)。 我发现我得到的结果是10s毫秒的顺序,如0s 70000us,10000us等。如果有办法设置getrusage的精度/粒度,请告诉我。

我的程序很简单:

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include <sys/time.h>
#include <sys/resource.h>
#include <unistd.h>

int main(){
  struct rusage usage;
  struct timeval start, end;
  int i, j, k = 0;

  getrusage(RUSAGE_SELF, &usage);
  start = usage.ru_utime;
  printf("buffer check\n");
  char *str = "---";
  int arr[100],ctr;

  for(ctr = 0;ctr<100;ctr++){

    arr[ctr] = ctr + 1000;

  }

  for (i = 0; i < 10000; i++) {
     for (j = 0; j < 10000; j++) {
      k += 20;
  }
 }

 getrusage(RUSAGE_SELF, &usage);
 end = usage.ru_utime;

 printf("Started at: %ld.%lds\n", start.tv_sec, start.tv_usec);
 printf("Ended at: %ld.%lds\n", end.tv_sec, end.tv_usec);

 return 1;
}

结果 开始于:0.0s 截至:0.2000000s

我添加了另一个for循环,结果如下: 开始于:0.0s 截至:0.7000000s 我浏览了很多东西,找到了获得准确计时的可能方法。在linux源代码中遇到了3个参数getrusage但是我不知道如何使用它,因为它需要任务指针作为第一个参数。其中一个链接表明它与linux版本有关。无论如何,如果有任何方法可以设置精度/粒度,请告诉我。如果没有,请告诉我是否有任何替代getrusage。 gettimeofDay似乎没有提供资源使用细节,所以如果我无法设置精度,那么寻找getrusage的实际实现。

3 个答案:

答案 0 :(得分:3)

许多操作系统不会精确计算进程使用的时间。在许多情况下,在每个上下文切换和系统调用上读取时钟的成本太高,在其他情况下,硬件可能甚至没有时钟允许您以任何精度计时。

getrusage得到的一种非常常用的会计方法是100Hz(最常见的是100Hz,虽然64Hz和1024Hz也是常见的)定时器中断,它可以对当时系统上发生的事情进行采样中断因此,内核每秒100次检查当前正在运行的内容以及ru_utime的用户空间或ru_stime的内核空间,并递增计数器。然后该计数器被解释为您的程序运行10ms。

您可以在系统上试用clock_gettime,查看它是否包含每个进程的计数器,有时这些计数器可能比getrusage计数器更精确。但是我不会抱有希望,如果10ms分辨率是最好的getrusage可以做到的,那么clock_gettime可能没有更好的分辨率或任何每个进程的时钟。< / p>

如果操作系统中的时钟不足以进行测量,那么您唯一的选择就是重复测试运行几分钟,然后根据运行次数划分得到的结果。

gettimeofday更精确的事实并不重要。 gettimeofday可能相对昂贵。考虑内核为准确跟踪进程的用户和系统时间而必须做的工作。每次进行系统调用时,都必须花两次时间戳(一次用于系统调用的开始,一次用于结束),以便跟踪您使用的系统时间。为了跟踪用户时间,每次系统切换到另一个进程时都需要时间戳。许多系统确实跟踪第二个,但不是第一个,因为系统调用比进程上下文切换更常见(这就是我建议检查clock_gettime的原因,因为它可以有一个累积总系统和用户时间的计时器一个过程)。

现代系统中的时钟非常烦人,因为即使采用时间戳是最常见的系统调用之一,我们仍然经常需要通过慢速总线进行拖拽并进行大量锁定才能获得它们。其他解决方案,如CPU上的循环计数器已被使用,但这些是众所周知的不准确,因为它们可能在CPU之间不同步,可能具有可变频率,可以在操作系统的控制之外停止等等,并且您需要知道您的CPU的确切模型,以便能够可靠地使用它们。操作系统有很多启发式算法来确定使用哪些时钟,但这可能意味着两台几乎相同的机器之间存在巨大差异。有人可能会得到一个亚纳秒级精度的循环计数器,需要一条指令才能读取而另一条需要通过ISA总线进行30年的芯片设计,精度为微秒或更差,需要数千个周期才能读取。

答案 1 :(得分:0)

My new program:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <time.h>
//int clock_gettime(clockid_t clk_id, struct timespect *tp);

#define BILLION  1000000000L;

void testClockGetTime(clockid_t clk_id , struct timespec *start , struct timespec  *stop){

   long temp = 0,i;
   unsigned long accumsec,accumns;
   if( clock_gettime( clk_id, start) == -1 ) {
      perror( "clock gettime" );
      exit( EXIT_FAILURE );
   }
   for ( i = 0; i< 24222000; i++)
       temp+=temp;

   if( clock_gettime( clk_id, stop) == -1 ) {
      perror( "clock gettime" );
      exit( EXIT_FAILURE );
    }
    accumsec = stop->tv_sec - start->tv_sec;
    accumns =  stop->tv_nsec - start->tv_nsec;
    if(stop->tv_nsec<start->tv_nsec){
       accumsec = accumsec - 1;
       accumns = start->tv_nsec - stop->tv_nsec;
    }

    printf( " sec %ld\n", accumsec );
    printf(" ns %ld\n", accumns );

  }

int main( int argc, char **argv )
 {
   struct timespec start, stop;
   struct timeval tds,tdse;
   memset(&tds,0,sizeof(struct timeval));
   memset(&tdse,0,sizeof(struct timeval));
   unsigned long accumsec,accumns;
   long timesec, timeusec;
   printf("checking on various timers gives by clockGetTime \n");
   printf("cpu time\n");
   memset(&stop,0,sizeof(struct timespec));
   memset(&start,0,sizeof(struct timespec));
   testClockGetTime(CLOCK_PROCESS_CPUTIME_ID , &start,&stop);
   memset(&start,0,sizeof(struct timespec));
   memset(&stop,0,sizeof(struct timespec));
   printf("real time\n");    
   testClockGetTime(CLOCK_REALTIME,&start,&stop);
   memset(&start,0,sizeof(struct timespec));
   memset(&stop,0,sizeof(struct timespec));
   printf("monotonic\n");    
   testClockGetTime(CLOCK_MONOTONIC,&start,&stop);
   memset(&start,0,sizeof(struct timespec));
   memset(&stop,0,sizeof(struct timespec));
   printf("thread\n");
   testClockGetTime(CLOCK_THREAD_CPUTIME_ID,&start,&stop);
   memset(&start,0,sizeof(struct timespec));
   memset(&stop,0,sizeof(struct timespec));
   gettimeofday(&tds, NULL);
   long temp,i;
   for ( i = 0; i< 24222000; i++)
      temp+=temp;
   gettimeofday(&tdse, NULL);
   if( clock_gettime( CLOCK_PROCESS_CPUTIME_ID, &stop) == -1 ) {
      perror( "clock gettime" );
      exit( EXIT_FAILURE );
    }

    //   accumsec = stop.tv_sec - start.tv_sec; 
    //   accumns =  stop.tv_nsec - start.tv_nsec; 
    //   if(stop.tv_nsec<start.tv_nsec){
    //     accumsec = accumsec - 1;
    //     accumns = start.tv_nsec - stop.tv_nsec;
    //   }

    //   printf( "proc sec %ld\n", accumsec );
    //   printf( "proc ns %ld\n", accumns );
    //    printf("before day =%ld,%ld\n",tds.tv_sec,tds.tv_usec);
    //    printf("after day=%ld,%ld\n",tdse.tv_sec, tdse.tv_usec);
    timesec =  tdse.tv_sec - tds.tv_sec;
    timeusec=  tdse.tv_usec- tds.tv_usec;
  if(tdse.tv_usec < tds.tv_usec){
    timesec = timesec - 1;
    timeusec= tds.tv_usec - tdse.tv_usec;
   }
   printf("daytime sec =%ld\n",timesec);
   printf("daytime usec=%ld\n",timeusec);
   return( EXIT_SUCCESS );
 }

结果:

首次运行&gt; gcc getclk.c -o dfkj -lrt

getclk.c:在函数'main'中:

getclk.c:40:警告:内置函数'memset'的不兼容隐式声明

  

./ dfkj

通过clockGetTime检查各种计时器

cpu time

sec 0

ns 54502537

实时

sec 0

ns 53748970

单调

sec 0

ns 55456758

螺纹

sec 0

ns 58649229

daytime sec = 0

白天usec = 56991

第二次运行&gt; ./ dfkj

通过clockGetTime检查各种计时器

cpu time

sec 0

ns 54220021

实时

sec 0

ns 52774966

单调

sec 0

ns 53636163

螺纹

sec 0

ns 53357492

daytime sec = 0

白天usec = 56176

答案 2 :(得分:0)

在2013-10-01 4:48 PM,Saurabh写道:

  道格拉斯,道格拉斯,   我是Saurabh。我在堆栈溢出时看到了你的响应。不知何故,当我运行getrusage时,它不会以微秒为单位给出结果。但是在几毫秒内。如果您有解决方法,请告诉我。另外请建议我用API代替getrusage。

是的,getrusage在我的Linux系统上也具有ms精度。它仅在我的OS X工作站上以μs精度返回。 It says this in my post that you reference, if you look carefully:“我系统的精度为1μs,但我也在Linux系统(使用GCC 4.1.2的Red Hat 4.1.2-48)上进行了测试,精度仅为1 ms。” p>

关于您对替代功能的要求,我同意Art。据我所知,clock_getTime提供了迄今为止最好的Linux时钟。唯一的问题是它相对较新,所以它不是很便携(例如OS X没有它)。不过,如果您想要精确计时并且使用Linux,我建议使用clock_gettime