我正在尝试使用/ proc文件系统中的数据来确定Solaris 10中特定进程中特定LWP的CPU利用率。我遇到的问题是,有时利用率计数器会降低。
这是它的要点:
// we'll be reading from the file named /proc/<pid>/lwp/<lwpid>/lwpusage
std::stringstream filename;
filename << "/proc/" << pid << "/lwp/" << lwpid << "/lwpusage";
int fd = open(filename.str().c_str(), O_RDONLY);
// error checking
while(1)
{
prusage_t usage;
ssize_t readResult = pread(usage_fd, &usage, sizeof(prusage_t), 0);
// error checking
std::cout << "sec=" << usage.pr_stime.tv_sec
<< "nsec=" << usage.pr_stime.tv_nsec << std::endl;
// wait
}
close(fd);
prusage_t结构中报告的纳秒数是从每次LWP更改状态时记录的时间戳得出的。此功能称为microstate accounting。听起来不错,但每次经常“系统调用cpu时间”计数器减少大约1-10毫秒。
更新:它不仅仅是“系统调用cpu时间”计数器,我已经看到其他计数器也在减少。
另一个好奇心是,它似乎总是一个样本是假的 - 从来没有两个彼此靠近。所有其他样本都以预期的速率单调递增。这似乎排除了计数器以某种方式在内核中重置的可能性。
关于这里发生了什么的任何线索?
> uname -a
SunOS cdc-build-sol10u7 5.10 Generic_139556-08 i86pc i386 i86pc
答案 0 :(得分:1)
如果您使用的是多核计算机,则可以检查当进程从一个处理器核心迁移到另一个处理器核心时是否发生这种情况。如果您的进程正在运行,prstat
将显示它们正在运行的cpu。为了最大限度地减少锁争用,经常更新的数据有时会在特定于处理器的内存区域中更新,然后与其他处理器的任何数据副本同步。
答案 1 :(得分:0)
只是一个猜测。您可能希望暂时禁用NTP并查看问题是否仍然存在。