您是否知道在Linux中用户空间中有高分辨率时钟(最小微秒)的C / C ++实现(即使它不是可移植的)?
目标是测量一些低延迟操作经过的时间间隔。 我测量到内核空间时钟在某些时候会导致延迟峰值。
根据我对Red Hat 7.2的研究:
谢谢。
答案 0 :(得分:3)
一种选择是通过rdtsc
函数使用__builtin_ia32_rdtsc
指令。在现代的Intel CPU上,rdtsc
在任何CPU频率下都以基本时钟频率滴答,因此您可以通过将计数器除以GHz的基本(非增强)CPU频率来将计数器转换为纳秒:
#include <regex>
#include <string>
#include <fstream>
#include <iostream>
double cpu_base_frequency() {
std::regex re("model name\\s*:[^@]+@\\s*([0-9.]+)\\s*GHz");
std::ifstream cpuinfo("/proc/cpuinfo");
std::smatch m;
for(std::string line; getline(cpuinfo, line);) {
regex_match(line, m, re);
if(m.size() == 2)
return std::stod(m[1]);
}
return 1; // Couldn't determine the CPU base frequency. Just count TSC ticks.
}
double const CPU_GHZ_INV = 1 / cpu_base_frequency();
int main() {
auto t0 = __builtin_ia32_rdtsc();
auto t1 = __builtin_ia32_rdtsc();
std::cout << (t1 - t0) * CPU_GHZ_INV << "nsec\n";
}
英特尔文档中的更多信息:
恒定TSC 行为可确保每个时钟滴答的持续时间是均匀的,并且即使处理器内核更改了频率,也支持将TSC用作壁钟计时器。这是向前发展的建筑行为。
不变TSC 将在所有ACPI P,C和T状态下以恒定速率运行。这是前进的架构行为。在具有不变TSC支持的处理器上,OS可以将TSC用于壁钟计时器服务(而不是ACPI或HPET计时器)。 TSC读取效率更高,并且不会产生与环转换或访问平台资源相关的开销。
不变TSC 基于不变计时硬件(称为Always Running Timer或ART),该硬件以核心晶体时钟频率运行。
可伸缩总线频率在位字段MSR_PLATFORM_INFO [15:8]中进行编码,标称TSC频率可以通过将该数字乘以100 MHz的总线速度来确定。
答案 1 :(得分:0)
timestamp具有一些有趣的功能。我特别喜欢boost::timer。它显示的时间以微秒为单位。不知道它是否可以低于该水平。