我正在用c编写一个程序,以便根据CPU周期找到执行任务所需的时间。我正在避免时间转换,时间以秒= 1 /时钟周期为CPU频率变化而服务器低负载以节省功耗。
计划1:
///////////////////////// RDTSC Functions /////////////////////////
inline void start_rdtsc_rdtscp_ia64() {
asm volatile ("CPUID\n\t"
"RDTSC\n\t"
"mov %%edx, %0\n\t"
"mov %%eax, %1\n\t": "=r" (cycles_high), "=r" (cycles_low):: "%rax", "%rbx", "%rcx", "%rdx");
}
inline void end_rdtsc_rdtscp_ia64() {
asm volatile("RDTSCP\n\t"
"mov %%edx, %0\n\t"
"mov %%eax, %1\n\t"
"CPUID\n\t": "=r" (cycles_high1), "=r" (cycles_low1):: "%rax", "%rbx", "%rcx", "%rdx");
}
inline void warmup_rdtsc_rdtscp_ia64() {
start_rdtsc_rdtscp_ia64();
end_rdtsc_rdtscp_ia64();
start_rdtsc_rdtscp_ia64();
end_rdtsc_rdtscp_ia64();
start_rdtsc_rdtscp_ia64();
end_rdtsc_rdtscp_ia64();
}
inline uint64_t get_start_ia64() {
return (((uint64_t) cycles_high << 32) | cycles_low);
}
inline uint64_t get_end_ia64() {
return (((uint64_t) cycles_high1 << 32) | cycles_low1);
}
///////////////////////// RDTSC Timer Functions /////////////////////////
inline void start_timer() {
warmup_rdtsc_rdtscp_ia64();
start_rdtsc_rdtscp_ia64();
}
inline void end_timer() {
end_rdtsc_rdtscp_ia64();
start = get_start_ia64();
end = get_end_ia64();
}
inline uint64_t get_cycles_count() {
return end - start;
}
// measuring time here
start_timer();
perform a task for length K //Let large K means more computation
end_timer();
time in ticks= get_cycles_count()
计划2
int main()
{
while(1);
}
我已经使用了warmup_rdtsc_rdtscp_ia64()函数,以便我的rdtsc和cpuid按照英特尔文档准备就绪,需要获得正确的读数。
如果没有Program2,我的循环读数会更高,而且我无法找到执行时间和长度K之间的原因和关系。
在存在Program2的情况下,我得到预期的结果 - 意味着我可以关联执行时间和K的长度。使用更长的K来获得更高的时钟周期执行时间。
我只知道,Program2阻止CPU进入省电模式,因此我的CPU总是运行到最高CPU频率,而没有program2我的CPU进入省电模式以节省电量并进入可能的最低频率。
所以,我怀疑如下
如果没有Progra2,CPU会进入省电模式(较低的CPU频率)以节省电量。虽然CPU以较低的频率运行,但我仍然期待几乎相似的时钟周期范围。由于Time_in_sec = 1 / Frequency,我没有使用转换。我得到更高时钟周期的原因是什么????
任何人都可以解释一下 - 在时钟周期内完成任务所需的时序与不同频率级别(节电模式,按需模式,性能模式)之间的关系
我正在使用Linux以及gcc和g ++。
我需要您的协助,以了解在不同电源模式下完成任务所需的时钟周期之间的关系(省电模式,按需模式,性能模式)
提前致谢。
答案 0 :(得分:1)
您可以使用许多工具来实现目标,您应该尝试利用这些工具,而不必使用自己的工具。以下是我最喜欢的两个:
https://perf.wiki.kernel.org/index.php/Main_Page
https://code.google.com/p/likwid/
关于你的两个问题,我提供以下内容:完成一个程序所需的时间与CPU频率没有直接关系。许多人使用称为每周期指令或IPC的度量。 IPC指标可能差别很大。在当前的机器上可能高达2到4,即CPU每个CPU周期退出多于一个指令,因为它可以在每个周期发出几个指令。您为程序看到的IPC至少取决于以下内容:CPU可以利用的指令级并行度(即因为您可能有无序处理器)和数据中的位置数量(即因为更多的局部性意味着更多的缓存命中,因此更少等待内存)。
现代系统的CPU时钟频率也不同。它可以更高或更低,具体取决于1)省电模式(即如果它是电源线拔掉的笔记本电脑)和2)当前系统负载(即你有几个CPU,但如果它们中的大多数是空闲的,一个CPU)可以比所有四个可以同时运行更快地运行。)
因此,您想要的是以下三件事: 1.您的计划的平均IPC 2.运行程序时的平均CPU频率 3.程序中的指令数
然后,您可以使用上述方法计算执行时间。然后你可以使用likwid或perf在这个低级别调整你的表现。您可以看到省电模式对CPU频率的影响。
祝你好运。