关于linux中的动态扩展,程序在时钟周期中的意外执行时间

时间:2014-08-11 20:52:50

标签: c++ c linux gcc

我正在用c编写一个程序,以便根据CPU周期找到执行任务所需的时间。我正在避免时间转换,时间以秒= 1 /时钟周期为CPU频率变化而服务器低负载以节省功耗。

计划1:

  ///////////////////////// RDTSC Functions /////////////////////////

inline void start_rdtsc_rdtscp_ia64() {
    asm volatile ("CPUID\n\t"
            "RDTSC\n\t"
            "mov %%edx, %0\n\t"
            "mov %%eax, %1\n\t": "=r" (cycles_high), "=r" (cycles_low):: "%rax", "%rbx", "%rcx", "%rdx");

}

inline void end_rdtsc_rdtscp_ia64() {
    asm volatile("RDTSCP\n\t"
            "mov %%edx, %0\n\t"
            "mov %%eax, %1\n\t"
            "CPUID\n\t": "=r" (cycles_high1), "=r" (cycles_low1):: "%rax", "%rbx", "%rcx", "%rdx");
}

inline void warmup_rdtsc_rdtscp_ia64() {
    start_rdtsc_rdtscp_ia64();
    end_rdtsc_rdtscp_ia64();

    start_rdtsc_rdtscp_ia64();
    end_rdtsc_rdtscp_ia64();

    start_rdtsc_rdtscp_ia64();
    end_rdtsc_rdtscp_ia64();
}

inline uint64_t get_start_ia64() {
    return (((uint64_t) cycles_high << 32) | cycles_low);
}

inline uint64_t get_end_ia64() {
    return (((uint64_t) cycles_high1 << 32) | cycles_low1);
}

///////////////////////// RDTSC Timer Functions /////////////////////////

inline void start_timer() {
    warmup_rdtsc_rdtscp_ia64();
    start_rdtsc_rdtscp_ia64();
}

inline void end_timer() {
    end_rdtsc_rdtscp_ia64();
    start = get_start_ia64();
    end = get_end_ia64();
}

inline uint64_t get_cycles_count() {
    return end - start;
}

// measuring time here 
start_timer();

perform a task for length K //Let large K means more computation

end_timer();


time in ticks= get_cycles_count()

计划2

int main()
{

while(1);
}

我已经使用了warmup_rdtsc_rdtscp_ia64()函数,以便我的rdtsc和cpuid按照英特尔文档准备就绪,需要获得正确的读数。

如果没有Program2,我的循环读数会更高,而且我无法找到执行时间和长度K之间的原因和关系。

在存在Program2的情况下,我得到预期的结果 - 意味着我可以关联执行时间和K的长度。使用更长的K来获得更高的时钟周期执行时间。

我只知道,Program2阻止CPU进入省电模式,因此我的CPU总是运行到最高CPU频率,而没有program2我的CPU进入省电模式以节省电量并进入可能的最低频率。

所以,我怀疑如下

  1. 如果没有Progra2,CPU会进入省电模式(较低的CPU频率)以节省电量。虽然CPU以较低的频率运行,但我仍然期待几乎相似的时钟周期范围。由于Time_in_sec = 1 / Frequency,我没有使用转换。我得到更高时钟周期的原因是什么????

  2. 任何人都可以解释一下 - 在时钟周期内完成任务所需的时序与不同频率级别(节电模式,按需模式,性能模式)之间的关系

  3. 我正在使用Linux以及gcc和g ++。

    我需要您的协助,以了解在不同电源模式下完成任务所需的时钟周期之间的关系(省电模式,按需模式,性能模式)

    提前致谢。

1 个答案:

答案 0 :(得分:1)

您可以使用许多工具来实现目标,您应该尝试利用这些工具,而不必使用自己的工具。以下是我最喜欢的两个:

https://perf.wiki.kernel.org/index.php/Main_Page

https://code.google.com/p/likwid/

关于你的两个问题,我提供以下内容:完成一个程序所需的时间与CPU频率没有直接关系。许多人使用称为每周期指令或IPC的度量。 IPC指标可能差别很大。在当前的机器上可能高达2到4,即CPU每个CPU周期退出多于一个指令,因为它可以在每个周期发出几个指令。您为程序看到的IPC至少取决于以下内容:CPU可以利用的指令级并行度(即因为您可能有无序处理器)和数据中的位置数量(即因为更多的局部性意味着更多的缓存命中,因此更少等待内存)。

现代系统的CPU时钟频率也不同。它可以更高或更低,具体取决于1)省电模式(即如果它是电源线拔掉的笔记本电脑)和2)当前系统负载(即你有几个CPU,但如果它们中的大多数是空闲的,一个CPU)可以比所有四个可以同时运行更快地运行。)

因此,您想要的是以下三件事: 1.您的计划的平均IPC 2.运行程序时的平均CPU频率 3.程序中的指令数

然后,您可以使用上述方法计算执行时间。然后你可以使用likwid或perf在这个低级别调整你的表现。您可以看到省电模式对CPU频率的影响。

祝你好运。