Question

我使用time.clock和time.time在Ubuntu上定时了一段python代码：

clock elapsed time: 8.770 s
time  elapsed time: 1.869 s

我知道time.time使用系统时间和time.clock使用处理器时钟。当time.time给出比time.clock更长的时间时，对我来说很有意义：处理器整个时间都没有活动（例如调用time.sleep的时间）。

但为什么/何时处理器时钟会比系统时间给出更大的经过时间？

附录

我做了一个粗略的测试，使用标准映射计算相同的函数，使用进程池映射和线程池映射。可以理解，进程池速度更快，线程池更慢。更有趣的是：时钟时间 less 比处理器池的时间时间更少，而线程池中的更大。

同样，我理解为什么处理器池的时钟时序较少：假设主进程没有做太多事情，只是等待池进程完成。但是为什么线程池的时钟时间更长？任何见解？

结果：

map
  time  1738.8
  clock 1739.6
mp pool
  time   580.1
  clock   15.9
thread pool
  time  3455.3
  clock 5378.9

代码：

from time import clock, sleep, time
from multiprocessing.pool import ThreadPool
from multiprocessing import Pool
import random

def f(i):
    x = [random.random() for j in range(100000)]
    return x[i]

def t(fn):
    t0, c0 = time(), clock()
    for i in range(10): fn(f,range(16))
    print '  time ', round(1000*(time()-t0),1)
    print '  clock', round(1000*(clock()-c0),1)

if __name__ == '__main__':
    print 'map'
    t(map)

    pool = Pool(8)
    print 'mp pool'
    t(pool.map)

    pool = ThreadPool(8)
    print 'thread pool'
    t(pool.map)

Answer 1

如果在多个CPU上执行，CPU时间可能会超过挂起时间。我在Python中没有特别看到这一点，但是当我使用带有来自C的多个线程的clock函数时我肯定已经看到了这一点，并且可能Python代码只是直接调用这个C函数。

关于“为什么”：你正在以错误的方式思考它。重要的是运行程序的核心数量。如果一个核心在两秒钟的时间内运行一秒钟对你来说是有意义的，但是如果四个核心在同一时间间隔内每个运行一秒钟怎么办呢。然后在2秒的待机时间内有4秒的CPU时间。内核考虑了测量所有内核的CPU时间。如果多个核心在同一秒内运行，那么在此期间您将花费多个CPU秒。这是对调度程序很重要的成本测量，并且可能是clock构建的度量标准。这可能不是您关心的指标，但这就是它的工作原理。

为什么time.clock比time.time给出更长的时间？

1 个答案: