为什么time.clock比time.time给出更长的时间?

时间:2015-01-09 15:19:10

标签: python linux multithreading time multiprocessing

我使用time.clocktime.time在Ubuntu上定时了一段python代码:

clock elapsed time: 8.770 s
time  elapsed time: 1.869 s

我知道time.time使用系统时间和time.clock使用处理器时钟。当time.time给出比time.clock更长的时间时,对我来说很有意义:处理器整个时间都没有活动(例如调用time.sleep的时间)。

但为什么/何时处理器时钟会比系统时间给出更大的经过时间?


附录

我做了一个粗略的测试,使用标准映射计算相同的函数,使用进程池映射和线程池映射。可以理解,进程池速度更快,线程池更慢。更有趣的是:时钟时间 less 比处理器池的时间时间更少,而线程池中的更大

同样,我理解为什么处理器池的时钟时序较少:假设主进程没有做太多事情,只是等待池进程完成。但是为什么线程池的时钟时间更长?任何见解?

结果:

map
  time  1738.8
  clock 1739.6
mp pool
  time   580.1
  clock   15.9
thread pool
  time  3455.3
  clock 5378.9

代码:

from time import clock, sleep, time
from multiprocessing.pool import ThreadPool
from multiprocessing import Pool
import random

def f(i):
    x = [random.random() for j in range(100000)]
    return x[i]

def t(fn):
    t0, c0 = time(), clock()
    for i in range(10): fn(f,range(16))
    print '  time ', round(1000*(time()-t0),1)
    print '  clock', round(1000*(clock()-c0),1)

if __name__ == '__main__':
    print 'map'
    t(map)

    pool = Pool(8)
    print 'mp pool'
    t(pool.map)

    pool = ThreadPool(8)
    print 'thread pool'
    t(pool.map)

1 个答案:

答案 0 :(得分:2)

如果在多个CPU上执行,CPU时间可能会超过挂起时间。我在Python中没有特别看到这一点,但是当我使用带有来自C的多个线程的clock函数时我肯定已经看到了这一点,并且可能Python代码只是直接调用这个C函数。

关于“为什么”:你正在以错误的方式思考它。重要的是运行程序的核心数量。如果一个核心在两秒钟的时间内运行一秒钟对你来说是有意义的,但是如果四个核心在同一时间间隔内每个运行一秒钟怎么办呢。然后在2秒的待机时间内有4秒的CPU时间。内核考虑了测量所有内核的CPU时间。如果多个核心在同一秒内运行,那么在此期间您将花费多个CPU秒。这是对调度程序很重要的成本测量,并且可能是clock构建的度量标准。这可能不是您关心的指标,但这就是它的工作原理。