我使用time.clock
和time.time
在Ubuntu上定时了一段python代码:
clock elapsed time: 8.770 s
time elapsed time: 1.869 s
我知道time.time使用系统时间和time.clock使用处理器时钟。当time.time给出比time.clock更长的时间时,对我来说很有意义:处理器整个时间都没有活动(例如调用time.sleep
的时间)。
但为什么/何时处理器时钟会比系统时间给出更大的经过时间?
附录
我做了一个粗略的测试,使用标准映射计算相同的函数,使用进程池映射和线程池映射。可以理解,进程池速度更快,线程池更慢。更有趣的是:时钟时间 less 比处理器池的时间时间更少,而线程池中的更大。
同样,我理解为什么处理器池的时钟时序较少:假设主进程没有做太多事情,只是等待池进程完成。但是为什么线程池的时钟时间更长?任何见解?
结果:
map
time 1738.8
clock 1739.6
mp pool
time 580.1
clock 15.9
thread pool
time 3455.3
clock 5378.9
代码:
from time import clock, sleep, time
from multiprocessing.pool import ThreadPool
from multiprocessing import Pool
import random
def f(i):
x = [random.random() for j in range(100000)]
return x[i]
def t(fn):
t0, c0 = time(), clock()
for i in range(10): fn(f,range(16))
print ' time ', round(1000*(time()-t0),1)
print ' clock', round(1000*(clock()-c0),1)
if __name__ == '__main__':
print 'map'
t(map)
pool = Pool(8)
print 'mp pool'
t(pool.map)
pool = ThreadPool(8)
print 'thread pool'
t(pool.map)
答案 0 :(得分:2)
如果在多个CPU上执行,CPU时间可能会超过挂起时间。我在Python中没有特别看到这一点,但是当我使用带有来自C的多个线程的clock
函数时我肯定已经看到了这一点,并且可能Python代码只是直接调用这个C函数。
关于“为什么”:你正在以错误的方式思考它。重要的是运行程序的核心数量。如果一个核心在两秒钟的时间内运行一秒钟对你来说是有意义的,但是如果四个核心在同一时间间隔内每个运行一秒钟怎么办呢。然后在2秒的待机时间内有4秒的CPU时间。内核考虑了测量所有内核的CPU时间。如果多个核心在同一秒内运行,那么在此期间您将花费多个CPU秒。这是对调度程序很重要的成本测量,并且可能是clock
构建的度量标准。这可能不是您关心的指标,但这就是它的工作原理。