Question

我写了一个简单的Eratosthenes筛子，它使用一个列表并将它们变成零，如果不是素数，就像这样：

sed 's/\([0-9][0-9]*\)\.\([0-9][0-9]*\)/\1,\2/'

我用def eSieve(n): #Where m is fixed-length list of all integers up to n '''Creates a list of primes less than or equal to n''' m = [1]*(n+1) for i in xrange(2,int((n)**0.5)+1): if m[i]: for j in xrange(i*i,n+1,i): m[j]=0 return [i for i in xrange(2,n) if m[i]]测试了它运行的速度并得到了：

%timeit

我认为，如果我将#n: t #10**1: 7 μs #10**2: 26.6 μs #10**3: 234 μs #10**4: 2.46 ms #10**5: 26.4 ms #10**6: 292 ms #10**7: 3.27 s和[1]更改为布尔值，它会更快地运行......但它却恰恰相反：

为什么布尔变慢？

Answer 1

这是因为True和False在Python 2中被查找为全局变量。0和1文字只是常量，由快速数组引用查找，而globals是全局命名空间中的字典查找（落入内置命名空间）：

>>> import dis
>>> def foo():
...     a = True
...     b = 1
... 
>>> dis.dis(foo)
  2           0 LOAD_GLOBAL              0 (True)
              3 STORE_FAST               0 (a)

  3           6 LOAD_CONST               1 (1)
              9 STORE_FAST               1 (b)
             12 LOAD_CONST               0 (None)
             15 RETURN_VALUE

使用True字节码查找LOAD_GLOBAL值，而使用1将LOAD_CONST文字值复制到堆栈。

如果你制作True和False 当地人，你可以再次提高它们的速度：

def eSieve(n, True=True, False=False):
    m = [True]*(n+1)
    for i in xrange(2,int((n)**0.5)+1):
        if m[i]:
            for j in xrange(i*i,n+1,i):
                m[j]=False
    return [i for i in xrange(2,n) if m[i]]

将True和False作为参数的默认值赋予函数，将这些名称作为locals，具有完全相同的值;再次使用简化版本：

>>> def bar(True=True, False=False):
...     True == False
... 
>>> dis.dis(bar)
  2           0 LOAD_FAST                0 (True)
              3 LOAD_FAST                1 (False)
              6 COMPARE_OP               2 (==)
              9 POP_TOP             
             10 LOAD_CONST               0 (None)
             13 RETURN_VALUE

注意LOAD_FAST操作码，现在索引就像LOAD_CONST字节码一样; CPython函数中的locals存储在数组中，就像字节码常量一样。

随着这种变化，使用布尔胜利，尽管只是一小部分;我的时间：

# n      integers  globals  locals
# 10**1  4.31 µs   4.2 µs   4.2 µs
# 10**2  17.1 µs   17.3 µs  16.5 µs
# 10**3  147 µs    158 µs   144 µs
# 10**4  1.5 ms    1.66 ms  1.48 ms
# 10**5  16.4 ms   18.2 ms  15.9 ms
# 10**6  190 ms    215 ms   189 ms   
# 10**7  2.21 s    2.47 s   2.18 s

差别并非如此之大，因为Python布尔只是一个int子类。

请注意，在Python 3中，True和False已成为关键字，无法再分配给它们，因此可以将它们视为整数文字。

为什么我的Eratosthenes筛子使用整数比使用布尔值更快？

1 个答案: