Python类变量赋值的不规则性

时间:2016-11-22 19:48:43

标签: python initialization

我试图创建一个具有多个类级变量的类,其中一些变量具有引用先前声明的类级变量的计算值。但是,我在某些点上引用变量时遇到了困难。

我的第一次尝试:

#!/usr/bin/env python
from decimal import Decimal
import math

class Foo(object):
    NUM_BUCKETS = 10
    BUCKET_SIZE = Decimal(1.0 / NUM_BUCKETS)
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))

print Foo.BUCKET_LABELS

结果:

> python test.py
Traceback (most recent call last):
  File "test.py", line 5, in <module>
    class Foo(object):
  File "test.py", line 8, in Foo
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))
  File "test.py", line 8, in <genexpr>
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))
NameError: global name 'BUCKET_SIZE' is not defined

尝试通过类名访问类变量并不起作用:

#!/usr/bin/env python
from decimal import Decimal
import math

class Foo(object):
    NUM_BUCKETS = 10
    BUCKET_SIZE = Decimal(1.0 / NUM_BUCKETS)
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(Foo.BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))

print Foo.BUCKET_LABELS

结果:

> python test2.py
Traceback (most recent call last):
  File "test2.py", line 5, in <module>
    class Foo(object):
  File "test2.py", line 8, in Foo
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(Foo.BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))
  File "test2.py", line 8, in <genexpr>
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(Foo.BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))
NameError: global name 'Foo' is not defined

用硬编码值替换对BUCKET_SIZE的引用可以解决问题;即使在同一行中有另一个类级变量引用,它也可以正常工作:

#!/usr/bin/env python
from decimal import Decimal
import math

class Foo(object):
    NUM_BUCKETS = 10
    BUCKET_SIZE = Decimal(1.0 / NUM_BUCKETS)
    BUCKET_LABELS = tuple("BUCKET_{}".format(int(Decimal(0.1) * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))

print Foo.BUCKET_LABELS

结果:

> python test3.py
('BUCKET_10', 'BUCKET_20', 'BUCKET_30', 'BUCKET_40', 'BUCKET_50', 'BUCKET_60', 'BUCKET_70', 'BUCKET_80', 'BUCKET_90', 'BUCKET_100')

有人知道在那个地方引用BUCKET_SIZE的正确方法吗?这是Python本身的错误吗? (我正在运行Python 2.7.5,BTW。)

1 个答案:

答案 0 :(得分:2)

首先,通过简单地编辑这一行(注意括号)来解决其他问题:

BUCKET_LABELS = tuple(["BUCKET_{}".format(int(BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1)]) 

现在,如果你对为什么感到好奇,那就像在Python中一样,为什么它不是一个bug ...好吧,这不是一个简单的:-):

[i * 2 for x in xrange(3)]是列表理解。它会生成一个实际列表,例如:

可以像这样使用
>>> a = [i*2 for i in xrange(3)]
>>> a
[0, 2, 4]

(i * 2 for x in xrange(3))是生成器表达式。它以相似的方式工作,但不完全一样,因为它不生成列表或元组,而是生成器:

>>> a = (i*2 for i in xrange(3))
>>> a
<generator object <genexpr> at 0x02CEE058>
>>> a.next()
0
>>> a.next()
2
>>> a.next()
4
>>> a.next()
Traceback (most recent call last):
  File "<input>", line 1, in <module>
StopIteration
>>> a = (i*2 for i in xrange(3))
>>> tuple(a)
(0, 2, 4)
>>> tuple(a)
()

如果您感到好奇,可以在此处找到更多信息:generator expressions

tl; dr版本是无法直接访问生成器(您必须要求它生成其内容,例如使用next()),并且每个值只能生成一次(然后生成器继续运行)到下一个,因此next()函数名称。)

所以,回到你的问题。在下面的表达式中,您实际上要求生成一个带有生成器表达式的元组,这本身就很好。尽管如此,您可以通过使用Foo类变量来实现,在生成器的情况下,这些变量可能会出现问题。

BUCKET_LABELS = tuple("BUCKET_{}".format(int(BUCKET_SIZE * i * 100)) for i in xrange(1, NUM_BUCKETS + 1))

特别是,一旦你要求他生成一个元组,生成器实际上根本不知道Foo.BUCKET_SIZE变量(生成器在其范围内工作,与列表相反)。这就是您收到此错误的原因。

所以,一个解决方案就是简单地使用列表理解(无论如何都更容易处理/直观)。

PS:Decimal()函数可能不会按照您的想法执行:

>>> NUM_BUCKETS = 10
>>> print Decimal(1.0 / NUM_BUCKETS)
0.1000000000000000055511151231257827021181583404541015625
>>> print round(1.0 / NUM_BUCKETS, 2)
0.1

PPS:如果你对它感到好奇,你没有得到xrange(1,NUM_BUCKETS + 1)部分的错误的原因是因为它在构建生成器之前被评估因此,该类变量实际上被它的生成器的值替换了......它不会抱怨它。