有时,某些值/字符串在函数中是硬编码的。例如,在以下函数中,我定义了一个"常量"比较字符串和检查它。
def foo(s):
c_string = "hello"
if s == c_string:
return True
return False
如果没有太多讨论为什么这么做不好,以及如何在外部范围内定义它,我想知道当是这样定义。
每次调用都会创建字符串吗?
如果不是字符串"hello"
而是列表:[1,2,3]
(或者如果重要的话,列表中包含可变内容的列表)会发生同样的情况吗?
答案 0 :(得分:11)
因为字符串是不可变的(和元组一样),所以它与函数的字节码对象一起存储。它由一个非常简单和快速的索引查找加载。这实际上比全局查找更快。
您可以使用dis.dis()
function:
>>> import dis
>>> def foo(s):
... c_string = "hello"
... if s == c_string:
... return True
... return False
...
>>> dis.dis(foo)
2 0 LOAD_CONST 1 ('hello')
3 STORE_FAST 1 (c_string)
3 6 LOAD_FAST 0 (s)
9 LOAD_FAST 1 (c_string)
12 COMPARE_OP 2 (==)
15 POP_JUMP_IF_FALSE 22
4 18 LOAD_GLOBAL 0 (True)
21 RETURN_VALUE
5 >> 22 LOAD_GLOBAL 1 (False)
25 RETURN_VALUE
>>> foo.__code__.co_consts
(None, 'hello')
LOAD_CONST
操作码从co_costs
数组加载字符串对象,该数组是函数代码对象的一部分;引用被推到堆栈的顶部。 STORE_FAST
操作码从堆栈顶部获取引用并将其存储在locals数组中,这也是一种非常简单快速的操作。
对于可变文字({..}
,[..]
)特殊操作码构建对象,内容仍然尽可能地被视为常量(更复杂的结构只遵循相同的构建块):
>>> def bar(): return ['spam', 'eggs']
...
>>> dis.dis(bar)
1 0 LOAD_CONST 1 ('spam')
3 LOAD_CONST 2 ('eggs')
6 BUILD_LIST 2
9 RETURN_VALUE
BUILD_LIST
调用使用两个常量字符串对象创建新的列表对象。
有趣的事实:如果您使用列表对象进行成员资格测试(something in ['option1', 'option2', 'option3']
Python知道列表对象将永远不会发生变异,并会在编译时将其转换为元组(所谓的窥孔优化) )。同样适用于集合文字,它被转换为frozenset()
对象,但仅限于Python 3.2及更新版本。请参阅Tuple or list when using 'in' in an 'if' clause?
请注意,您的示例函数使用的是非常冗长的布尔值;你可以使用:
def foo(s):
c_string = "hello"
return s == c_string
得到完全相同的结果,避免Python 2中的LOAD_GLOBAL
调用(Python 3制作了True
和False
关键字,因此这些值也可以存储为常量。)