前言,我想我可能已经想出如何使这段代码工作(基于Changing module variables after import),但我的问题是关于为什么会出现以下行为,所以我可以理解在将来
我有三个文件。第一个是mod1.py:
# mod1.py
import mod2
var1A = None
def func1A():
global var1
var1 = 'A'
mod2.func2()
def func1B():
global var1
print var1
if __name__ == '__main__':
func1A()
接下来我有mod2.py:
# mod2.py
import mod1
def func2():
mod1.func1B()
最后我有了driver.py:
# driver.py
import mod1
if __name__ == '__main__':
mod1.func1A()
如果我执行命令python mod1.py
,则输出为None
。根据我上面提到的链接,似乎从mod1.py
导入的__main__
和从mod1.py
导入的mod2.py
之间存在一些区别。因此,我创建了driver.py
。如果我执行命令python driver.py
,那么我得到预期的输出:A
。我有点看到差异,但我并没有真正看到它的机制或原因。这是怎么发生的?似乎违反直觉的是,同一模块将存在两次。如果我执行python mod1.py
,是否可以访问__main__
版mod1.py
中的变量而不是mod2.py
导入的版本中的变量?
答案 0 :(得分:21)
__name__
变量始终包含模块的名称,除了,当文件作为脚本加载到解释器中时。 然后该变量设置为字符串'__main__'
。
毕竟,脚本然后作为整个程序的主文件运行,其他一切都是由该主文件直接或间接导入的模块。通过测试__name__
变量,您可以检测文件是作为模块导入还是直接运行。
在内部,模块被赋予一个命名空间字典,该字典存储为sys.modules
中每个模块的元数据的一部分。主文件(已执行的脚本)存储在与'__main__'
相同的结构中。
但是当您将文件作为模块导入时,python首先查看sys.modules
以查看该模块之前是否已导入。因此,import mod1
表示我们首先在sys.modules
中查找mod1
模块。如果mod1
还没有,那么它将创建一个带有命名空间的新模块结构。
因此,如果您同时运行mod1.py
作为主文件,和稍后将其作为python模块导入,它将获得两个命名空间条目sys.modules
。一个为'__main__'
,后一个为'mod1'
。这两个名称空间完全独立。您的全局var1
存储在sys.modules['__main__']
,但func1B
正在sys.modules['mod1']
查找var1
,其中None
。
但是当您使用python driver.py
时,driver.py
成为该计划的'__main__'
主文件,而mod1
只会导入sys.modules['mod1']
结构一次。这一次,func1A
将var1
存储在sys.modules['mod1']
结构中,这就是func1B
将找到的内容。
答案 1 :(得分:1)
关于使用模块作为主脚本的实用解决方案 - 支持一致的交叉导入:
参见例如在Python的pdb模块中,如何在执行__main__
时导入自身作为脚本运行(最后):
#! /usr/bin/env python
"""A Python debugger."""
# (See pdb.doc for documentation.)
import sys
import linecache
...
# When invoked as main program, invoke the debugger on a script
if __name__ == '__main__':
import pdb
pdb.main()
我建议将__main__
启动重新组织到脚本的开头,如下所示:
#! /usr/bin/env python
"""A Python debugger."""
# When invoked as main program, invoke the debugger on a script
import sys
if __name__ == '__main__':
##assert os.path.splitext(os.path.basename(__file__))[0] == 'pdb'
import pdb
pdb.main()
sys.exit(0)
import linecache
...
这样,模块主体不会被执行两次 - 这是非常昂贵的,而且是不合时宜的,有时是关键的。
在极少数情况下,最好直接将实际脚本模块__main__
公开为实际模块别名(mod1
):
# mod1.py
import mod2
...
if __name__ == '__main__':
# use main script directly as cross-importable module
_mod = sys.modules['mod1'] = sys.modules[__name__]
##_modname = os.path.splitext(os.path.basename(os.path.realpath(__file__)))[0]
##_mod = sys.modules[_modname] = sys.modules[__name__]
func1A()
已知缺点:
reload(_mod)
失败find_global
..)