解决方案1：

Question

前言，我想我可能已经想出如何使这段代码工作（基于Changing module variables after import），但我的问题是关于为什么会出现以下行为，所以我可以理解在将来

我有三个文件。第一个是mod1.py：

# mod1.py

import mod2

var1A = None

def func1A():
    global var1
    var1 = 'A'
    mod2.func2()

def func1B():
    global var1
    print var1

if __name__ == '__main__':
    func1A()

接下来我有mod2.py：

# mod2.py

import mod1

def func2():
    mod1.func1B()

最后我有了driver.py：

# driver.py

import mod1

if __name__ == '__main__':
    mod1.func1A()

如果我执行命令python mod1.py，则输出为None。根据我上面提到的链接，似乎从mod1.py导入的__main__和从mod1.py导入的mod2.py之间存在一些区别。因此，我创建了driver.py。如果我执行命令python driver.py，那么我得到预期的输出：A。我有点看到差异，但我并没有真正看到它的机制或原因。这是怎么发生的？似乎违反直觉的是，同一模块将存在两次。如果我执行python mod1.py，是否可以访问__main__版mod1.py中的变量而不是mod2.py导入的版本中的变量？

Answer 1

__name__变量始终包含模块的名称，除了，当文件作为脚本加载到解释器中时。然后该变量设置为字符串'__main__'。

毕竟，脚本然后作为整个程序的主文件运行，其他一切都是由该主文件直接或间接导入的模块。通过测试__name__变量，您可以检测文件是作为模块导入还是直接运行。

在内部，模块被赋予一个命名空间字典，该字典存储为sys.modules中每个模块的元数据的一部分。主文件（已执行的脚本）存储在与'__main__'相同的结构中。

但是当您将文件作为模块导入时，python首先查看sys.modules以查看该模块之前是否已导入。因此，import mod1表示我们首先在sys.modules中查找mod1模块。如果mod1还没有，那么它将创建一个带有命名空间的新模块结构。

因此，如果您同时运行mod1.py作为主文件，和稍后将其作为python模块导入，它将获得两个命名空间条目sys.modules。一个为'__main__'，后一个为'mod1'。这两个名称空间完全独立。您的全局var1存储在sys.modules['__main__']，但func1B正在sys.modules['mod1']查找var1，其中None。

但是当您使用python driver.py时，driver.py成为该计划的'__main__'主文件，而mod1只会导入sys.modules['mod1']结构一次。这一次，func1A将var1存储在sys.modules['mod1']结构中，这就是func1B将找到的内容。

Answer 2

关于使用模块作为主脚本的实用解决方案 - 支持一致的交叉导入：

解决方案1：

参见例如在Python的pdb模块中，如何在执行__main__时导入自身作为脚本运行（最后）：

#! /usr/bin/env python
"""A Python debugger."""
# (See pdb.doc for documentation.)
import sys
import linecache

...

# When invoked as main program, invoke the debugger on a script
if __name__ == '__main__':
    import pdb
    pdb.main()

我建议将__main__启动重新组织到脚本的开头，如下所示：

#! /usr/bin/env python
"""A Python debugger."""
# When invoked as main program, invoke the debugger on a script
import sys
if __name__ == '__main__':        
    ##assert os.path.splitext(os.path.basename(__file__))[0] == 'pdb'
    import pdb
    pdb.main()
    sys.exit(0)

import linecache
...

这样，模块主体不会被执行两次 - 这是非常昂贵的，而且是不合时宜的，有时是关键的。

解决方案2：

在极少数情况下，最好直接将实际脚本模块__main__公开为实际模块别名（mod1）：

# mod1.py    
import mod2

...

if __name__ == '__main__':
    # use main script directly as cross-importable module 
    _mod = sys.modules['mod1'] = sys.modules[__name__]
    ##_modname = os.path.splitext(os.path.basename(os.path.realpath(__file__)))[0]
    ##_mod = sys.modules[_modname] = sys.modules[__name__]
    func1A()

已知缺点：

reload(_mod)失败
pickle＆＃39; ed类需要额外的映射来进行unpickling（find_global ..）

导入模块： main vs import作为模块

2 个答案:

解决方案1：

解决方案2：

导入模块：__ main__ vs import作为模块

2 个答案:

解决方案1：

解决方案2：

导入模块： main vs import作为模块