Question

我处理来自不同来源的数据，并且经常将这些数据下载为电子表格。我想为每个数据源定义处理模块-它们将加载数据，重命名列等。“准备”模块将加载共享的包和变量，然后加载处理模块。但是，处理模块无权访问“准备”模块中的软件包和变量。

玩具示例

prep.py

# Load shared packages and variables.    
import pandas as pd
keyFolder = '/Keys/'
    
# Import processing modules
from process import processData

process.py

processData(filename):
    data = pd.read_excel(filename)  # References pd
    key = pd.read_excel(keyFolder+'dataKey.xlsx', index_col = 'oldName').newName # References keyFolder
    data = data.rename(columns=key)

结果：

NameError ：未定义名称“ pd”

如果我过去keyFolder，变量pd也会发生类似的问题。

一种解决方案是按照要求将熊猫直接加载到每个“过程”模块中 this post。但是我要有几个处理模块-它们实际上相当长且涉及很多，最好分开放置。多次重新加载大熊猫似乎效率低下。

有更好的方法吗？

模块可以看到已经导入的软件包吗？

玩具示例

0 个答案: