我处理来自不同来源的数据,并且经常将这些数据下载为电子表格。我想为每个数据源定义处理模块-它们将加载数据,重命名列等。“准备”模块将加载共享的包和变量,然后加载处理模块。但是,处理模块无权访问“准备”模块中的软件包和变量。
prep.py
# Load shared packages and variables.
import pandas as pd
keyFolder = '/Keys/'
# Import processing modules
from process import processData
process.py
processData(filename):
data = pd.read_excel(filename) # References pd
key = pd.read_excel(keyFolder+'dataKey.xlsx', index_col = 'oldName').newName # References keyFolder
data = data.rename(columns=key)
结果:
NameError :未定义名称“ pd”
如果我过去keyFolder
,变量pd
也会发生类似的问题。
一种解决方案是按照要求将熊猫直接加载到每个“过程”模块中 this post。但是我要有几个处理模块-它们实际上相当长且涉及很多,最好分开放置。多次重新加载大熊猫似乎效率低下。
有更好的方法吗?