我在咸菜文件中存储了大量的“原始数据”。首先,我必须在熊猫数据框中读取/加载它们。然后,我进行一些分析,更新一些内容,再次进行分析等等。
每次我运行代码时,它都会从pickle文件中读取原始数据。我要避免很多时间。一种肮脏的解决方案是,我加载文件一次,然后注释掉阅读部分。当然,我仍然要小心不要%reset
命名空间。
import pandas as pd
df_1 = pd.read_pickle('MyFile_1.pkl')
df_2 = pd.read_pickle('MyFile_2.pkl')
df_3 = pd.read_pickle('MyFile_3.pkl')
Do some work on the loaded data.....
有一些聪明的方法吗?像
if Myfile_1.pkl is NOT loaded:
df_1 = pd.read_pickle('MyFile_1.pkl')