我正在研究一些包含许多datasets
变量的DateTime
。数据清理后,我总是保存一个.csv
文件。但是,下次将文件加载到熊猫时,我不得不再次转换dtypes
,这将花费很长时间。因此,我想知道是否可以使用Pandas保存一种文件以避免这种情况。
答案 0 :(得分:2)
您可以使用pickle
序列化对象。值得庆幸的是,pandas
具有本机功能来序列化和导出您的DataFrame。只需使用
df.to_pickle('your_file.pkl')
从文档中:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_pickle.html
然后,您可以使用再次加载您的DataFrame
df = pandas.read_pickle('your_file.pkl')