熊猫出口选择的比较

时间:2019-04-29 19:35:27

标签: pandas export

随着我开始使用较大的数据集,将它们导出到CSV文件的过程似乎开始缓慢且效率低下。因此,我认为启动一个线程比较DataFrames的不同导出选项是明智的。

2 个答案:

答案 0 :(得分:0)

这取决于您的目标。 但是,如果将 to_csv to_excel 进行比较,您会注意到将文件另存为csv的速度要快得多(快十倍)。 如果需要表格输出,最好使用 to_csv

import pandas as pd
import numpy as np
from datetime import datetime
import time

df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))

start = time.time()
df.to_csv('test.csv')
done = time.time()
elapsed = done - start
print(elapsed)

to_csv的结果:0.003989458084106445

start = time.time()
df.to_excel('test.xlsx')
done = time.time()
elapsed = done - start
print(elapsed)

to_excel的结果:0.049866676330566406

希望对您有所帮助! BR

答案 1 :(得分:0)

在方便方面,pickle对数据进行保存可保留数据的结构和数据类型。我发现这在使用MultiIndexes时特别有用,因为您不必指定标题行和列的数量。