如何减少读取xlsx并将其转换为大型数据集中pandas中的csv所需的时间?

时间:2018-04-09 11:02:53

标签: python pandas

我使用的是60,000的数据集。这需要6.4秒来读取xlsx文件,然后将其转换为CSV。 如何减少时间? 我的代码:

import pandas as pd
import time


def read_xlsx(path):
    df = pd.read_excel(path)
    return df


def convert_to_csv(df):
    df.to_csv('orders_csv_file.csv')




if __name__ == '__main__':
    start = time.clock()
    df = read_xlsx("/home/arima/sublime_workspace/orders.xlsx")
    print(time.clock() - start)

    start = time.clock()
    convert_to_csv(df)
    print(time.clock() - start)

读取excel所需的时间很长(6秒),将其转换为csv(.30)秒。

0 个答案:

没有答案