应用错误收集

我使用的是60,000的数据集。这需要6.4秒来读取xlsx文件，然后将其转换为CSV。如何减少时间？我的代码：

import pandas as pd
import time


def read_xlsx(path):
    df = pd.read_excel(path)
    return df


def convert_to_csv(df):
    df.to_csv('orders_csv_file.csv')




if __name__ == '__main__':
    start = time.clock()
    df = read_xlsx("/home/arima/sublime_workspace/orders.xlsx")
    print(time.clock() - start)

    start = time.clock()
    convert_to_csv(df)
    print(time.clock() - start)

读取excel所需的时间很长（6秒），将其转换为csv（.30）秒。

如何减少读取xlsx并将其转换为大型数据集中pandas中的csv所需的时间？

0 个答案: