我正在尝试通过减少获取pandas
来读取csv
文件所花费的时间来最大化效率。当前,我正在Excel中打开.txt
文件,并使用空格作为定界符将数据转换为列。然后,使用以下命令打开文件:
df = pd.read_csv('file.csv')
df1 = df.to_dict('dict')
df.columns = ([x for x in string.ascii_uppercase if ord(x) < ord("A")+len(df1)])
我试图通过将文件类型更改为.txt
来更改.csv
文件,并以此方式进行读取,但我无法克服此错误:
ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.
在Excel中打开文件,将文本分隔为列并另存为.csv
并不需要很长时间。但是,如果您要执行多次,它就会开始累加。
在Excel中打开文件时,该文件如下所示: