我使用下面的代码将csv文件读入数据帧。但是,我收到了错误pandas.parser.CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2
,因此我按照建议here将pd.read_csv('D:/TRYOUT.csv')
更改为pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)
。但是,我现在在同一行中得到错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf0 in position 1: invalid continuation byte
。
def ExcelFileReader():
mergedf = pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)
return mergedf
谢谢
答案 0 :(得分:1)
如果您使用的是Windows,则可能需要使用pd.read_csv(filename, encoding='latin-1')
答案 1 :(得分:0)
我有类似的问题,不得不使用
utf-8-sig
作为编码,
我使用utf-8-sig的原因是因为如果你得到非拉丁字符,它将无法正确处理它。有几种方法可以解决这个问题,但我想你可以选择最适合你需求的方法。
希望有所帮助。