我有一个我读过的csv:
df = pd.read_csv("file.csv")
所有行都有37个字段,直到有38个字段,并且从那里它已损坏。我怎样才能读入包含37个字段的行?
答案 0 :(得分:4)
来自文档:http://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.read_csv.html
error_bad_lines:boolean,默认为True
具有太多字段的行(例如,逗号太多的csv行)将默认导致引发异常,并且没有DataFrame将 被退回如果为假,则这些“坏线”将从中掉落 返回的DataFrame。
所以你可以使用:
Execution Timeout
但是编辑.csv文件并正确修复相关行可能会更好。 :)
答案 1 :(得分:2)
您可以指定一系列列,只需使用*
解压缩:
df = pd.read_csv("file.csv", usecols=[*range(37)])
答案 2 :(得分:0)
预处理csv文件会更容易,只留下您感兴趣的行,并像往常一样继续使用pd.read_csv
方法。
但是,如果您想尝试,可以查看read_csv文档here,似乎有一些有用的选项,例如skiprows