如何在字段数量太大之前读取csv

时间:2018-06-07 08:25:54

标签: python pandas

我有一个我读过的csv:

df = pd.read_csv("file.csv")

所有行都有37个字段,直到有38个字段,并且从那里它已损坏。我怎样才能读入包含37个字段的行?

3 个答案:

答案 0 :(得分:4)

来自文档:http://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.read_csv.html

  

error_bad_lines:boolean,默认为True

     

具有太多字段的行(例如,逗号太多的csv行)将默认导致引发异常,并且没有DataFrame将   被退回如果为假,则这些“坏线”将从中掉落   返回的DataFrame。

所以你可以使用:

Execution Timeout

但是编辑.csv文件并正确修复相关行可能会更好。 :)

答案 1 :(得分:2)

您可以指定一系列列,只需使用*解压缩:

df = pd.read_csv("file.csv", usecols=[*range(37)])

答案 2 :(得分:0)

预处理csv文件会更容易,只留下您感兴趣的行,并像往常一样继续使用pd.read_csv方法。

但是,如果您想尝试,可以查看read_csv文档here,似乎有一些有用的选项,例如skiprows