使用pandas read_csv捕获csv文件中的坏行

时间:2017-09-02 01:58:00

标签: pandas python-3.6

我正在使用pandas read_csv来读取140k行的csv文件。该文件的格式如下:

"HEAD1", "HEAD2", "HEAD3"
"line1-1", "line1-2", "line1-3"
"line2-1", "line2-2", "line2-3"

有一些无效行如下:

"line"3-1", "line3-2",, "li"ne3-4"

如何捕获并打印出无效的行?是否可以使用read_csv函数执行此操作,或者我需要使用csv.reader并使用正则表达式检查每一行?如果是这样,有人可以帮我建立正则表达式吗?我想出了以下内容,但它不起作用

^".+\",?"?

谢谢。

0 个答案:

没有答案