熊猫和CSV中的“双精度双引号”转义

时间:2018-10-12 14:31:51

标签: python pandas

有时CVS数据的格式如下

col1,col2,col3
a,b,"this field has an embedded quote character ("") in it"

旨在解析为

col1 | col2 | col3
a    | b    | this field has an embedded quote character (") in it

也就是说,将字段引号字符加倍即可对其进行转义。

只要csv.Dialect.doublequotecsv.reader,Python True模块就可以很好地处理此问题。

您如何在熊猫中做到这一点?

1 个答案:

答案 0 :(得分:2)

注意:我在完成发布之前就找到了答案

使用pd.read_csv(..., doublequote=True)

import csv
import pandas as pd

data = pd.read_csv('data.csv', quotechar='"', doublequote=True, quoting=csv.QUOTE_NONNUMERIC)

QUOTE_NONNUMERIC换成QUOTE_MINIMAL或其他合适的东西。