有时CVS数据的格式如下
col1,col2,col3
a,b,"this field has an embedded quote character ("") in it"
旨在解析为
col1 | col2 | col3
a | b | this field has an embedded quote character (") in it
也就是说,将字段引号字符加倍即可对其进行转义。
只要csv.Dialect.doublequote
为csv.reader
,Python True
模块就可以很好地处理此问题。
您如何在熊猫中做到这一点?
答案 0 :(得分:2)
注意:我在完成发布之前就找到了答案
使用pd.read_csv(..., doublequote=True)
import csv
import pandas as pd
data = pd.read_csv('data.csv', quotechar='"', doublequote=True, quoting=csv.QUOTE_NONNUMERIC)
将QUOTE_NONNUMERIC
换成QUOTE_MINIMAL
或其他合适的东西。