Question

我的.csv文件如下：

col1, col2, col3, col4, col5, col6
"a, """"b, ""string1"""""", ""string2, string3"", """", c,"
"d, """"e, ""string4"""""", ""string5, string6"", """", f,"

我想用熊猫读取此文件。如何在一个read_csv命令中应对这三个挑战？

撤消单引号“”换行中的行？
要从四个引号中删除包含逗号的单元格“”“”“”“”吗？
在包含逗号的相应单元格中保留逗号作为字符串吗？

Answer 1

您可以使用str.replace并在双引号后面加上一个空的str。

>>> x = '"d, """"e, ""string4"""""", ""string5, string6""'
>>> x
'"d, """"e, ""string4"""""", ""string5, string6""'
>>> x.replace('"', '')
'd, e, string4, string5, string6'

要修复csv文件...

name = 'xxx.csv'

with open(name) as f:
    csv = f.read()
with open(name, 'w') as f:
    f.write(csv.replace('"', ''))

多级引号包装csv文件熊猫

1 个答案: