处理字段值pandas中的双引号

时间:2018-01-16 10:45:07

标签: python pandas

我在csv文件中有如下所示的行

"1"|"A "Great" Experience"|"T"

当我使用以下代码

阅读本文时
pandas.read_csv(file2Name,sep = '|',keep_default_na=False,quoting=csv.QUOTE_ALL)

它将输出显示为:[1,A Great" Experience",T]

我需要输出为:[1,A "Great" Experience,T]

尝试使用各种参数的许多方法。 谁能帮我。提前致谢

2 个答案:

答案 0 :(得分:1)

pd.read_csv函数有参数quotechar

  

quotechar:str(长度为1),可选

     

用于表示引用项目的开头和结尾的字符。引   项目可以包括分隔符,它将被忽略。

您可以使用smth else更改默认值",例如~,然后从字段边缘删除"

import pandas as pd

df = pd.read_csv(file2Name, sep="|", quotechar="~")
df.applymap(lambda x: x.strip("\""))

答案 1 :(得分:0)

"被视为引用字符。因此,请尝试使用/转义它。

进行以下更改:

"1"|"A "Great" Experience"|"T"更改为"1"|"A /"Great/" Experience"|"T"

执行read_csv操作:

df = pandas.read_csv(file2Name, sep='|', quotechar='"',escapechar="/")