我正在读取一个基本的csv文件,其中各列之间用逗号隔开。但是,主体列是一个字符串,可能包含逗号和引号。
例如,有一些像"Bahamas\", The"
和"Germany, West"
我尝试过
text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', sep = ',')
,
text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', delimiter = ',')
。但是他们俩都行不通。
有没有办法解决这个问题?
答案 0 :(得分:1)
您可以重新生成csv吗?如果是,请将定界字符更改为管道,即|。 。如果不是这样,您可能会被迫走很长的路...因为如果代码中同时包含逗号和引号,则任何代码都无法找出哪些字符是定界/引号以及哪些字符是值的一部分
一种解决方法可能涉及利用发生此问题的列位置...即,首先可以隔离问题列左侧的列,隔离所有列右侧的列,然后保留所有字符作为问题列。您可以张贴一些示例行吗?希望看到几行出现此问题,并且几行可以正常工作