熊猫在列中阅读带有额外逗号和引号的csv

时间:2019-02-04 02:26:53

标签: python pandas

我正在读取一个基本的csv文件,其中各列之间用逗号隔开。但是,主体列是一个字符串,可能包含逗号和引号。 例如,有一些像"Bahamas\", The""Germany, West"

这样的单元格

我尝试过 text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', sep = ',')text = pd.read_table("input.txt", encoding = 'utf-16', quotechar='"', delimiter = ',')。但是他们俩都行不通。

有没有办法解决这个问题?

1 个答案:

答案 0 :(得分:1)

您可以重新生成csv吗?如果是,请将定界字符更改为管道,即|。 。如果不是这样,您可能会被迫走很长的路...因为如果代码中同时包含逗号和引号,则任何代码都无法找出哪些字符是定界/引号以及哪些字符是值的一部分

一种解决方法可能涉及利用发生此问题的列位置...即,首先可以隔离问题列左侧的列,隔离所有列右侧的列,然后保留所有字符作为问题列。您可以张贴一些示例行吗?希望看到几行出现此问题,并且几行可以正常工作