如何导入复杂字段的csv

时间:2017-03-29 14:49:12

标签: python python-3.x csv pandas

我在csv文件中有以下行

"\"xyz\"; blabla";"u98r34u98r3"

这应该包含两个字段:

"\"xyz\"; blabla""u98r34u98r3"

我试图在python 3.4.3上使用pandas.read_csv()导入它,但它只提供三个字段:

xyz"blabla"u98r34u98r3

我尝试使用选项escapechar=quotechar=doublequote=但没有成功。

//编辑:

问题是,我提取了特定的部分,并尝试将其解析为如下字符串:

from io import StringIO  
import pandas as pd  
data = u'"\"xyz\"; blabla";"u98r34u98r3"'  
pd.read_csv(StringIO(data), sep=";", escapechar="\\")  

但是在解析完整文件时它起了作用。

1 个答案:

答案 0 :(得分:1)

在pandas 0.19.2中使用sep=";"escapechar="\\"为我工作:

In [27]: df = pd.read_csv("quote.csv", header=None, sep=";",  escapechar="\\")

In [28]: df
Out[28]: 
               0            1
0  "xyz"; blabla  u98r34u98r3

In [29]: df.values
Out[29]: array([['"xyz"; blabla', 'u98r34u98r3']], dtype=object)