我在csv文件中有以下行
"\"xyz\"; blabla";"u98r34u98r3"
这应该包含两个字段:
"\"xyz\"; blabla"
和"u98r34u98r3"
我试图在python 3.4.3上使用pandas.read_csv()
导入它,但它只提供三个字段:
xyz"
,blabla"
和u98r34u98r3
我尝试使用选项escapechar=
,quotechar=
和doublequote=
但没有成功。
//编辑:
问题是,我提取了特定的部分,并尝试将其解析为如下字符串:
from io import StringIO
import pandas as pd
data = u'"\"xyz\"; blabla";"u98r34u98r3"'
pd.read_csv(StringIO(data), sep=";", escapechar="\\")
但是在解析完整文件时它起了作用。
答案 0 :(得分:1)
在pandas 0.19.2中使用sep=";"
和escapechar="\\"
为我工作:
In [27]: df = pd.read_csv("quote.csv", header=None, sep=";", escapechar="\\")
In [28]: df
Out[28]:
0 1
0 "xyz"; blabla u98r34u98r3
In [29]: df.values
Out[29]: array([['"xyz"; blabla', 'u98r34u98r3']], dtype=object)