读取带有双引号的熊猫CSV字符串

时间:2020-10-21 04:05:14

标签: pandas csv

在处理这种格式的csv文件时遇到问题:

“订单ID”,“订单状态”,“订单日期”,“地址”,“总计”

“ 10000”,“已交付”,“ 07/10/2020 05:44”,“在“超人迷你市场”前向右转”,“ 10.0000”

如果我正在这样做:pd.read_csv(file.csv, sep = ',') 结果是

标记数据时出错。 C错误:第1行中应有4个字段,看到的是10

当我在地址列中的字符串内有双引号时,例如“ SUPERMAN MINIMARKET”,在地址值内=“在“ SUPERMAN MINIMARKET前面,然后向右转”,则右转”。

关于如何读取此csv文件的任何建议?

1 个答案:

答案 0 :(得分:0)

祝福自己的灵魂的CSV可以躲避。尝试这样做是否可行-使用文件的路径而不是StringIO(s)

from StringIO import StringIO
import csv

s="""
"Order ID","Order Status","Order Date","Address","Total"
"10000","Delivered","07/10/2020 05:44","In front of "SUPERMAN MINIMARKET" then turn right","10.0000"
"""
df = pd.read_csv(StringIO(s),
                 sep=',',
                 quoting=csv.QUOTE_ALL,
                 quotechar='"'
                )

       Order ID Order Status        Order Date  \
0     10000    Delivered  07/10/2020 05:44   

                                             Address  Total  
0  In front of SUPERMAN MINIMARKET" then turn right"   10.0