在处理这种格式的csv文件时遇到问题:
“订单ID”,“订单状态”,“订单日期”,“地址”,“总计”
“ 10000”,“已交付”,“ 07/10/2020 05:44”,“在“超人迷你市场”前向右转”,“ 10.0000”
如果我正在这样做:pd.read_csv(file.csv, sep = ',')
结果是
标记数据时出错。 C错误:第1行中应有4个字段,看到的是10
当我在地址列中的字符串内有双引号时,例如“ SUPERMAN MINIMARKET”,在地址值内=“在“ SUPERMAN MINIMARKET前面,然后向右转”,则右转”。
关于如何读取此csv文件的任何建议?
答案 0 :(得分:0)
祝福自己的灵魂的CSV可以躲避。尝试这样做是否可行-使用文件的路径而不是StringIO(s)
:
from StringIO import StringIO
import csv
s="""
"Order ID","Order Status","Order Date","Address","Total"
"10000","Delivered","07/10/2020 05:44","In front of "SUPERMAN MINIMARKET" then turn right","10.0000"
"""
df = pd.read_csv(StringIO(s),
sep=',',
quoting=csv.QUOTE_ALL,
quotechar='"'
)
Order ID Order Status Order Date \
0 10000 Delivered 07/10/2020 05:44
Address Total
0 In front of SUPERMAN MINIMARKET" then turn right" 10.0