我有一个格式如下的csv文件:
type,type_mapping, style,style_mapping,Count
Residential,Residential,Antique,Antique,109
Antique,Residential,Antique,Antique,48
Apt/Garage,Commercial,Apt/Garage,Apartment,1
我正在使用Python(版本3)中的csv模块解析它。这是我的代码:
import os
import csv
typeXref = dict()
with open('xref.csv') as csvData:
csvRead = csv.reader(csvData)
headers = next(csvRead)
for index, row in enumerate(csvRead):
typeXref[index] = {key: value for key, value in zip(headers, row)}
print(typeXref)
出于某种原因,我的第一列不断返回标题中第一列的字节顺序标记\ufeff
。
408: {'\ufefftype': 'Residential', 'type_mapping': 'Residential',
' style': 'Antique', 'style_mapping': 'Antique', 'Count': '109'}}
我认为这是由于我打开文件,使用csv
模块读取内容或生成文件的方式。
我可以弄清楚如何解码那个字段,但宁愿确保我正确生成文件,或者使用csv
模块属性。
答案 0 :(得分:2)
您必须告诉您正在阅读带有BOM的utf-8文件:
with open('xref.csv', encoding='utf-8-sig') as csvData:
....
然后将剥离BOM