如果我使用CSV.dictReader读取CSV,我将如何忽略CSV中的某些列?
例如,
"id","name","address","number","created"
"123456","someName","someAddress","someNumber","2003-5-0294"
我想用读者来获取id和名字,丢弃并忽略其余部分。我尝试使用字段名,但仍然将其读入并将其设置为“无”。我注意到csv.DictWriter有一个'ignore'函数,但似乎DictReader没有。希望有一种更优雅的方式来做到这一点,而不仅仅是阅读,然后只将我想要的列写入另一个CSV,然后使用DictReader读取该CSV进行进一步处理。
谢谢你们!
答案 0 :(得分:5)
这个简单的生成器可以做到。
def dict_filter(it, *keys):
for d in it:
yield dict((k, d[k]) for k in keys)
像这样使用:
dreader = [{'id':1, 'name':'Bob', 'other_stuff':'xy'},
{'id':2, 'name':'Jen', 'other_stuff':'xx'}]
for d in dict_filter(dreader, 'id', 'name'):
print d
给出:
{'id': 1, 'name': 'Bob'}
{'id': 2, 'name': 'Jen'}
答案 1 :(得分:4)
读入每一行,然后只用你想要的键创建一个dicts列表。
[{'id':r['id'], 'name':r['name']} for r in mydictreader]
答案 2 :(得分:4)
其他发布的解决方案从 DictReader 返回的较大的完全填充的dicts中构建了新的较小的dicts。
这样的事情是必要的,因为DictReader API是故意设计的,不会跳过字段。以下是来源摘录:
# unlike the basic reader, we prefer not to return blanks,
# because we will typically wind up with a dict full of None
# values
while row == []:
row = self.reader.next()
d = dict(zip(self.fieldnames, row))
您可以看到每个字段名都被分配给字典而不进行过滤。
FWIW,这并不难让你自己的DictReader变种会出现所需的行为。在现有CSV source之后对其进行建模。
答案 3 :(得分:2)
from operator import itemgetter
cols=('name', 'id') #Tuple of keys you want to keep
valuesfor=itemgetter(*cols)
for d in dictreader_input:
print dict(zip(cols, valuesfor(d))) # dict from zipping cols and values