Python在excel中读取特定的单元格值

时间:2016-09-10 12:31:16

标签: python csv

我有一个名为" 123.csv"的exel文件。这是我在运行PROM功能时得到的输出,包括两列" case"和"事件"。我想通过基于大小写分组事件来修改此输出。更具体地说,我想编写一个python脚本,它将属于同一个案例的事件分组到一个新的单元格中,没有配对我的初始矩阵的长度。有人可以给我一些想法吗? curent and desiret output

import csv

with open('123.csv', 'rb') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
    for row in spamreader:
       print ', '.join(row).replace(',',' ').replace('"',' ') 

这是我写的一部分,但它只读取文件并删除一些点击

2 个答案:

答案 0 :(得分:0)

简单的csv& amp; defaultdict(python 3)

您的输入就像

case,event
101,A
101,X
101,Y
102,B
102,C
103,Z

代码:

import collections

with open("csv.csv") as f:
    cr = csv.reader(f,delimiter=",")

    d=collections.defaultdict(lambda : list())
    header=next(cr)   # read title
    for r in cr:
        d[r[0]].append(r[1])  # fill dict

with open("csv2.csv","w",newline="") as f:
    cr = csv.writer(f,delimiter=",")
    cr.writerow(header)  # title
    for k,v in d.items():
        cr.writerow([k,",".join(v)])

输出

case,event
103,Z
101,"A,X,Y"
102,"B,C"

答案 1 :(得分:0)

您可以使用itertools中的groupby为您执行此操作。例如:

from itertools import groupby

current = [(101, 'A'), (101, 'B'), (101, 'Y'), (102, 'C'), (102, 'D'), (102, 'U')]
desired = []

for key, group in groupby(current, lambda x: x[0]):
    lst = [element[1] for element in group]
    grouped = (key, lst)
    desired.append(grouped)

print(desired)

基本上你给groupby你现在拥有的数组和一个lambda函数,它接受数组的第一个元素(数组需要排序)。 Groupby将使用第一个元素对其进行分组。