我有一个名为" 123.csv"的exel文件。这是我在运行PROM功能时得到的输出,包括两列" case"和"事件"。我想通过基于大小写分组事件来修改此输出。更具体地说,我想编写一个python脚本,它将属于同一个案例的事件分组到一个新的单元格中,没有配对我的初始矩阵的长度。有人可以给我一些想法吗? curent and desiret output
import csv
with open('123.csv', 'rb') as csvfile:
spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
for row in spamreader:
print ', '.join(row).replace(',',' ').replace('"',' ')
这是我写的一部分,但它只读取文件并删除一些点击
答案 0 :(得分:0)
简单的csv& amp; defaultdict(python 3)
您的输入就像
case,event
101,A
101,X
101,Y
102,B
102,C
103,Z
代码:
import collections
with open("csv.csv") as f:
cr = csv.reader(f,delimiter=",")
d=collections.defaultdict(lambda : list())
header=next(cr) # read title
for r in cr:
d[r[0]].append(r[1]) # fill dict
with open("csv2.csv","w",newline="") as f:
cr = csv.writer(f,delimiter=",")
cr.writerow(header) # title
for k,v in d.items():
cr.writerow([k,",".join(v)])
输出
case,event
103,Z
101,"A,X,Y"
102,"B,C"
答案 1 :(得分:0)
您可以使用itertools中的groupby为您执行此操作。例如:
from itertools import groupby
current = [(101, 'A'), (101, 'B'), (101, 'Y'), (102, 'C'), (102, 'D'), (102, 'U')]
desired = []
for key, group in groupby(current, lambda x: x[0]):
lst = [element[1] for element in group]
grouped = (key, lst)
desired.append(grouped)
print(desired)
基本上你给groupby你现在拥有的数组和一个lambda函数,它接受数组的第一个元素(数组需要排序)。 Groupby将使用第一个元素对其进行分组。