所以目前,我有如下所示的数据框:
id temp1 temp2
9 10.0 True False
10 10.0 True False
11 10.0 False True
12 10.0 False True
17 15.0 True False
18 15.0 True False
19 15.0 True False
20 15.0 True False
21 15.0 False False
33 27.0 True False
34 27.0 True False
35 27.0 False True
36 27.0 False False
40 31.0 True False
41 31.0 False True
.
.
.
然后我使用以下命令对表格进行排序:
u = coinc.groupby('id')
m = u.temp1.any() & u.temp2.any()
res = df.loc[coinc.id.isin(m[m].index), ['id']]
检查是否有相同ID的任何组,temp1列和temp2列中是否都为true。如果存在,它将放入新的“ res” DataFrame
现在,我有一个看起来像这样的DataFrame:
id temp1_0 temp2_0 temp1_1 temp2_1
9 10.0 False False True False
10 10.0 False False True False
11 10.0 False True False False
12 10.0 False True False False
17 15.0 True False False False
18 15.0 True False False False
19 15.0 False False True False
20 15.0 False False True False
21 15.0 False False False False
33 27.0 False False True False
34 27.0 False False True False
35 27.0 False True False False
36 27.0 False False False False
40 31.0 False False True False
41 31.0 False True False False
除了,实际上,我将有任意数量的临时列,但总是像上面那样以两个为一组。
我想知道上面是否有矢量化的方法来进行相同的操作,但是对于每组两个临时列(即,在上面的示例中,它将创建两个单独的数据帧),然后根据它们的名称将它们输出到csv (..._ 0.csv,..._ 1.csv等)