这是我想要使用groupby的数据框
Value Boolean1 Boolean2
5.175603 False False
5.415855 False False
5.046997 False False
4.607749 True False
5.140482 False False
1.796552 False False
0.139924 False True
4.157981 False True
4.893860 False False
5.091573 False False
6 True False
6.05 False False
我想将groupby
与Boolean1 and Boolean2
列一起使用。 groupby
从False
继续,除非它找到True
并且它同时检查两列,然后再次检错False为True。如果有nomore,那么它可以忽略其余的False(与之对应的值)或者它可以在那里
我想达到类似的效果。
Value Boolean1 Boolean2
这是一个小组
5.175603 False False
5.415855 False False
5.046997 False False
4.607749 True False
这是另一个
5.140482 False False
1.796552 False False
0.139924 False True
4.157981 False True
这是另一个
4.893860 False False
5.091573 False False
6 True False
答案 0 :(得分:3)
我的想法是在至少一个False
列之前检查两列中的True
:
#chain condition together by OR and invert
m = ~(df['Boolean1'] | df['Boolean2'])
#get consecutive groups with AND for filter only Trues
#(because inverting, it return False in both cols)
s = (m.ne(m.shift()) & m).cumsum()
for i, x in df.groupby(s):
print (x)
dtype: int32
Value Boolean1 Boolean2
0 5.175603 False False
1 5.415855 False False
2 5.046997 False False
3 4.607749 True False
Value Boolean1 Boolean2
4 5.140482 False False
5 1.796552 False False
6 0.139924 False True
7 4.157981 False True
Value Boolean1 Boolean2
8 4.893860 False False
9 5.091573 False False
10 6.000000 True False
Value Boolean1 Boolean2
11 6.05 False False
<强>详细强>:
print (m)
0 True
1 True
2 True
3 False
4 True
5 True
6 False
7 False
8 True
9 True
10 False
11 True
dtype: bool
print (s)
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 3
9 3
10 3
11 4
dtype: int32