我想从数据框中删除特定的“ n”行,其中要删除的行是随机选择的。另外,它必须根据特定列值的条件选择行。
例如,我的数据框如下:
C1 C2 C3
1 0 a
2 1 b
3 0 c
4 0 d
5 0 e
6 1 f
7 1 g
8 1 h
9 0 i
现在,我想随机删除n=2
行,该行的条件是C2==1
。
结果框架如下:
C1 C2 C3
1 0 a
3 0 c
4 0 d
5 0 e
6 1 f
8 1 h
9 0 i
或
C1 C2 C3
1 0 a
2 1 b
3 0 c
4 0 d
5 0 e
7 1 g
9 0 i
或其他可能的可能性。 问题here提示显示要随机删除'n'个句子,但这不包括提供条件。
答案 0 :(得分:1)
通过boolean indexing
用DataFrame.sample
过滤随机行,最后使用drop
:
N = 2
df1 = df.drop(df[df['C2'].eq(1)].sample(N).index)
print (df1)
C1 C2 C3
0 1 0 a
1 2 1 b
2 3 0 c
3 4 0 d
4 5 0 e
6 7 1 g
8 9 0 i
或将np.random.choice
用于随机索引值:
df = df.drop(np.random.choice(df.index[df['C2'].eq(1)], N))