我有像这样的pandas.DataFrame:
time num
1 a ,A 3
2 a ,B 3
3 a ,C 1
4 b ,A 4
5 b ,A 4
6 a ,B 3
7 d ,B 2
我想删除数据集中时间唯一的行。结果将是:
time num
2 a ,B 3
4 b ,A 4
5 b ,A 4
6 a ,B 3
有没有办法没有循环???
答案 0 :(得分:2)
从这里开始:How to drop unique rows in a pandas dataframe?
例如:
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
df = df[df.duplicated(subset=['A','B'], keep=False)]
print (df)
A B C
1 foo 1 A
2 foo 1 B
作为子集,您可以指定时间。