这是我第一次发布Stackoverflow。最近开始学习熊猫,并且几乎学习了这个令人难以置信的库中的尼特。
在下面的数据框中,我是否可以仅基于我的“'值”中的重复值来获取数据帧。柱。我尝试过groupby和.duplicated。但无法获得所需的O / P
输入df:
Name ID Date Value
a NSW 19/05/2018 290
b NSW 19/05/2018 340
c VIC 19/05/2018 340
d NSW 19/05/2018 70
e VIC 19/05/2018 130
f NSW 19/05/2018 175
g VIC 19/05/2018 260
h NSW 19/05/2018 350
i VIC 19/05/2018 350
需要O / P
Name ID Date Value
b NSW 19/05/2018 340
c VIC 19/05/2018 340
h NSW 19/05/2018 350
i VIC 19/05/2018 350
Data['Duplicate']=Data.duplicated(subset='Azimuth', keep=False)
答案 0 :(得分:0)
你快到了, 试试这个,
out=df[df.duplicated(subset=['Value'],keep=False)]
print out
输出:
Name ID Date Value
1 b NSW 19/05/2018 340
2 c VIC 19/05/2018 340
7 h NSW 19/05/2018 350
8 i VIC 19/05/2018 350