我的数据框:
df=pd.DataFrame(
{
'BusId':['ABC1','ABC2','ABC2','ABC4'],
'Route':[101,102,102,104]
})
df
我只需要在输出中列出列路由的唯一值
预期输出:
BusId Route
0 ABC1 101
1 ABC2 102
3 ABC4 104
答案 0 :(得分:1)
使用:
#if test all columns for dupes
#df = df.drop_duplicates()
#if multiple columns and need specify columns for test
df = df.drop_duplicates(['BusId','Route'])
print (df)
BusId Route
0 ABC1 101
1 ABC2 102
3 ABC4 104