删除在特定列上重复值的行

时间:2018-01-06 14:32:30

标签: python pandas duplicates

我有一个用户评论的数据框如下:

Index   User   Location  Rating Langauge
    1    bob     62.354    4       eng
    2    bil     59.511    5       span
    3    bob     63.884    3       ger
    4    juan    58.221    4       jap
    5    bil     59.511    5       eng
    6    bil     57.422    5       fra

我试图消除重复的行或评论,因为它们在“用户”和“位置”列中相同。

我想要的输出是这样的:

Index   User   Location  Rating Language
    1    bob     62.354    4       eng
    2    bil     59.511    5       span
    3    bob     63.884    3       ger 
    4    juan    58.221    4       jap 
    6    bil     57.422    5       fra

第5行被删除,因为它是第二行的副本,因为两者的'User'和'Location'列是相同的。请记住,用户名对用户来说是唯一的,而且该位置对于某个地方来说是唯一的。其他变量只是分类。

谢谢。这让我很疯狂。

0 个答案:

没有答案