使用pandas

时间:2017-11-13 19:06:10

标签: python pandas duplicates

我在pandas中有一个由nba游戏统计数据组成的数据集。

数据看起来像这样:

Date|Team 1|Team 2|Team1 Stats|...|Team2 Stats|...

由于我抓取数据的方式,我现在有两个每个游戏的实例,每个团队的统计数据只是镜像。

(所有条目都相同,只有Team1统计数据在Team2列中,反之亦然)

如何使用pandas查找和删除重复的条目。

1 个答案:

答案 0 :(得分:1)

要删除重复项,您只能保留Team1在Team2之前按字典顺序排列的情况。

newdata

假设一个团队从不玩自己,这将起作用