Question

我有一个数据框，如下所示：

import pandas as pd
d = {'location1': [1, 2,3,8,6], 'location2': 
[2,1,4,6,8]}
df = pd.DataFrame(data=d)

数据帧df表示两个位置之间有一条道路。看起来像：

   location1    location2
0   1               2 
1   2               1
2   3               4 
3   8               6 
4   6               8

第一行表示locationID1和locationID2之间有一条道路，但是第二行也对该信息进行编码。第四和第五行也有重复的信息。我正在尝试通过仅保留一行来删除重复的内容。任何行都可以。

例如，我的预期输出是

   location1    location2
0   1               2 
2   3               4 
4   6               8

执行此操作的任何有效方法，因为我有一个大型数据框，其中包含许多重复的行。

非常感谢

Answer 1

您似乎希望数据框中的所有其他行。这应该起作用。

import pandas as pd
d = {'location1': [1, 2,3,8,6], 'location2': 
[2,1,4,6,8]}
df = pd.DataFrame(data=d)

print(df)

   location1  location2
0          1          2
1          2          1
2          3          4
3          8          6
4          6          8

def Every_other_row(a):
    return a[::2]

Every_other_row(df)

   location1  location2
0          1          2
2          3          4
4          6          8

如何在Python中删除跨越两个数据帧索引的重复行

1 个答案: