我有一个数据框,如下所示:
import pandas as pd
d = {'location1': [1, 2,3,8,6], 'location2':
[2,1,4,6,8]}
df = pd.DataFrame(data=d)
数据帧df
表示两个位置之间有一条道路。看起来像:
location1 location2
0 1 2
1 2 1
2 3 4
3 8 6
4 6 8
第一行表示locationID1
和locationID2
之间有一条道路,但是第二行也对该信息进行编码。第四和第五行也有重复的信息。我正在尝试通过仅保留一行来删除重复的内容。任何行都可以。
例如,我的预期输出是
location1 location2
0 1 2
2 3 4
4 6 8
执行此操作的任何有效方法,因为我有一个大型数据框,其中包含许多重复的行。
非常感谢
答案 0 :(得分:1)
您似乎希望数据框中的所有其他行。这应该起作用。
import pandas as pd
d = {'location1': [1, 2,3,8,6], 'location2':
[2,1,4,6,8]}
df = pd.DataFrame(data=d)
print(df)
location1 location2
0 1 2
1 2 1
2 3 4
3 8 6
4 6 8
def Every_other_row(a):
return a[::2]
Every_other_row(df)
location1 location2
0 1 2
2 3 4
4 6 8