如果数据框中有多个具有相同名称的列,除了第一个列之外,如何删除所有列?
答案 0 :(得分:7)
让df
成为包含两个重复列的数据框:
df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]], columns=("a","a","b"))
# a a b
#0 1 2 3
#1 4 5 6
#2 7 8 9
找出不重复的列名称,并保留它们:
df1 = df.loc[:, ~df.columns.duplicated()]
# a b
#0 1 3
#1 4 6
#2 7 9