我有两个要合并而又不重复的数据框:
首先,我仅从第二个数据帧中获得唯一的列(如this回答):
cols_to_use = df2.columns.difference(df1)
我需要保留一列,这是我的唯一标识符,名称为complete_name
现在,cols_to_use
不包含complete_name
,因为它被标记为重复,我如何添加它?我尝试过:
cols_to_use.append(pd.Index(['complete_name']))
但是它什么也没做。有帮助吗?
答案 0 :(得分:3)
对我来说,它运作良好:
df1 = pd.DataFrame({'A':list('abcdef'),
'B':[4,5,4,5,5,4],
'C':[7,8,9,4,2,3],
'D':[1,3,5,7,1,0],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')})
cols_to_use = df1.columns.difference(['A','C'])
print (cols_to_use)
Index(['B', 'D', 'E', 'F'], dtype='object')
print (cols_to_use.append(pd.Index(['complete_name'])))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')
print (cols_to_use.union(['complete_name']))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')