Question

我有两个要合并而又不重复的数据框：

首先，我仅从第二个数据帧中获得唯一的列（如this回答）：

cols_to_use = df2.columns.difference(df1)

我需要保留一列，这是我的唯一标识符，名称为complete_name

现在，cols_to_use不包含complete_name，因为它被标记为重复，我如何添加它？我尝试过：

cols_to_use.append(pd.Index(['complete_name']))

但是它什么也没做。有帮助吗？

Answer 1

对我来说，它运作良好：

df1 = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

cols_to_use = df1.columns.difference(['A','C'])
print (cols_to_use)
Index(['B', 'D', 'E', 'F'], dtype='object')

print (cols_to_use.append(pd.Index(['complete_name'])))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')

print (cols_to_use.union(['complete_name']))
Index(['B', 'D', 'E', 'F', 'complete_name'], dtype='object')

为熊猫索引添加值

1 个答案: