我有一个pandas.DataFrame,其中包含以下列:['agent', 'agentid', 'agentname', 'agentaddress']
。
当我将此数据帧与另一个基数相同的数据帧合并时,它会在末尾添加一个具有相同名称的额外列。
>>> print(df1)
agent agentid agentname agentaddress
0 1 1001 test delhi
>>> print(df2)
agent agentid agentname agentaddress
0 2 1002 test1 vadodara
当我合并这两个数据帧时,会得到以下结果:
>>> print(pd.concat([df1, df2], sort=False))
agent agentid agentname agentaddress agentid
0 1 1001.0 test delhi NaN
0 2 NaN test1 vadodara 1002.0
答案 0 :(得分:1)
我创建了单独的csv文件,并尝试了此处所做的工作:效果很好,请检查列名是否在两个文件中都正确。
答案 1 :(得分:0)
尝试检查两个数据帧中整个列的dtype。有时,id可以是分类dtype
答案 2 :(得分:0)
df1和df2中的列名“ agentid”不同,因此可以得到此结果。请重新检查列名“ agentid”,确保它们是相同的字符串。