为什么不能将这两个数据框连接在一起?

时间:2019-08-18 18:30:38

标签: python pandas join merge concat

当我尝试合并两个数据框时,我一直遇到以下问题。它们是两种不同的类型(float64和object),但是对于两个数据帧中的每一个,我尝试加入的列都应具有相同的数据类型。

products_df.PROD_NBR
Out[13]: 
0        -7.358825e+10
1        -7.358821e+10
2        -7.204736e+10
3        -7.204735e+10
4        -7.204735e+10
              ...     
189047    9.940000e+22
189048    9.940000e+22
189049    9.950000e+22
189050    9.950000e+22
189051    9.950000e+22
Name: PROD_NBR, Length: 189052, dtype: float64

postransaction_df.PROD_NBR
Out[14]: 
0          1164203101
1         72047351000
2          3600025824
3          7205861079
4         82775501058
             ...     
915739     3660081331
915740    34580265065
915741    31101710042
915742     3927832300
915743    74098527503
Name: PROD_NBR, Length: 915744, dtype: object

当我尝试加入时:

pd.merge(postransaction_df, products_df, on='PROD_NBR')
...
ValueError: You are trying to merge on object and float64 columns. If you wish to proceed you should use pd.concat

products_df.PROD_NBR列出整个公司的所有产品编号。 postransaction_df.PROD_NBR与当时出售的商品有关。我不应该可以加入这些吗?

我完全被困住了。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

当两个表中的公共列具有不同的数据类型时会发生
您必须使用以下方法转换数据类型之一     BufferedReaderBufferedReader

然后

df.PROD_NBR.astype(int)