合并两个不同长度的数据帧(内连接)

时间:2018-05-04 05:24:06

标签: python pandas machine-learning etl

我试图通过使用内连接将两个不同长度的不同数据帧合并为一个单独的数据帧。以下是我的数据集说明。

threshold_shaped.shape[0] 
611
beer.shape[0]
1586614

数据集中都有beer_name作为列。 Beer_name在threshold_shape中是独一无二的,而在啤酒中并不是唯一的。 啤酒有两列" brewery_name"和" beer_name" 我的目标是基于beer_name将这两个数据帧合并在一起,并将值保存在threshold_shape中。也就是说,我希望有一个新列的611行" brewery_name"在新的数据框中创建。

我尝试了什么?

Main_dataframe=pd.merge(left=threshold_merged,right=beer,how="inner",on='beer_name')

Main_dataframe.shape[0]
592932

但我希望有611行,因为阈值数据帧只有611行。

请你帮忙实现同样的目标。

提前谢谢

0 个答案:

没有答案