我正在尝试比较2个不同数据框中的列并收到错误。我的目标是确定df1中的playerID是否与df2中的playerID匹配。也不确定它是否有所不同,但每个数据框中的数据长度不同。
以下是我的代码,其中包含数据框的示例:
cleaned_hof_df = hof_df[(hof_df.inducted == 'Y') & (hof_df.category == 'Player')]
cleaned_hof_df.reset_index(drop = True, inplace = True)
cleaned_hof_df.head(3)
cleaned_wins_losses_df = pitching_df[(pitching_df.W > 0) & (pitching_df.L > 0)]
cleaned_wins_losses_df.reset_index(drop = True, inplace = True)
cleaned_wins_losses_df.head(3)
cleaned_hof_df.playerID == cleaned_wins_losses_df.playerID
答案 0 :(得分:1)
您的数据框
cleaned_hot_df
和
cleaned_win_losses_df
有不同的行数,所以对应的系列
cleaned_hot_df.playerID
和
cleaned_win_losses_df.playerID
有不同的长度。
所以你的两个系列没有相同的标签(这是你得到的错误)。