在Python + Pandas中按列ID合并不同长度的数据集

时间:2019-06-11 11:33:20

标签: python-3.x pandas dataframe merge dataset

我在Python3 + Pandas中有2个数据集(df1和df2)有问题。 它们具有不同的len,它们的内部信息也不同,并且具有共同的列['MovieID'](但值的顺序不同)。

我想使用如下代码将其合并到数据集中:

  • 对于df2中的每个元素
    • 给我MovieID
    • 在df1中搜索此MovieID
    • 从df2中获取[list]图
    • 用df2中的列表[plot]替换df1的图值Nan

第一个类似:

df1:

MovieID    Title            Year    Genre       Plot
975900     ghosts of mars   2016    [list_a]    Nan
28463795   brun bitter      1987    [list_b]    Nan
261236     mary poppins     1964    [list_c]    Nan
...

和第二个:

df2:

MovieID    Plot
1548145    [list_1]
975900     [list_2]
1665944    [list_3]
...

0 个答案:

没有答案