有条件地填充一个pandas df的列,其值为不同的df

时间:2017-02-06 04:00:28

标签: python pandas dataframe

我有两个不同形状的df。一个包含单词频率,另一个包含单词及其 lemmas

第一个df总是将一个字映射到一个频率, 第二个df将许多单词映射到一个引理(多次)。 E.g:

DF1:

  word  frequency
    de   33504559
   que   32700217
    no   28263302
     a   21978600
    la   21249418

和df2:

     lemma       word
   zurullo   zurullos
  zurupeto  zurupetos
    zutano     zutana
    zutano    zutanas
    zutano    zutanos

我想通过搜索df1的每个单词,将其与df1中的单词进行比较,并从{{1}中提取引理信息,将引理信息添加到df2。将其添加回df2

when the value is always the same in df1有一些有用的答案,但由于我想对每个包含不同单词的每一行执行此操作,因此我不确定如何继续。 (我检查了the merging and concatenating docs section,但重新表现得比之前更加困惑......)

在just-python中我会使用循环,例如:

df1

很高兴使用pandas数据帧操作了解更多信息。

1 个答案:

答案 0 :(得分:1)

试试这个:

df1.merge(df2, how='left', on='word')