我有两个不同形状的df。一个包含单词和频率,另一个包含单词及其 lemmas 。
第一个df总是将一个字映射到一个频率, 第二个df将许多单词映射到一个引理(多次)。 E.g:
DF1:
word frequency
de 33504559
que 32700217
no 28263302
a 21978600
la 21249418
和df2:
lemma word
zurullo zurullos
zurupeto zurupetos
zutano zutana
zutano zutanas
zutano zutanos
我想通过搜索df1
的每个单词,将其与df1
中的单词进行比较,并从{{1}中提取引理信息,将引理信息添加到df2
。将其添加回df2
。
when the value is always the same in df1有一些有用的答案,但由于我想对每个包含不同单词的每一行执行此操作,因此我不确定如何继续。 (我检查了the merging and concatenating docs section,但重新表现得比之前更加困惑......)
在just-python中我会使用循环,例如:
df1
很高兴使用pandas数据帧操作了解更多信息。
答案 0 :(得分:1)
试试这个:
df1.merge(df2, how='left', on='word')