我有一个带有一列字符串的数据框,这是一个调查的问题正文,然后我有一个单独的数据框,其中那些问题正文与两个问题编号相匹配。我想遍历原始数据框的列,并检查该值是否与其他数据框内的值匹配,以及是否要将关联的问题编号存储在原始df的列中。我在解决这个问题时遇到了很多麻烦,我已经研究过使用apply()或类似的方法,但是我做不到。任何帮助将不胜感激。
答案 0 :(得分:0)
如果df是第一个数据帧,df2是第二个数据帧,而Q是问题字符串列的名称,则:
library (dplyr)
left_join(df1, df2, by=question_body) %>% select(-question_body)
当然,如果您提供了一些实际的数据结构示例,则为您提供准确的答案会更容易。