我有一个具有6列(A-F)和超过200K行的数据框。我想在B列(命名单词)中查找一个字符串,然后在另一列D(tf值)的同一行中找到其对应的值。
例如,我希望输出为:
Word:加密,tf:0.009041。
我宁愿不使用循环,但由于df较大,因此我愿意接受建议。 非常感谢您的宝贵时间。
答案 0 :(得分:0)
可能是我不明白这个问题,但这是您想要的吗?
library(dplyr)
tf <- yourdata %>%
filter(Word == 'encryption') %>%
select(tf)
这将创建一个仅包含tf列和Word值为“ encryption”的行的数据帧。如果您希望包含“类”或“ Word”列中一组单词中任何一个的行,可以执行以下操作:
library(dplyr)
wordset <- c('hockey','encryption')
tf <- yourdata %>%
filter(Class %in% wordset | Word %in% wordset) %>%
select(tf)